检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机工程与应用》2011年第34期137-140,共4页Computer Engineering and Applications
基 金:河南省教育厅自然科学项目(No.2008B520046);河南省政府决策项目(No.b580)
摘 要:针对微博文本的特点,提出了一种自动识别微博标引词的方法。根据微博文本中的名词或动词之间语义相似度构造图的邻接矩阵,在图的邻接矩阵基础上利用Pagerank算法思想来计算词语的重要度,选择重要度较大的一些词作为标引词。实验结果表明,较传统的自动标引方法,提出的自动标引方法简单实用、准确率较高。In view of the feature of MicroBlog text,this paper improves a method to automatic distinguish indexing words in MicroBlog.The adjacency matrix is constructed according to semantic similarity of nouns or verbs,the importance of words is computed according to theory of Pagerank based on adjacency matrix.Some more important word is considered to be indexing words.The experiments show that the method is easy and practical compared with traditional method.
关 键 词:微博 自动标引 邻接矩阵 PAGERANK算法 重要度
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249