基于隐喻词扩展的短文本聚类算法  被引量:2

Short-Text Clustering Algorithm Based on Extension of Metaphorical Words

在线阅读下载全文

作  者:王烨 左万利[1] 王英[1] WANG Ye;ZUO Wanli;WANG Ying(Symbol Computation and Knowledge Engineer of Ministry of Education,College of Computer Science and Technology,Jilin University,Changchun 130012,China)

机构地区:[1]吉林大学计算机科学与技术学院,符号计算与知识工程教育部重点实验室,长春130012

出  处:《吉林大学学报(理学版)》2018年第6期1447-1452,共6页Journal of Jilin University:Science Edition

基  金:国家自然科学基金(批准号:60973040);国家自然科学基金青年科学基金(批准号:61602057)。

摘  要:针对目前短文本词汇量少、表达形式多样,导致同种类文本聚类方法无效的问题,提出一种利用中文维基百科的丰富词汇间关系对短文本的隐喻词进行扩充的方法,以解决短文本包含信息少、词汇表达形式多样的不足.实验结果表明,该算法可有效提升短文本的聚类效果.Aiming at the problem that short text contained small words and various expressions,which led to ineffective clustering of the same category of text,we proposed a method to extend metaphorical words in short texts by using the rich lexical relationships in Chinese Wikipedia,which solved the shortages of the short text withless information and various lexical expressions.Experimental results show that the algorithm can effectivelyenhance the clustering effect of short text.

关 键 词:文本聚类 短文本 维基百科 文本扩展 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象