基于Isomap的中文短信文本聚类算法  被引量:2

Chinese short messages text clustering algorithm based on Isomap

在线阅读下载全文

作  者:刘金岭[1] 

机构地区:[1]淮阴工学院,江苏淮安223001

出  处:《计算机工程与应用》2009年第34期144-146,共3页Computer Engineering and Applications

摘  要:给出的算法思想是首先计算出中文短信的相似度,再通过使用Isomap方法得到短信在语义空间中的嵌入情况,然后将短信在低维嵌入上进行聚类分析。该算法克服了短信的传统聚类分析在表示层次上遇到的困难,也克服了词频统计法不能将内容意思相似的短信聚集在一起的缺点,实验表明该算法是行之有效的。The calculating way proposed in this paper is to calculate the likeness degree of Chinese message and a message is gottcrn which embedded in the semantic space by using the Isomap method.This paper analyzes the messages according to the different clustering types in low-dimensional embedding.This algorithm has overcome difficulties in analyzing messages of traditional clustering types on different layers,and it has also overcome weakness of word frequency statistics which can not gather the similar meaning messages together.Experimental result indicates the algorithm is effective.

关 键 词:短信聚类 ISOMAP算法 语义空间 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象