基于k-均值的文本聚类算法及改进  

在线阅读下载全文

作  者:姜伦[1] 丁华福[1] 于飞[1] 

机构地区:[1]哈尔滨理工大学计算机学院,黑龙江哈尔滨150080

出  处:《中国科技博览》2009年第9期208-208,共1页China Science and Technology Review

摘  要:本文提出了k-means聚类算法中选取初始聚类中心及处理孤立点的新方法,改进了k-means算法对初始聚类中心和孤立点文本很敏感的不足之处,并将改进后的算法应用于中文文本聚类中。实验结果表明,改进的算法较原算法在准确率上有较大提高,并且具有更好的稳定性。

关 键 词:K-MEANS算法 文本聚类 中文文本 层次聚类 

分 类 号:TP274[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象