基于聚类融合的标题文本聚类方法  被引量:2

Title text clustering method based on clustering ensemble

在线阅读下载全文

作  者:杨威[1] 朱福喜[1] 

机构地区:[1]武汉大学计算机学院,武汉430072

出  处:《计算机工程与应用》2015年第15期129-133,共5页Computer Engineering and Applications

基  金:国家自然科学基金(No.61272277)

摘  要:针对标题文本聚类中的聚类结果不稳定问题,提出一种基于聚类融合的标题文本聚类方法。该方法对标题文本的特征词进行筛选,将标题文本转化为特征词集合;提出基于统计和语义的相似度计算方法,计算特征词集合间的相似度;引入基于共协矩阵的聚类融合算法,得出聚类结果。实验结果表明,和传统聚类算法相比,该方法提升了标题文本聚类的稳定性。For the title text clustering results instability problem, a title text clustering method based on clustering ensemble is proposed. It filters out the title texts' feature words, and transforms title texts into feature sets. It proposes a similarity calculation method based on statistical and semantic to calculate the similarity between feature sets. It introduces the clustering ensemble algorithm based on co-association matrix to get results. Experimental results show that, compared with the traditional clustering algorithm, this method improves the stability of results.

关 键 词:标题文本 聚类融合 聚类稳定性 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象