结合K均值和非负矩阵分解集成文本聚类算法被引量：12

Integrating K-means and non-negative matrix factorization to ensemble document clustering

机构地区：[1]盐城工学院信息工程学院,江苏盐城224051 [2]哈尔滨工程大学模式识别与自然计算研究室,哈尔滨150001

出　　处：《吉林大学学报（工学版）》2011年第4期1077-1082,共6页Journal of Jilin University:Engineering and Technology Edition

基　　金：国家自然科学基金项目(60603092;60975042);高等学校博士学科点专项科研基金项目(20070217043);盐城工学院人才引进专项基金项目(XKR2011019)

摘　　要：将非负矩阵分解(NMF)引入到文本聚类集成问题中,为解决NMF随机初始化所引起的不稳定性问题,首先采用最小最大原则确定K均值算法的初始质心,并获得稳定的聚类结果;其次,将K均值算法的聚类结果作为NMF的初始因子矩阵,并对超图的邻接矩阵进行NMF,获得基矩阵和系数矩阵;最后根据系数矩阵获得最终的聚类结果,由此设计了NMFK算法。在多组真实文本集上进行了实验,结果表明:NMFK算法运行高效,并且获得了比其他常见的聚类集成算法更加优越的结果。Non-negative Matrix Factorization（NMF） is brought forth into document cluster ensemble problem.In order to get a stable result,K-means algorithm using minimum and maximum principle is performed.Then the result of K-means is provided to NMF algorithm as the initial factor matrix.NMF is further performed on adjacent matrix of hypergraph to attain the basis matrix and efficient matrix.The final clustering result is obtained according to the coefficient matrix.Whereupon,a NMFK algorithm is proposed and tested on real-world document sets.Results show that NMFK outperforms other cluster ensemble techniques and is very efficient.

关键词：计算机应用聚类分析文本聚类集成非负矩阵分解 K均值

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

结合K均值和非负矩阵分解集成文本聚类算法被引量：12

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

结合K均值和非负矩阵分解集成文本聚类算法 被引量：12

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

结合K均值和非负矩阵分解集成文本聚类算法被引量：12