采用仿射传播的聚类集成算法  被引量:10

Cluster Ensemble Algorithm Using Affinity Propagation

在线阅读下载全文

作  者:王羡慧[1,3] 覃征[1,2] 张选平[1] 高洪江[4] 

机构地区:[1]西安交通大学电子与信息工程学院,西安710049 [2]清华大学计算机科学与技术系,北京100084 [3]新疆大学信息科学与工程学院,乌鲁木齐830046 [4]鲁东大学信息科学与工程学院,山东烟台264025

出  处:《西安交通大学学报》2011年第8期1-6,共6页Journal of Xi'an Jiaotong University

基  金:国家自然科学基金资助项目(60673024);高等学校博士学科点专项科研基金资助项目(20100201110063);国防“十一五”预研资助项目

摘  要:针对K均值聚类随机初始聚类中心导致的聚类结果不稳定问题,提出一种基于仿射传播的聚类集成算法.该算法把每个聚类集成的成员个体结果看成是原始数据的一个属性,然后在其基础上对聚类成员个体的聚类结果进行加权集成,集成算法采用简单高效的仿射传播聚类,并且提出了直接集成、利用平均规范化互信息(NMI)和聚类有效性Silhouette指标进行加权集成.最后,运用Hungarian算法对仿射传播聚类集成的结果进行类别标签的统一和匹配.在加州大学尔湾分校数据集上进行了实验,结果表明,与集成前的K均值聚类及其他聚类集成算法相比,该算法能有效地提高聚类结果的准确性、鲁棒性和稳定性,建立起来的聚类集成算法具有良好的扩展性和灵活性,而且简单有效.The result of K-means cluster is instable for random initial clustering centers. A cluster ensemble algorithm based on affinity propagation is proposed,where the result of each cluster individual is regarded as a property of the original data. Following the new properties sets, the results of each cluster individual are carried out to a weighted ensemble, and simple and efficient affinity propagation cluster is chosen in the ensemble algorithm. Furthermore the direct ensemble, the ensemble to weighted ensemble from average normalized mutual information (NMI) and cluster validation indexes Silhouette are uniformly proposed. Finally, Hungarian algorithm is employed to unify and match the category labels for the results of affinity propagation cluster. The results of experiments on University of California Irvine data sets show the higher efficiency for improving the accuracy, robustness and stability of cluster results than the K means clustering before combination and the other clustering ensemble algorithms. The clustering ensemble algorithm gets more extendable and flexible.

关 键 词:仿射传播 加权集成 K均值聚类 Hungarian算法 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象