聚类集成研究综述  

Survey of Clustering Ensemble Research

在线阅读下载全文

作  者:邵超 润清晨 SHAO Chao;RUN Qingchen(School of Computer and Information Engineering,Henan University of Economics and Law,Zhengzhou 450046,China)

机构地区:[1]河南财经政法大学计算机与信息工程学院,郑州450046

出  处:《计算机工程与应用》2024年第7期41-57,共17页Computer Engineering and Applications

基  金:国家自然科学基金(61202285);河南省科技攻关项目(232102210198,222102210289)。

摘  要:聚类分析作为数据研究领域的基本技术,旨在从无标签数据集中发现有意义的簇结构。由Kleinberg定理可知不存在能够学习任何数据集的基本聚类算法,即没有一种聚类方法能够正确地找到所有数据集的簇结构。聚类集成解决了这一固有挑战,通过组合多个聚类结果来探索高稳定性和鲁棒性的最终聚类。近些年来,提出了许多聚类集成技术,产生了解决实际问题的新方法以及新应用领域。从基聚类生成机制和共识函数设计两个维度对聚类集成技术进行了综述,分析了各种方法的优缺点并进行实验比较。最后针对当前的研究现状,讨论了未来的研究方向。As a basic technology in the field of data research,cluster analysis aims to discover meaningful cluster structure from unlabeled datasets.According to Kleinberg's theorem,there is no basic clustering algorithm that can learn any dataset,which means that no clustering method can correctly find the cluster structure of all datasets.Clustering ensemble addresses this inherent challenges by combining multiple clustering results to explore the final clustering with high stability and robustness.In recent years,many clustering ensemble techniques have been proposed,resulting in new ways to solve practical problem together with new application areas of these techniques.Clustering ensemble techniques are summarized from the two dimensions of basic clustering generation mechanism and consensus function design,the advantages and disadvantages of various methods are analyzed,and experimental comparisons are made.Finally,the future research directions are discussed based on the current research status.

关 键 词:聚类集成 基聚类 共识函数 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象