检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈羽 Chen Yu(College of Big Data and Statistics,Anhui University,Hefei,Anhui 230601,China)
机构地区:[1]安徽大学大数据与统计学院,安徽合肥230601
出 处:《伊犁师范大学学报(自然科学版)》2023年第1期56-65,共10页Journal of Yili Normal University:Natural Science Edition
摘 要:密度峰值聚类算法(DPC)具有准确率高、自动检测类别个数、识别中心点数目等优良性质.由于DPC算法用欧氏距离度量样本点之间的邻近关系,导致无法有效地提取高维复杂数据中的流形结构信息.针对密度峰值聚类算法的这个瑕疵,考虑到数据点之间的几何特性和流形结构,以测地距离替代欧氏距离,设计了一种改进的密度峰值聚类算法.数值模拟结果显示,改进的密度峰值聚类算法能够有效地处理具有流形分布特征的数据聚类问题.The density peak clustering algorithm(DPC)has excellent properties such as high accuracy,automatic detection of the number of categories,and identification of the number of center points.However,because the DPC algorithm measures the proximity between sample points with Euclidean distance,it is impossible to efficiently extract manifold structure information in high-dimensional complex data.Aiming at this flaw in the density peak clustering algorithm,an improved density peak clustering algorithm is designed to replace the Euclidean distance with the geodesic distance considering the geometric characteristics and manifold structure between the data points.The numerical simulation results show that the improved density peak clustering algorithm can effectively handle the data clustering problem with manifold distribution characteristics.
关 键 词:密度峰值聚类算法 测地距离 共享近邻 流形结构信息 高维聚类
分 类 号:O213[理学—概率论与数理统计]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.171