检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]武汉大学资源与环境科学学院,湖北武汉430079 [2]湖北省鄂东地质大队,湖北孝感432000
出 处:《测绘工程》2015年第5期42-46,共5页Engineering of Surveying and Mapping
基 金:国家863计划资助项目(2012AA12A402);国家自然科学基金资助项目(41071289;41171350)
摘 要:由于传统的K-均值聚类算法固有的特性,如对初始聚类中心的依赖性和对噪声点的敏感性,导致了其聚类结果的不稳定。文中基于k-dist图提出一种改进算法,算法首先去除数据集中的噪声点,然后从数据集中选取靠近点聚集区域、相距最远的k′个数据点作为初始簇中心。实验结果证明,文中算法能够很好地消除K-均值聚类算法对初始簇中心的依赖性,并能有效去除噪声点。Because of the inherent characteristics of the traditional K‐means algorithm ,such as the dependence of the initial clustering center and the sensitivity to noise points ,it is easy to generate the instable clustering results .An improved algorithm is proposed based on the k‐dist graph .The algorithm first removes the noise points of the data set ,and then selects k′initial center ,w hich is close to the point gathering area and far away from each other .The experimental results show that the algorithm can eliminate its dependence of the initial center as well as removing the noise points effectively .
关 键 词:数据挖掘 K-均值聚类 第4邻近距离图 初始簇中心 噪声点
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229