基于样本密度的全局优化K均值聚类算法  被引量:14

Global optimized K-means clustering algorithm based on sample density

在线阅读下载全文

作  者:薛印玺 许鸿文[1] 李羚 XUE Yinxi;XU Hongwen;LI Ling(Faculty of Mechanical & Electronic Information,China University of Geosciences,Wuhan,430074,Chin)

机构地区:[1]中国地质大学(武汉)机械与电子信息学院,武汉430074

出  处:《计算机工程与应用》2018年第14期143-147,共5页Computer Engineering and Applications

基  金:国家社会科学基金(No.14CSH036)

摘  要:针对传统K均值聚类算法中存在的聚类结果依赖于初始聚类中心及易陷入局部最优等问题,提出一种基于样本密度的全局优化K均值聚类算法(KMS-GOSD)。在迭代过程中,KMS-GOSD算法首先通过高斯模型得到所有聚类中心的预估计密度,然后将实际密度低于预估计密度最大的聚类中心进行偏移操作。通过优化聚类中心位置,KMS-GOSD算法不仅能提升全局探索能力,而且可以克服对聚类初始中心点的依赖性。采用标准的UCI数据集进行实验对比,发现改进后的算法相比传统的算法有较高的准确率和稳定性。Aiming at the problem of traditional K-means algorithm which is sensitive to initial clustering center and easy to fall into local optimum, this paper proposes a kind of global optimized K-means clustering algorithm based on sample density. In the iterative process, the KMS-GOSD algorithm obtains the pre-estimation density of the clustering center by Gaussian model, then the clustering center whose actual density is lower than the pre-estimated density at most will be dithered. The KMS-GOSD algorithm can not only overcome the dependence on the initial center of clustering, but also enhance the global exploration ability. It uses the standard UCI data sets as the contrast experiment objects, and finds that the improved algorithm has higher accuracy and stability compared with the traditional algorithm.

关 键 词:K均值 聚类中心 样本密度 全局优化 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象