距离修正的模糊C均值聚类算法  被引量:10

Improved fuzzy C-means clustering algorithm based on distance correction

在线阅读下载全文

作  者:楼晓俊[1] 李隽颖[1] 刘海涛[1,2] 

机构地区:[1]中国科学院上海微系统与信息技术研究所,上海200050 [2]无锡物联网产业研究院,江苏无锡214135

出  处:《计算机应用》2012年第3期646-648,共3页journal of Computer Applications

基  金:国家科技重大专项(2010ZX03006-004);国家973计划项目(2011CB302906)

摘  要:经典的模糊C均值算法基于欧氏距离,存在等划分趋势的缺陷,分错率较高,只适用于球形结构的聚类。针对这一问题,利用数据的点密度信息,在数据点与聚类中心的距离度量中引入了调节因子,提出了一种基于密度的距离修正矩阵,并用其代替经典模糊C均值算法中的距离度量矩阵。通过人造数据集和UCI数据集的两组聚类实验,证实了改进算法对非球形结构的数据同样适用,且相比经典的模糊C均值算法具有更高的聚类准确率。Based on Euclidean distance,the classic Fuzzy C-Means(FCM) clustering algorithm has the limitation of equal partition trend for data sets.And the clustering accuracy is lower when the distribution of data points is not spherical.To solve these problems,a distance correction factor based on dot density was introduced.Then a distance matrix with this factor was built for measuring the differences between data points.Finally,the new matrix was applied to modify the classic FCM algorithm.Two sets of experiments using artificial data and UCI data were operated,and the results show that the proposed algorithm is suitable for non-spherical data sets and outperforms the classic FCM algorithm in clustering accuracy.

关 键 词:聚类 模糊C均值 距离度量 点密度 调节因子 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] TP391.4[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象