基于错误度量的模糊聚类有效性函数  被引量:1

A Fuzzy Cluster Validity Index Based on Clustering Mistake Measures

在线阅读下载全文

作  者:贲圣兰[1] 苏光大[1] 

机构地区:[1]清华大学电子工程系,北京100084

出  处:《模式识别与人工智能》2010年第1期11-16,共6页Pattern Recognition and Artificial Intelligence

基  金:国家"十一五"科技支撑计划资助项目(No.2006BAK08807)

摘  要:聚类的错误主要表现为两种形式:将原属不同类的数据分到同一个聚类和将原属同一类的数据分到不同聚类.文中提出类内不一致性和类间重叠度两个指标分别度量聚类中出现这两类错误的程度.一个好的模糊分割中包含的聚类错误应尽可能少.同时,聚类紧致度应尽可能大.基于这两个错误度量指标和紧致性度量,提出一种有效性函数来判断模糊聚类的有效性.实验结果表明,提出的有效性函数能有效判断最佳聚类数并且有较好的鲁棒性.The mistakes in fuzzy clustering can be categorized into two types: classifying data originated from different classes into one cluster and classifying data originated from the same class into different clusters. In this paper, intra-class non-consistency and inter-class overlapping are defined to measure the two kinds of mistakes respectively. A good fuzzy partition is expected to have few clustering mistakes and large compactness. Based on the two mistake measures and cluster compactness, a cluster validity index is proposed to evaluate the clustering results. Experimental results show the effectiveness and the robustness of the proposed validity index in determining optimal number of clusters.

关 键 词:模糊C均值聚类 有效性函数 类内不一致性 类间重叠度 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象