可处理混合属性的任意形状聚类  被引量:2

Arbitrary shape clustering for mixed attributes dataset

在线阅读下载全文

作  者:苏晓珂[1,2] 兰洋[3] 程耀东[4] 万仁霞[1] 

机构地区:[1]东华大学信息科学与技术学院,上海201620 [2]郑州轻工业学院计算机与通信工程学院。郑州450002 [3]信阳师范学院计算机与信息技术学院,河南信阳464000 [4]中国科学院高能物理研究所计算中心,北京100049

出  处:《计算机工程与应用》2010年第34期136-139,共4页Computer Engineering and Applications

基  金:国家高技术研究发展计划(863)(No.2006AA01A120);河南省教育厅自然科学基础研究计划(No.2010A520033);郑州轻工业学院博士科研基金资助项目~~

摘  要:聚类是数据挖掘中一个非常活跃的研究分支,任意形状的聚类则是一个有待研究的开放问题。提出一种包含分类属性取值频率信息的类间差异性度量和一种对象与类的相似度定义,在此基础上提出一种能处理任意形状的聚类算法,可处理混合属性数据集。在人造数据集和真实数据集上检验了提出的算法,并与相关算法进行了对比,实验结果表明,提出的算法是有效可行的。Clustering is a very active research branch in data mining field.The research about the arbitrary shape clustering is an open problem.In this paper an inter-cluster dissimilarity measure taking into account the frequency information of the categorical attribute values is introduced.An arbitrary shape clustering algorithm is proposed by defining the similarity degree between an object and a cluster.It can be used for the mixed attributes dataset.The experimental results on the synthetic and real-life datasets show that the proposed algorithm is feasible and effective comparing to other classical algorithms.

关 键 词:任意形状聚类 混合属性 相似度 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象