密度敏感的数据竞争聚类算法  被引量:2

Density-sensitive clustering by data competition algorithm

在线阅读下载全文

作  者:苏辉[1,2] 葛洪伟[1,2] 张欢庆[1] 袁运浩[1] 

机构地区:[1]江南大学物联网工程学院,江苏无锡214122 [2]轻工过程先进控制教育部重点实验室(江南大学),江苏无锡214122

出  处:《计算机应用》2015年第2期444-447,共4页journal of Computer Applications

基  金:国家自然科学基金资助项目(61402203;61305017);江苏省普通高校研究生科研创新计划项目(KYLX_1122);江苏高校优势学科建设工程资助项目

摘  要:针对数据竞争聚类算法在处理复杂结构数据集时聚类性能不佳的问题,提出了一种密度敏感的数据竞争聚类算法。首先,在密度敏感距离测度的基础上定义了局部距离,以描述数据分布的局部一致性;其次,在局部距离的基础上计算出数据间的全局距离,用来描述数据分布的全局一致性,挖掘数据的空间分布信息,以弥补欧氏距离描述数据分布全局一致性能力不佳的缺陷;最后,将全局距离用于数据竞争聚类算法中。将新算法与基于欧氏距离的数据竞争聚类算法进行性能比较,在人工数据集和真实数据集上的实验结果表明,该算法克服了数据竞争聚类算法难以处理复杂结构数据的缺点,聚类结果具有更高的准确率。Since the clustering by data competition algorithm has poor performance on complex datasets, a density- sensitive clustering by data competition algorithm was proposed. Firstly, the local distance was defined based on density- sensitive distance measure to describe the local consistency of data distribution. Secondly, the global distance was calculated based on local distance to describe the global consistency of data distribution and dig the information of data space distribution, which can make up for the defect of Euclidean distance on describing the global consistency of data distribution. Finally, the global distance was used in clustering by data competition algorithm. Using synthetic and real life datasets, the comparison experiments were conducted on the proposed algorithm and the original clustering by data competition based on Euclidean distance. The simulation results show that the proposed algorithm can obtain better performance in clustering accuracy rate and overcome the defect that clustering by data competition algorithm is difficult to handle complex datasets.

关 键 词:聚类 数据竞争 密度敏感 距离测度 聚合场 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论] TP181[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象