不确定数据的最优k近邻和局部密度聚类算法  被引量:14

Optimal k-nearest neighbors and local density-based clustering algorithm for uncertain data

在线阅读下载全文

作  者:陆亿红[1] 夏聪[1] 

机构地区:[1]浙江工业大学计算机科学与技术学院,杭州310023

出  处:《控制与决策》2016年第3期541-546,共6页Control and Decision

基  金:水利部公益性行业科研专项基金项目(201401044)

摘  要:传统聚类算法一般针对的是确定数据,无法解决不确定数据的聚类问题;现有基于密度的不确定数据聚类算法存在参数敏感且计算率低的问题.对此,在引进新的不确定数据相异度函数、最优近邻、局部密度和互包含概念的基础上,提出解决不确定数据聚类问题的不确定数据的最优k近邻和局部密度聚类(OLUC)算法.该算法不仅能降低参数敏感性,提高计算效率,而且具有动态自适应优化k近邻,快速发现聚类中心和除噪优化的能力.实验结果表明,所提出的算法对无论是否存在噪声的不确定数据集都效果良好.Traditional clustering algorithms aim to certain data in general, which cannot solve the clustering problem for uncertain data. The existing density-based clustering algorithms for uncertain data have the problems that parameters are too sensitive and the computational efficiency is low. Therefore, an algorithm, named optimal k-nearest neighbors and local density-based clustering algorithm for uncertain data(OLUC), is proposed to solve the clustering problem for uncertain data by introducing concepts of new dissimilarity function for uncertain data, optimal k-nearest neighbors, local density and mutual inclusion relation. The algorithm not only can reduce the sensitivity of parameters and improve the computational efficiency, but also has the abilities of optimizing k-nearest neighbors in the dynamic adaptive way, deciding cluster center quickly and optimizing denoising. The experimental results show that the algorithm is effective on clustering for uncertain data whatever with noise or without noise, and achieves good results.

关 键 词:K近邻 局部密度 不确定数据 聚类算法 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象