一种基于密度的高性能增量聚类算法  被引量:12

An Efficient Incremental Algorithm for Clustering Based on Density

在线阅读下载全文

作  者:刘建晔[1] 李芳[1] 

机构地区:[1]上海交通大学计算机科学与工程系

出  处:《计算机工程》2006年第21期76-78,共3页Computer Engineering

摘  要:提出并证明了一种基于密度的高性能增量聚类算法,算法的主要工作包括:(1)利用分区和抽样技术对数据进行抽取和清理。(2)利用密度和网格技术对数据进行聚类。(3)改变阈值后提出一种增量算法,只对受影响的点重新计算聚类。(4)在动态环境下,数据增删后的增量聚类算法。实验证明,该算法能很好地处理高维数据,有效过滤噪声数据,大大节省聚类时间。An incremental algorithm of high efficiency for clustering based on density is presented. The main idea consists of following: (1) Sample data by using partition and sampling technology. (2) Clustering data based on density and grid. (3) In the case for threshold adjusting, it proposes an incremental algorithm to recalculate data atIectcd only. (4) After data insertion or deletion in dynamic environme,lt, ,naking use of incremental algorithm to re-cluster data. The experiments show that the new algorithm can efficiently process high dimensional data with noise and speed up mining greatly.

关 键 词:数据挖掘 聚类算法 密度 增量算法 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象