基于随机投影的并行数据流聚类方法  被引量:3

Random Projection Based Clustering Method of Parallel Data Streams

在线阅读下载全文

作  者:陈华辉[1,2] 施伯乐[1] 

机构地区:[1]复旦大学计算机与信息技术系,上海200433 [2]宁波大学信息科学与工程学院,宁波315211

出  处:《模式识别与人工智能》2009年第1期113-122,共10页Pattern Recognition and Artificial Intelligence

基  金:国家自然科学基金项目(No.60773072);浙江省自然科学基金项目(No.Y104144);浙江省教育厅项目(No.20051737)资助

摘  要:利用数据流的遗忘特性,应用随机投影,分层、动态地维护每个数据流的概要结构.基于该概要结构,快速计算数据流和聚类中心之间的近似距离,实现一种适合并行多数据流的K-means聚类方法.所进行的实验验证该方法的有效性.A synopsis is maintained dynamically for each data stream. The construction of the synopsis is based on random projections and it utilizes the amnesic feature of data stream. Using the synopsis, the approximate distances between streams and the cluster center can be computed fast. And an efficient online version of the classical K-means clustering algorithm is developed. The experimental results showy the method can be performed effectively with a good clustering quality.

关 键 词:概要结构 遗忘特性 随机投影 数据流 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象