基于概要数据结构的高维数据流聚类算法  

High-dimensional Data Streams Clustering Algorithm Based on Synopsis Data Structure

在线阅读下载全文

作  者:王冬秀[1] 李辉[2] 

机构地区:[1]广西工学院财政经济系,广西柳州545006 [2]广西工学院计算机工程系,广西柳州545006

出  处:《广西工学院学报》2011年第4期59-64,共6页Journal of Guangxi University of Technology

基  金:广西工学院基金项目(院科自0977101)资助

摘  要:为了在高维数据流中有效地形成聚类,针对经典算法CELL-Tree存在的问题,提出一种新的概要数据结构PL-Tree以及基于此数据结构的算法PLStream,并采取衰减窗口模式来适应数据流的变化,采用剪枝策略控制内存中聚类模型的规模.实验表明,PLStream算法能较好地适应高维数据流,比CELL-Tree算法具有更好的时间和空间效率.To form clustering effectively in the high-dimension data streams, focusing on the questions in the classical algorithm CELL-Tree, a new synopsis data structure PL-Tree and the algorithm PLStreem based on it are put forward. And the damped window model is adopted to adjust to the changes of the data streams. The cluster model's scale of the internal storage is controlled by pruning methods. The research suggests that the PLStream algorithm can adjust to the high-dimensional data stream better and is superior to the CELL-Tree algorithm in better temporal and spatial efficiency.

关 键 词:概要数据结构 高维数据流 聚类 

分 类 号:TP312[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象