一种基于区域划分的数据流子空间聚类方法  被引量:15

A Data Stream Subspace Clustering Algorithm Based on Region Partition

在线阅读下载全文

作  者:于翔[1] 印桂生[2] 许宪东[1] 王建伟[1] 

机构地区:[1]黑龙江工程学院计算机科学与技术学院,哈尔滨150050 [2]哈尔滨工程大学计算机科学与技术学院,哈尔滨150001

出  处:《计算机研究与发展》2014年第1期88-95,共8页Journal of Computer Research and Development

基  金:国家自然科学基金项目(61272186);黑龙江省教育厅科学技术项目(12531542)

摘  要:数据流子空间聚类的主要目的是在合理的时间段内准确找到数据流特征子空间中的聚类.现有的数据流子空间聚类算法受参数影响较大,通常要求预先给出聚类数目或特征子空间,且聚类结果不能及时反映数据流的变化情况.针对以上缺陷,提出一种新的数据流子空间聚类算法SC-RP,SC-RP无需预先给出聚类数目或特征子空间,对孤立点不敏感,可实现快速聚类,通过区域树结构记录数据流的变化并及时更新统计信息,进而根据数据流的变化调整聚类结果.通过在真实数据集与仿真数据集上的实验,证明了SC-RP在聚类精度和速度上优于现有的数据流子空间聚类算法,且对聚类数目及数据维度均具有良好的伸缩性.The main aim of data stream subspace clustering is to find clusters in subspace in rational time accurately. The existing data stream subspace clustering algorithms are greatly influenced by parameters. Generally, the number of clusters or feature subspace need predefining, and the clustering result can't describe the changes of data stream accurately. Further, they cannot describe the changes of clusters accurately and the clustering result will be influenced. Due to the flaws mentioned above, we propose a new data stream subspace clustering algorithm, SC-RP, in which the number of clusters or the feature subspace need not predefining. SC-RP has the advantages of fast clustering and being insensitive to outliers. When data stream changes, the changes will be recorded by the data structure named Region-tree, and the corresponding statistics information will be updated. Further SC-RP can regulate clustering results in time. According to the experiments on real datasets and synthetic datasets, SC-RP is superior to the existing data stream suhspace clustering algorithms on both clustering precision and clustering speed, and it has good scalability to the number of clusters and dimensions.

关 键 词:数据挖掘 数据流 子空间聚类 特征选择 维度约简 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象