基于密度的优化数据流聚类算法  被引量:3

Optimal algorithm of data streams clustering based on density

在线阅读下载全文

作  者:康晶[1] 马宏[1] 刘力雄[1] 

机构地区:[1]国家数字交换系统工程技术研究中心,河南郑州450002

出  处:《计算机工程与设计》2010年第22期4756-4759,共4页Computer Engineering and Design

基  金:国家863高技术研究发展计划基金项目(2008AA011001)

摘  要:为了解决数据流聚类算法中有效处理离群点这一关键问题,改进了基于密度的数据流聚类算法,在DenStream算法基础上提出了具有双检测时间策略DDTS(double detection time strategy)的基于密度的数据流聚类算法。该策略在数据流流速波动的情况下,结合时间与流数据数量两方面因素对微簇进行测试。通过在线动态维护和删减微簇,保存可能升级的离群点来改善聚类效果。实验结果表明,改进算法具有良好的适用性和有效性,能够取得较高的聚类质量。To deal with outliers of data streams, the density-based clustering algorithm of data streams DenStream is improved, and double detection time strategy (DDTS) is proposed. The strategy maintains and deletes clusters dynamically. In addition, with the purpose of high cluster quality and efficiency, potential outlier points are preserved by DDTS. Theory and practice show that the improved algorithm possesses good practicality and effectiveness and achieves a higher quality of clustering.

关 键 词:数据流 聚类 密度 双检测时间策略 数据挖掘 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象