基于密度的异常数据检测算法GSWCLOF  被引量:23

GSWCLOF:density-based outlier detection algorithm on data stream

在线阅读下载全文

作  者:李少波[1,2] 孟伟[1] 璩晶磊[1] LI Shaobo;MENG Wei;QU Jinglei(Chengdu Institute of Computer Application, Chinese Academy of Sciences, Chengdu 610041, China;School of Mechanical Engineering, Guizhou University, Guiyang 550025, China)

机构地区:[1]中国科学院成都计算机应用研究所,成都610041 [2]贵州大学机械工程学院,贵阳550025

出  处:《计算机工程与应用》2016年第19期7-11,共5页Computer Engineering and Applications

基  金:国家科技支撑计划(No.2012BAF12B14);贵州省重大科技专项基金(No.[2014]2001)

摘  要:为改善有关数据流的异常数据检测方法中存在的检测准确度低和执行效率低等问题,根据数据挖掘技术理论,提出了一种新的基于密度的异常数据检测算法GSWCLOF。该算法引入滑动时间窗口和网格的理念,在滑动时间窗口内利用网格将数据细分,同时利用信息熵对所有网格内的数据进行剪枝和筛选,从而剔除绝大部分正常的数据,最后再利用离群因子对剩下的数据进行最终判断。实验结果表明,该算法有效地提高了检测准确度和执行效率。To improve the inaccuracy and execution efficiency of outlier detection on data stream, a novel density-basedoutlier detection algorithm named GSWCLOF is proposed. By introducing the concepts of sliding time window and grid,the algorithm cuts a data stream into subsections of data; then after a pruning and filtering process by information entropy,the outliers in left data can be easily identified by local outlier factors. The experimental results finally show the advantagesof this new algorithm in accuracy rating and execution efficiency.

关 键 词:数据流检测 滑动窗口 网格 信息熵 离群因子 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象