基于相似孤立系数的孤立点检测算法  被引量:4

Outlier Detection Algorithm Based on Approximate Outlier Factor

在线阅读下载全文

作  者:谢岳山[1] 樊晓平[1] 廖志芳[2] 周国恩[2] 刘世杰[1] 

机构地区:[1]中南大学信息科学与工程学院,长沙410075 [2]中南大学软件学院,长沙410075

出  处:《计算机工程》2013年第11期200-204,共5页Computer Engineering

基  金:国家科技支撑计划基金资助项目(2012BAH08B01);湖南省自然科学基金资助项目(12JJ3074)

摘  要:基于聚类的孤立点检测算法得到的结果比较粗糙,不够准确。针对该问题,提出一种基于相似孤立系数的孤立点检测算法。定义相似距离以及相似孤立点系数,给出基于相似距离的剪枝策略,根据该策略缩小可疑孤立点候选集,并降低孤立点检测算法的计算复杂度。通过选用公共数据集Iris、Labor和Segment-test进行实验验证,结果表明,该算法在发现孤立点、缩小候选集等方面相比经典孤立点检测算法更有效。Aiming at the problem that the result of outlier detection algorithm based on clustering is coarser and not very accurate, this paper proposes an outlier detection algorithm based on Approximate Outlier Factor(AOF). This algorithm presents the definition of the similarity distance and outlier similarity coefficient, and provides a pruning strategy based on similarity distance to reduce the suspect candidate sets to decrease the computational complexity. Experiments are carried out with public datasets Iris, Labor and Segment-test, and results show that the performance of detecting outlier and reducing candidate set of this algorithm is effective compared with the classical outlier detection algorithm.

关 键 词:聚类孤立点 孤立点检测 相似孤立系数 剪枝策略 孤立点候选集 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象