基于层次聚类的孤立点检测方法  被引量:4

Outlier detection method based on hierarchical clustering

在线阅读下载全文

作  者:梁斌梅[1] 

机构地区:[1]广西大学数学与信息科学学院,南宁530004

出  处:《计算机工程与应用》2009年第32期117-119,共3页Computer Engineering and Applications

基  金:广西教育厅科研项目No.[2006]0267~~

摘  要:孤立点检测是数据挖掘过程的重要环节,提出了基于层次聚类的孤立点检测(ODHC)方法。ODHC方法基于层次聚类结果进行分析,对距离矩阵按簇间距离从大到小检测孤立点,可检测出指定离群程度的孤立点,直到达到用户对数据的集中性要求。该方法适用于多维数据集,且算法原理直观,用户友好,对孤立点的检测准确率较高。在iris、balloon等数据集上的仿真实验结果表明,ODHC方法能有效地识别孤立点,是一种简单实用的孤立点检测方法。Outlier detection is an important step of data mining,a new Outlier Detection method based on Hierarchical Clustering (ODHC) is proposed.ODHC method takes an analysis based on the results of hierarchical clustering,and detects outliers by the distance matrix in decending order of distance between clusters.Outlier in the specified degree of isolation can be detected,until it meets the user's requirement of data-intensive.This method is applicable to multi-dimensional data sets,and the algorithm is principle-intuitive,user-friendly,and high accuracy in outlier detection.Experimental results on iris and balloon data sets show that ODHC method can effectively identify the outliers,and is a simple and applicable method of outliers detection.

关 键 词:孤立点检测 层次聚类 数据预处理 数据挖掘 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象