检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:梁斌梅[1]
机构地区:[1]广西大学数学与信息科学学院,南宁530004
出 处:《计算机工程与应用》2009年第32期117-119,共3页Computer Engineering and Applications
基 金:广西教育厅科研项目No.[2006]0267~~
摘 要:孤立点检测是数据挖掘过程的重要环节,提出了基于层次聚类的孤立点检测(ODHC)方法。ODHC方法基于层次聚类结果进行分析,对距离矩阵按簇间距离从大到小检测孤立点,可检测出指定离群程度的孤立点,直到达到用户对数据的集中性要求。该方法适用于多维数据集,且算法原理直观,用户友好,对孤立点的检测准确率较高。在iris、balloon等数据集上的仿真实验结果表明,ODHC方法能有效地识别孤立点,是一种简单实用的孤立点检测方法。Outlier detection is an important step of data mining,a new Outlier Detection method based on Hierarchical Clustering (ODHC) is proposed.ODHC method takes an analysis based on the results of hierarchical clustering,and detects outliers by the distance matrix in decending order of distance between clusters.Outlier in the specified degree of isolation can be detected,until it meets the user's requirement of data-intensive.This method is applicable to multi-dimensional data sets,and the algorithm is principle-intuitive,user-friendly,and high accuracy in outlier detection.Experimental results on iris and balloon data sets show that ODHC method can effectively identify the outliers,and is a simple and applicable method of outliers detection.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15