检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]西北工业大学计算机学院,陕西西安710129 [2]西北工业大学理学院,陕西西安710129
出 处:《计算机与现代化》2015年第3期26-32,共7页Computer and Modernization
基 金:西北工业大学基础研究基金资助项目(JC201273)
摘 要:目前,大部分离群点检测算法需要人工输入参数,不能同时检测出全局和局部离群点,不能有效处理密度不均匀数据。针对这些问题,提出一种基于密度划分的离群点检测算法DD-DBSCAN。主要创新包括:1)运用最小生成树的方法,新定义簇密度概念,将数据录入后划分成密度不等的簇,使算法能够处理密度分布不均匀的数据;2)采用"分而治之"的思想,对经过划分的数据集分别进行离群点检测,使得算法能够同时处理全局和局部离群点;3)通过在各个簇中自适应地计算所需参数值,算法不再需要人工输入参数(聚类半径(Eps)等)。通过在2D模拟数据集和Iris真实数据集上的实验表明,与DBSCAN算法比较,本文算法具有更高的覆盖率和正确率。Most existing outliers detection algorithms need to input parameters manually,can't detect the global and local outliers at the same time,and can't deal with such problems as uneven density data effectively. This paper proposed an outliers detection algorithm DD-DBSCAN based on density division. The main innovation includes: 1) Define a new concept of Cluster Density according to the method of Minimum Spanning Tree,the entered data is divided into many clusters of different density. It can handle the data of uneven distribution density; 2) Adopting the idea of"divide and rule",detect outliers from the division data respectively,make the algorithm be able to deal with the global and local outliers at the same time; 3) It can calculate the parameter value for each cluster automatically,makes the algorithm needs no longer human input parameters( Clustering Radius( Eps)Etc). Experiments on 2D simulated data sets and Iris real data sets,compared with DBSCAN algorithm,the results show that the proposed algorithm has higher precision and accuracy.
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.31