检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]西北工业大学自动化学院
出 处:《计算机应用研究》2010年第9期3316-3318,共3页Application Research of Computers
基 金:国家自然科学基金资助项目(10702065);陕西省自然科学基金资助项目(2005F45)
摘 要:为了满足大规模数据集快速离群点检测的需要,提出了一种基于分化距离的离群点检测算法,该算法综合考虑了数据对象周围的密度及数据对象间的距离等因素对离群点的影响,通过比较每一对象与其他对象的分化距离来计算其周围的友邻点密度,挖掘出数据集中隐含的离群点。实验表明,该算法能有效地识别离群点,同时能反映出数据对象在数据集中的孤立程度。算法的复杂度较低,适用于大规模数据集快速离群点检测。In order to meet the need of rapid outlier detection for large-scale data sets,this paper proposerd a differentiation distance-based outlier detection algorithm( DODA) ,which took into account the factors that affected outlier,such as the density of the surrounding data objects and the distance between the objects. By comparing differentiation distance of the each object and other objects to calculate the density of its surrounding neighboring points to discover the hidden outliers data set. Experimental results show that: the algorithm can effectively identify outliers,at the same time,data objects reflect the isolation level in the data set. The algorithm’s complexity is low,it is suitable for quickly outlier detection of large data sets.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3