检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《现代计算机(中旬刊)》2015年第6期62-67,共6页Modern Computer
基 金:国家自然科学基金项目(No.61202022);上海海事大学科研项目
摘 要:针对基于密度的孤立点检测算法LOF时间复杂度高的问题,通过优化数据对象邻域查询过程,提出一种两阶段的改进算法DBLOF,先采用DBSCAN聚类算法对数据集进行预处理,去除大部分的非孤立点,得到可能异常数据集,然后再利用LOF算法计算可能异常数据集中对象的局部异常因子并以此找出真正的孤立点。实验结果表明,改进算法能实现有效的局部孤立点检测,并能够降低算法时间复杂度。For the high time complexity of the density-based outlier detecting algorithm(LOF algorithms), proposes an improved algorithm DBLOF with two-stage by optimizing the neighborhood query operation of adjacent objects for each data object. Firstly, clustering algorithm DBSCAN is taken to preprocess the dataset and remove the most of the non-outliers data objects to get the dataset of all possible outliers.Then, the local outlier factors are calculated on the possible outliers dataset for each data object to find out the real outliers. The experiments demonstrate that the proposed algorithm can realize the effective local outlier detection and reduce the time complexity of the algo-rithm.
关 键 词:孤立点检测 LOF DBSCAN 聚类 数据挖掘
分 类 号:TP311.6[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15