检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:江峰[1] 杜军威[1] 葛艳[1] 眭跃飞[2] 曹存根[2]
机构地区:[1]青岛科技大学信息科学技术学院,山东青岛266061 [2]中国科学院计算技术研究所,北京100080
出 处:《电子学报》2011年第2期345-350,共6页Acta Electronica Sinica
基 金:国家自然科学基金(No.60802042);国家863高技术研究发展计划(No.2007AA01Z325);山东省自然科学基金(No.ZR2009GQ013)
摘 要:作为数据挖掘的一项重要任务,离群点检测已经引起人们的广泛关注.本文基于粗糙集理论来讨论离群点的定义与检测问题,提出了一种新的离群点定义——粗糙序列离群点以及相应的离群点检测算法RSOD.该算法利用粗糙集理论中的知识熵和属性重要性等概念来构建三种类型的序列,并通过分析序列中元素的变化情况来检测离群点.在UCI标准数据集上,将RSOD算法与现有的离群点检测算法进行了比较分析,实验结果表明,我们所提出的离群点检测方法是有效的.As an important task of data mining,outlier detection has attracted much attention.We discuss the issues of outlier definition and detection based on rough set theory.We propose a new definition for outlier-rough sequence outlier,and the corresponding outlier detection algorithm RSOD.The algorithm constructs three kinds of sequences exploiting the notions of knowledge entropy and significance of attribute in rough sets,and detects outliers by analyzing changes of the elements in the sequences.We compare algorithm RSOD with the current outlier detection algorithms on UCI data sets.And experimental results show that our method is effective for outlier detection.
关 键 词:离群点检测 粗糙集 数据挖掘 序列 知识熵 属性重要性
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222