高维数据集离群子空间特性研究  被引量:2

Research on Subspace Characteristic of High Dimension Outlier Dataset

在线阅读下载全文

作  者:金义富[1] 朱庆生[1] 邹咸林[1] 

机构地区:[1]重庆大学计算机学院

出  处:《计算机工程与应用》2006年第9期147-149,共3页Computer Engineering and Applications

基  金:国家自然科学基金资助项目(编号:60403009);重庆市自然科学基金资助项目(编号:2005BB2224)

摘  要:探讨对挖掘出的离群数据集进行解释与分析的有效方法。以粗糙集理论的属性约简技术为基础,定义了属性离群贡献度等概念对高维数据集离群特性进行了量化描述,提出了离群划分与离群约简思想以及离群数据关键属性域子空间分析方法,给出了一种离群约简算法并分析了算法复杂性。实验表明,这种方法可以有效地揭示离群数据产生来源,有助于对整体数据集的更全面理解,且提出的算法对于问题规模具有较好的适应性。Some efficient methods of explaining and analyzing outliers is discussed in this paper.For describing outlying feature of high dimension dataset quantificationally,a concept of degree of outlying contribution is defined in the paper based on attribute reduction in the theory of rough set.With outlying partition and reduction and the analyzing method of the key attribute subspace of outliers are put forward,this paper presents an algorithm for outlying reduction and analyzes its complexity.Experimental results show that the approach can be used for identifying the origin of outliers a nd improve the understanding of whole data set and the proposed algorithm is scalable and efficient.

关 键 词:离群划分 关键域子空间 离群贡献度 离群约简 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象