基于决策树与相异度的离群数据挖掘方法  被引量:1

Approach to Outliers Mining Based on Decision Tree and Dissimiliarity

在线阅读下载全文

作  者:陈雪娇[1] 任燕[1] 

机构地区:[1]南昌大学信息工程学院计算机科学与技术系,南昌330031

出  处:《微计算机信息》2009年第21期131-132,124,共3页Control & Automation

基  金:江西省教育厅基金项目(赣教技字[2005]42);江西省教改基金项目(赣教改字[2005]100)

摘  要:在数据挖掘中我们往往会忽略离群数据,可是这些数据却往往包含重要的信息。本文采用了将决策树与相异度相结合的方式进行离群数据的挖掘。通过计算决策树中各属性的信息增益,递归构造出决策树,并通过剪枝,进行初次的离群点检测,再运用相异度计算公式建立矩阵,找出最终的离群点集合。We always ignore the outlier in the course of data mining, but the outlier sometimes include the important information. The outlier mining is done by the way of joining the decision tree and dissimiliarity in the paper. The decision tree is recursively con- structed by computing the information gain of different attributes and the outlier is firstly detected by pruning, then establish matrices by the dissimiliarity, finding the outlier set.

关 键 词:离群数据 决策树 相异度 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象