区间值属性不完全信息下的数据挖掘  被引量:6

Data Mining in Incomplete Information

在线阅读下载全文

作  者:赵卫东[1] 盛昭瀚[1] 李旗号 

机构地区:东南大学 经济管理学院,[1] 合肥工业大学,[2],南京210018

出  处:《系统工程理论方法应用》2001年第2期136-139,149,共5页Systems Engineering Theory·Methodology·Applications

基  金:江苏省自然科学基金资助项目! (BS980 83 )

摘  要:不完全信息下的数据挖掘是一个困难的问题 ,但它在实际决策中是不可避免的。除空值和层次型概念外 ,区间值属性的处理是典型的不完全信息问题。本文基于粗集理论和扩张矩阵等理论 ,首先分析区间值属性的优选是 NP问题 ,然后提出了一种分割极小点区间值属性的启发式决策树生成算法 ,并构造了概率决策树和模糊决策树 ,以改进传统决策树数据挖掘方法的不足。Data mining in incomplete information systems is difficult but inevitable for uncertain decision. Besides null-valued and layered-valued attributes, interval-valued attributes are also attributed to incomplete information. Extension matrix and rough set theory are used herein to deal with the incompleteness. First the choice of interval-valued attributes is proved to be a NP-hard problem and a heuristic algorithm based on minimal partition dots is proposed. Then a probability tree and fuzzy tree are discussed in detail to improve the performance of previous decision tree algorithms e.g. ID3, C4.5, which are susceptible to noise.

关 键 词:不完全信息 区间值属性 粗集理论 模糊熵 数据挖掘 人工智能 数据库技术 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] TP311.132[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象