检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:东南大学 经济管理学院,[1] 合肥工业大学,[2],南京210018
出 处:《系统工程理论方法应用》2001年第2期136-139,149,共5页Systems Engineering Theory·Methodology·Applications
基 金:江苏省自然科学基金资助项目! (BS980 83 )
摘 要:不完全信息下的数据挖掘是一个困难的问题 ,但它在实际决策中是不可避免的。除空值和层次型概念外 ,区间值属性的处理是典型的不完全信息问题。本文基于粗集理论和扩张矩阵等理论 ,首先分析区间值属性的优选是 NP问题 ,然后提出了一种分割极小点区间值属性的启发式决策树生成算法 ,并构造了概率决策树和模糊决策树 ,以改进传统决策树数据挖掘方法的不足。Data mining in incomplete information systems is difficult but inevitable for uncertain decision. Besides null-valued and layered-valued attributes, interval-valued attributes are also attributed to incomplete information. Extension matrix and rough set theory are used herein to deal with the incompleteness. First the choice of interval-valued attributes is proved to be a NP-hard problem and a heuristic algorithm based on minimal partition dots is proposed. Then a probability tree and fuzzy tree are discussed in detail to improve the performance of previous decision tree algorithms e.g. ID3, C4.5, which are susceptible to noise.
关 键 词:不完全信息 区间值属性 粗集理论 模糊熵 数据挖掘 人工智能 数据库技术
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] TP311.132[自动化与计算机技术—控制科学与工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.143