检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]金陵科技学院信息技术学院,南京211169 [2]平顶山学院计算机科学与技术学院,河南平顶山467000 [3]湖南大学信息科学与工程学院,长沙410082
出 处:《计算机应用研究》2012年第4期1307-1310,共4页Application Research of Computers
基 金:金陵科技学院博士启动基金资助项目(JIT-B-01);金陵科技学院自然科学基金资助项目(208.40410826)
摘 要:提出一种连续属性值域划分的离散化新方法,该方法定义一个新的离散化函数,依据类与属性之间的相互依赖关系选择最优的离散区间列表;此外,采用变精度粗糙集理论合理地控制数据离散化产生的信息丢失,减少分类错误。仿真结果和统计分析表明,提出的方法有较好的C5.0决策树分类能力。This paper presented a novel heuristic method for value domain partition of continuous attributes.This approach defined a novel discretization function which could find optimal interval lists by means of interdependence between classes.In addition,it reasonably controlled information loss generated by discretization,so that decreased classification error.Empirical experiments and statistical analysis show that the appraoch can generate a better discretization scheme which significantly improves classification ability on C5.0 decision tree.
关 键 词:离散化 数据挖掘 相互依赖 变精度粗糙集 决策树
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.70