检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:巩固[1] 吕俊怀[1] 黄永青[1] 郝国生[1,2]
机构地区:[1]徐州师范大学计算机科学与技术学院,江苏徐州221116 [2]中国矿业大学信息与电气工程学院,江苏徐州221008
出 处:《计算机工程与设计》2009年第22期5197-5199,5203,共4页Computer Engineering and Design
基 金:江苏省高校自然科学基础研究基金项目(07KJD520216);徐州师范大学基金项目(08XLB14)
摘 要:处理连续属性离散化是决策树分类方法中C5.0算法在创建决策树时对数据表示空间的简化的一个重要问题,采用合理有效的连续属性离散化方法可以提高创建决策树的分类预测精度。在分析C5.0算法的离散化方法的不足之处后,提出一种改进Chi2算法的方法,能更合理更准确地对连续属性进行离散化,在此基础上创建的决策树具有更好的准确率。实验结果表明,基于改进方法的C5.0算法创建的决策树分类模型具有较高的分类准确率。How to discretize continuous attributes is an important problem that simplifies the representation of data set when building a decision tree based on C5.0 algorithm. Adopting a more effective and sound method of discretization can heighten the predictive accuracy of decision tree. To do this, improved method of Chi2 algorithm is presented after studying the C5.0 algorithm and Chi2 algorithm and analyzing their drawbacks of discretization, which discretizes the real value attributes exactly and reasonably while growing an accurate decision-tree. The experiment results show the validity of the proposed method.
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.112