有效改进C5.0算法的方法  被引量:6

Effective method of improving C5.0 algorithm

在线阅读下载全文

作  者:巩固[1] 吕俊怀[1] 黄永青[1] 郝国生[1,2] 

机构地区:[1]徐州师范大学计算机科学与技术学院,江苏徐州221116 [2]中国矿业大学信息与电气工程学院,江苏徐州221008

出  处:《计算机工程与设计》2009年第22期5197-5199,5203,共4页Computer Engineering and Design

基  金:江苏省高校自然科学基础研究基金项目(07KJD520216);徐州师范大学基金项目(08XLB14)

摘  要:处理连续属性离散化是决策树分类方法中C5.0算法在创建决策树时对数据表示空间的简化的一个重要问题,采用合理有效的连续属性离散化方法可以提高创建决策树的分类预测精度。在分析C5.0算法的离散化方法的不足之处后,提出一种改进Chi2算法的方法,能更合理更准确地对连续属性进行离散化,在此基础上创建的决策树具有更好的准确率。实验结果表明,基于改进方法的C5.0算法创建的决策树分类模型具有较高的分类准确率。How to discretize continuous attributes is an important problem that simplifies the representation of data set when building a decision tree based on C5.0 algorithm. Adopting a more effective and sound method of discretization can heighten the predictive accuracy of decision tree. To do this, improved method of Chi2 algorithm is presented after studying the C5.0 algorithm and Chi2 algorithm and analyzing their drawbacks of discretization, which discretizes the real value attributes exactly and reasonably while growing an accurate decision-tree. The experiment results show the validity of the proposed method.

关 键 词:决策树 离散化 CHI2算法 分类器 预测精度 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象