决策树算法在Weka平台上的数据挖掘应用  被引量:10

Data Mining Application in Weka Platform Based on Decision Tree Classification

在线阅读下载全文

作  者:程斐斐[1] 王子牛[2] 侯立铎 

机构地区:[1]贵州大学大数据与信息工程学院 [2]贵州大学网络与信息化管理中心

出  处:《微型电脑应用》2015年第6期63-65,共3页Microcomputer Applications

摘  要:决策树算法可以对数据集进行有效的训练学习和快速准确的分类,其中ID3算法是最早提出的一种决策树算法,但是,此算法只适用于处理取值较多属性的数据,不能处理连续数据,对噪声也比较敏感。C4.5算法是对ID3算法的优化,不仅可以对连续值属性进行处理,而且增加了对空值数据的处理功能。在研究和分析主流决策树算法基础上,针对二手汽车数据库在Weka数据挖掘平台进行了C4.5算法的设计与实现。实验结果表明该算法对预测数据集中的相应属性能进行较为准确的预测。Decision tree algorithm can do effective training and learning as well as fast accurate classification to dataset. ID3 algorithm is the earliest decision tree algorithm. But this algorithm can only be applied to handle more attribute data values, and continuous data can't be solved efficiently. It is also sensitive to noise. C4.5 algorithm is the optimization of ID3 algorithm. It can not only solve the continuous attribute values, but also increase the function of empty data. This paper mainly uses Weka data mining tools to do the design and realization of C4.5 algorithm, which is based on an example of Second-hand car database.This experiment indicates that those concentrated values can be predicted accurately by this algorithm.

关 键 词:决策树算法 ID3 C4.5 WEKA 

分 类 号:TP302[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象