检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]贵州大学大数据与信息工程学院 [2]贵州大学网络与信息化管理中心
出 处:《微型电脑应用》2015年第6期63-65,共3页Microcomputer Applications
摘 要:决策树算法可以对数据集进行有效的训练学习和快速准确的分类,其中ID3算法是最早提出的一种决策树算法,但是,此算法只适用于处理取值较多属性的数据,不能处理连续数据,对噪声也比较敏感。C4.5算法是对ID3算法的优化,不仅可以对连续值属性进行处理,而且增加了对空值数据的处理功能。在研究和分析主流决策树算法基础上,针对二手汽车数据库在Weka数据挖掘平台进行了C4.5算法的设计与实现。实验结果表明该算法对预测数据集中的相应属性能进行较为准确的预测。Decision tree algorithm can do effective training and learning as well as fast accurate classification to dataset. ID3 algorithm is the earliest decision tree algorithm. But this algorithm can only be applied to handle more attribute data values, and continuous data can't be solved efficiently. It is also sensitive to noise. C4.5 algorithm is the optimization of ID3 algorithm. It can not only solve the continuous attribute values, but also increase the function of empty data. This paper mainly uses Weka data mining tools to do the design and realization of C4.5 algorithm, which is based on an example of Second-hand car database.This experiment indicates that those concentrated values can be predicted accurately by this algorithm.
分 类 号:TP302[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.142.144.163