检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院研究生院
出 处:《电子技术(上海)》2012年第6期1-4,共4页Electronic Technology
摘 要:决策树是数据挖掘分类算法中非常重要的一个算法分支。文章介绍了决策树算法中应用最广泛的典型算法-ID3和C4.5算法,并基于四个通用的数据集,针对这两个算法进行定量分析对比,研究两个算法的性能优劣。文章对C4.5算法中的连续属性离散化方法提出一些优化改进,并通过实际数据实验证实了优化的可行性。The Decision Tree Algorithm is a very important branch of the Classify Algorithms in Data Mining. This article introduces two typical Decision Tree Algorithms-ID3 and C4.5. It also quantitatively compares and analyzes ID3 with C4.5 based on 4 general data sets, summarizing the advantages and disadvantages of two algorithms. This article also proposes an improvement for the discretization method of the numeric attributes values in C4.5 algorithm and verifies the feasibility of the optimization through practical data experiment.
关 键 词:数据挖掘 分类算法 决策树 ID3算法 C4.5算法 离散化 边界原理
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222