检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机工程与科学》2016年第11期2342-2347,共6页Computer Engineering & Science
基 金:国家自然科学基金(61379057)
摘 要:ID3算法是目前最具有影响力的一种决策树构造算法,但仍然有许多的缺点,例如在多值属性偏向方面的问题、计算时间复杂度高、效率不高等问题。提出了一种基于斯皮尔曼等级相关系数的ID3决策树构造优化算法,利用相关系数克服了ID3算法在多值属性偏向方面的问题,在一定程度上提高了算法的分类准确率。利用相关数学知识对计算过程进行了化简,减少了ID3算法在log运算上的运行时间。最后通过实验验证了优化后的算法是可行的,且在准确率和运行速度方面都有更好的表现。The ID3 algorithm is the most influential algorithm in decision tree construction. However, it has some disadvantages, such as time-consuming, low efficiency and multi-value attribute bias problem. We propose an improved ID3 algorithm based on Spearman Rank, which optimizes the inadequacy of the attribute selection criterion. We overcome the main drawback of the ID3 algorithm, which is to select attributes of more value by using correlation coefficients, thus the accuracy of classification is improved. Meanwhile, we reduce the time spent on log calculation by using related mathematical theocuracy and efficiency are proved better than the ID3 algorithm. improved algorithm. Its accuracy and efficiency are proved better than the ID3 algorithm.
关 键 词:决策树 ID3算法 信息熵 斯皮尔曼等级 相关系数
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.40