检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]广西师范学院师园学院,广西南宁530226 [2]广西师范学院计算机与信息工程学院,广西南宁530023 [3]南宁市城市应急联动中心,广西南宁530022
出 处:《广西师范大学学报(自然科学版)》2010年第3期113-117,共5页Journal of Guangxi Normal University:Natural Science Edition
基 金:国家自然科学基金资助项目(60763012);广西自然科学基金资助项目(桂科自0731028);广西高等学校优秀人才资助计划项目(RC2007022);广西研究生教育创新计划项目(2008106030774M04)
摘 要:分类是数据挖掘的一个重要研究方向,使用决策树进行分类是一种常用而且高效的分类方法。目前传统的算法有ID 3、C 4.5、CART等,这些算法都有如下的局限性:必须人工输入归类集合,划分属性,确定最优的分类集合。为了解决这些问题,本文做了如下工作:①提出信息增益排列GEP染色体头部的思想;②给出基于信息增益的GEP构造决策树属性约简算法(IG-GEPDTAR)并用实验进行验证;③实验表明该算法构造的决策树在具有100%准确性的同时,比使用GEP算法构造的决策树减少了冗余分支,其节点数比传统的ID 3算法和P ID算法构造的决策树的节点数分别减少了82.9%和31.2%。Classification is an important sector of Data Mining,and decision tree is one of the efficient classification methods used constantly. Nowadays,there are several classification algorithms which use decision tree ,for instance ID3,C4.5 and CART. But there are some disadvantages to use them,for example ,class set must be input manually ,attribute must be separated and the best class set is needed. This paper makes the following contributions to avoid these disadvantages.on the one hand,proposing a new concept of using information gain to line GEP chromosome's head ;on the other hand,proposing the algorithms of IG-GEPDTAR (constructing decision tree attribution reduction algorithms with gene expression programming based on information gain) and validate it by using experiment data. The result shows that decision tree constructed by IG-GEPDTAR is absolutely correct and better,it has less redundancies than Candida Ferreira's,has 82. 9% less nodes than that of ID3 algorithms,and has 31.2% less nodes than that of Wang Chunnian's.
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49