检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]天津大学管理学院
出 处:《计算机应用》2005年第5期989-991,共3页journal of Computer Applications
基 金:天津市教委高校科技发展基金资助项目(020714)
摘 要:噪音数据是影响决策树训练效率和结果集质量的重要因素。目前的树剪枝方法不能消除噪音数据对选择决策树测试节点属性的影响。为改变这种状况,基于变精度Rough集(VPRS)模型,提出了一个在决策树算法中处理噪音数据的新方法———预剪枝法,该方法在进行选择属性的计算之前基于变精度正区域求取属性修正的分类模式,来消除噪音数据的对选择属性以及生成叶节点的影响。利用该方法对基本ID3决策树算法进行了改进。分析和实验表明,与先剪枝方法相比,该方法能进一步减小决策树的规模和训练时间。Noise data is the main factor affecting the training efficiency and quality of decision tree. Present pruning methods can't eliminate the effect of noise data on choosing test attribute of tree node. In order to solve the problem, a new method of processing noise data — predictive pruning method was presented based on Variable Precision Rough Set (VPRS)model, which eliminated the influence of noise data using variable precision positive area before the calculation of choosing the test attribute of tree node. By using the method to improve the ID3 algorithm, experiments show that the algorithm generates smaller decision tree and uses less training time than the algorithm using pre-pruning method.
关 键 词:决策树 数据噪音 变精度Rough集(VPRS) 预剪枝
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.216.171.199