检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]鲁东大学计算机科学与技术学院,山东烟台264025 [2]山东大学计算机科学与技术学院,济南250061
出 处:《计算机工程与应用》2008年第15期142-144,157,共4页Computer Engineering and Applications
摘 要:数据挖掘是人工智能中知识发现的重要组成部分,而分类又是一种主要的应用形式。ID3算法是数据挖掘中经典的决策树分类算法,ID3算法具有抗噪声能力差的缺点。通过对分类和粗糙集理论的研究,将可变精度粗糙集理论的思想应用在计算属性信息熵时设定阈值上,以放宽属性选择的要求,从而对经典的ID3算法作了相应的改进。改进后的ID3算法(称之为VPID3算法)可在一定程度上降低噪声对系统分类的干扰,提高了有数据有噪声情况下的分类精度。另外根据该算法设计并实现了一个分类器,并通过实验检验了该算法的性能。Data mining is an important part of AI and classification is a kind of useful application.ID3 algorithm is a classical algorithm in data mining,the algorithm has the worse ability to resist noise.Through the research on variable precision rough set,the algorithm is improved by setting threshold value while calculating attributes’ entropy,in order to relax the restrictions while selecting attributes.After using the improved ID3 algorithm(VPID3),the interference of noise to classification could be reduced to a certain extent,this made result correspond to reality even more.Finally,the paper designs and realizes a classifier using VPID3 algorithm and do some experiments to check its performance.Extensive experiments with four different datasets have shown that our algorithm is more effective in dealing with noise data than ID3 algorithm.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222