检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]西南科技大学计算机科学与技术学院,四川绵阳621010 [2]周口职业技术学院信息工程系,河南周口466000 [3]周口师范学院计算机科学与技术学院,河南周口466000
出 处:《计算机工程》2012年第14期41-43,47,共4页Computer Engineering
基 金:河南省教育厅自然科学研究计划基金资助项目(2008B520047);河南省科技厅基础与前沿技术研究计划基金资助项目(112300410307)
摘 要:在朴素贝叶斯算法和ID3算法的基础上,提出一种改进的决策树分类算法。引入客观属性重要度参数,给出弱化的朴素贝叶斯条件独立性假设,并采用加权独立信息熵作为分类属性的选取标准。理论分析和实验结果表明,改进算法能在一定程度上克服ID3算法的多值偏向问题,并且具有较高的执行效率和分类准确度。This paper proposes an improved decision tree classification algorithm based on naive Bayes algorithm and ID3 algorithm. It introduces objective attribute importance parameter, gives a kind of conditional independence assumption that is weaker than naive Bayesian algorithm, and uses the weighted independent information entropy as splitting attribute's selection criteria. Theoretical analysis and experimental results show that the improved algorithm, to a certain extent well overcomes I193 algorithm's shortcoming of multi-value tendency, and improves algorithm's implementation efficiency and classification accuracy.
关 键 词:朴素贝叶斯算法 ID3算法 信息增益 客观属性重要度 条件独立性假设 加权独立信息熵
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.226.185.23