检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨玉珍[1] 刘培玉[1] 朱振方[1] 邱烨[1]
机构地区:[1]山东师范大学信息科学与工程学院,山东济南250014
出 处:《山东大学学报(理学版)》2009年第11期48-51,共4页Journal of Shandong University(Natural Science)
基 金:国家自然科学基金资助项目(60873247)
摘 要:在特征项分布不平衡的情况下,传统信息增益算法的分类性能会急剧下降,针对此缺陷提出了一种利用特征项分布信息来改进信息增益公式的计算方法。通过计算特征项分布信息来判定特征项是否存在不平衡性,并利用此信息来平衡特征项不出现时对分类精度的影响。通过实验验证,改进后的计算方法整体上比传统的信息增益算法具有更好的性能。Classification performance of a traditional information gain algorithm will rapidly decline when feature items are in an unbalanced distribution. An improved calculation method of an information gain formula using feature items' distribution information is proposed. Distribution information of feature items is computed to judge whether the imbalance of feature items exists and balance the influence of classification accuracy when the feature items do not appear. The improved calculation method has better performance through the experiment.
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28