检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《中国科学技术大学学报》2011年第7期607-614,共8页JUSTC
基 金:国家自然科学基金(61001178);北京市自然科学基金(4102012);北京市教育委员会科技发展计划面上项目(KM200810005030);北京市高等学校人才强教深化计划"中青年骨干人才培养计划"项目(PHR201108016);北京工业大学青年科学基金资助
摘 要:基于朴素贝叶斯分类框架,通过添加尾项值对部分严重扭曲的分类结果进行调整,达到提升分类器性能的目的.方法通过增量式自适应学习分类模式,根据历史结果,判断分类器分类质量,进而确定尾项添加区间,对明显产生分类扭曲的区间结果自适应添加尾项补偿,调整分类结果.在Trec05,Trec06,Trec07,Ceas08数据集上的对比实验表明,改进算法在accuracy,Macro F1两个指标上均比朴素贝叶斯分类器和bagging朴素贝叶斯分类器显著提高,且方法简单易行.To improve the performance of the naive Bayes classifier,a method is proposed which regulates text categories by adding adjustment values to the output of the naive Bayes classifier.The classification pattern was learned in an incremental and adaptive way,and the interval during which the output of the naive Bayes classifier should be adjusted was built according to the classification performance evaluated by historical outputs.Then the adjustment value was adaptively added to the output of the naive Bayes classifier distributed in the interval to regulate its category.The experiment results on Trec05,Trec06,Trec07,CEAS08 datasets show that the proposed method outperforms the naive Bayes classifier and the bagging naive Bayes classifier in terms of accuracy,Macro F1,in addition to its simplicity and practicality.
关 键 词:文本分类 朴素贝叶斯分类器 垃圾邮件过滤 尾项加权
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28