检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]大连海事大学信息科学技术学院,辽宁大连116026
出 处:《控制与决策》2010年第4期487-492,共6页Control and Decision
基 金:国家自然科学基金项目(60773084;J0724003;60603023);高等学校博士学科点专项科研基金项目(20070151009)
摘 要:针对AdaBoost算法不能有效提升NB(Naive Bayesian)的分类性能,提出一种改进的样本权重维护策略.权重的调整不仅依据样本是否分错,还需考虑前几轮的多个基分类器对它的投票分歧.基分类器的信任度不但与错误率有关,还与基分类器间的差异性有关.这样可以提高基分类器的正确性,增加基分类器的差异性.实验结果表明,改进的BoostVE-NB算法能有效地提升NB文本分类性能.For the problem that AdaBoost works poorly with Naive Bayesian(NB) categorization,an improved re-weighting rule for training examples is proposed.It is not only considering the classification result of the current iteration,but also considering how much those previous classifiers disagree on their decision-making for each training sample.Moreover,the confidence of every base classifier is determined not only by the error rate,but also by the diversity among base classifiers. Thus,the accuracy and instability of the base NB classifiers are increased.Experimental results show that BoostVE-NB is effectively to improve the performance of NB text categorization.
关 键 词:ADABOOST 朴素贝叶斯 文本分类 样本权重 投票信息熵
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.62