基于改进贝叶斯模型的中文邮件分类算法  被引量:7

Algorithm of Chinese Mail Classification Based on Improved Bayesian Model

在线阅读下载全文

作  者:王宁[1] 张建忠[1] 何云[1] 申庆永[1] 徐敬东[1] 

机构地区:[1]南开大学计算机科学与技术系,天津300071

出  处:《计算机工程与应用》2006年第31期97-100,113,共5页Computer Engineering and Applications

基  金:天津市信息化资助项目(042023012)

摘  要:通过分析常见的贝叶斯分类方法和实现模型,提出了一种适用于中文邮件的分类算法——基于混合模型的最小风险贝叶斯方法。混合模型将二项独立模型和多项式模型相结合,提高邮件分类的查全率,同时,在此基础上应用最小风险贝叶斯方法,进一步提高准确率。实验表明,应用改进的方法可以得到更准确的邮件分类效果。With studying some popular methods and models for Bayesian approach,one kind of text classificatory algorithm the paper proposed a new algorithm which was fit for Chinese mails,risk minimization Bayes based on hybird model.The hybird model unified Binary Independence Model and Muhinomial Model,improved the recall of mail filter,in the meanwhile,using the risk minimization Bayes on hybird model,improved the precision.The result of experiments demonstrates that the new algorithm gains better performance in mail classification.

关 键 词:邮件分类 中文分词 最小风险 混合模型 贝叶斯 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象