改进的朴素贝叶斯垃圾邮件过滤算法  被引量:11

Improved Nave Bayesian spam filtering algorithm

在线阅读下载全文

作  者:翟军昌[1,2] 秦玉平[2] 王春立[3] 

机构地区:[1]渤海大学公共计算机教研部,辽宁锦州121000 [2]渤海大学信息科学与工程学院,辽宁锦州121000 [3]大连海事大学计算机科学与技术学院,辽宁大连116023

出  处:《计算机工程与应用》2009年第14期145-148,共4页Computer Engineering and Applications

基  金:国家自然科学基金No.60603023;辽宁省教育厅资助科研课题No.2006A025~~

摘  要:介绍了朴素贝叶斯垃圾邮件过滤算法,对于朴素贝叶斯算法中条件概率的计算,选用了多变量贝努里事件模型的计算方法,在多变量贝努里事件模型的基础上进行了改进,并在Ling-Spam语料库上进行实验,实验结果表明改进后的算法有效地提高了过滤器的召回率和精确率,并且降低了过滤器的错误率。The paper describes the Nave Bayesian spam filtering algorithms.In terms of probability calculation of Nave Bayes algorithm,the paper selects calculation of multi-variable model of Bernoulli event,and makes improvements to multi-variable model of Bernoulli event,and carries out an experimental on the Ling-Spam corpus.The results show that the improved algorithm can effectively enhance the recall and accuracy of the filter and lower the error rate of the filter.

关 键 词:垃圾邮件 朴素贝叶斯 信息增益 多变量贝努里事件模型 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象