基于贝叶斯算法的垃圾邮件过滤器的模拟实现  

Simulation and Implementation of Spam Filter Based on Bayesian Algorithm

在线阅读下载全文

作  者:刘红[1] 陈静[1] 郑健[2] 

机构地区:[1]上海电机学院电子信息学院,上海200240 [2]公安部第三研究所刑侦事业部,上海200031

出  处:《上海电机学院学报》2013年第4期224-228,共5页Journal of Shanghai Dianji University

基  金:上海市大学生创新计划项目资助(2012SCX15);上海电机学院科研启动经费项目资助(13DX02);上海电机学院重点学科资助(13XKJ01)

摘  要:对贝叶斯算法进行了深入分析与研究。在过滤算法设计中,研究发现基于贝叶斯算法的过滤模拟器运算的错误率与选取的敏感词汇数量有关,选取的敏感词汇与邮件训练集的数量越多,设计的邮件过滤器的正确率就越高。综合考虑了实用性和经济性,在选取训练集数量和敏感词汇数量时,根据实际情况选择了一个度,设计了一个基于贝叶斯算法的垃圾邮件模拟过滤模型。This paper analyzes the Bayesian algorithms. It is found that the error rate of the emulator based on Bayesian filtering is related to the selected number of training sensitive words. The correct rate of the designed spam filter is higher with higher selected number and more train- ing sets. However, considering practicality and economy, we set a degree to select the number of training sets and sensitive words according to actual situation. Availability and economy are con- sidered, and a filter model based on Bayesian for the spam is designed.

关 键 词:互联网 电子邮件 垃圾邮件过滤 贝叶斯算法 

分 类 号:TP393.098[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象