基于贝叶斯分类的垃圾短信过滤方法研究  被引量:3

Spam Messages Filtering Methods Based on Bayes Classification

在线阅读下载全文

作  者:林英[1] 陈静怡[1] 秦江龙[1] 谢仲文[1] 

机构地区:[1]云南大学软件学院,昆明650091

出  处:《计算机与数字工程》2016年第9期1752-1756,1781,共6页Computer & Digital Engineering

基  金:云南省软件工程重点实验室开放基金(编号:2010KS01)资助

摘  要:随着智能手机的普及,短信在给人们生活带来便利的同时,也引发了诸如短信诈骗、短信骚扰、违法信息传播等信息安全问题。由于传统基于朴素贝叶斯分类进行短信过滤的方法在后验概率接近的情况下,分类效果并不理想。论文提出一种多层次的短信过滤方法。该方法首先结合阈值与特征评分的方法,提高垃圾短信分类的准确率;其次,在此方法的基础上,引入增量学习机制,解决由于短信的时新性、复杂性带来的误判。实验结果表明相较于朴素贝叶斯分类及单独改进的方法,多层次过滤的改进方法能有效提高短信分类的正确率。With the popularity of smart phones,text message brings convenient on peoples life,but at the same time it causes many information security problems such as fraud,harassment and illegal information spreading.Considering some traditional filtering methods which based on naive bayes classification are not effective in some circumstances,this paper proposes a multi-level filtering method which combines threshold method,feature score method,and incremental learning mechanism.The experimental results show that compared with naive bayes and single improved method,this multi-level filtering method can effectively improve the accuracy of text classification.

关 键 词:垃圾短信 朴素贝叶斯 文本分类 特征评分 阈值 增量学习 

分 类 号:TP309.2[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象