基于贝叶斯分类器的中文垃圾短信辨识  被引量:3

在线阅读下载全文

作  者:袁闻[1,2] 王晓晔[1,2] 邓高登 韩淼[1,2] 杨星[1,2] 谢晓喆 

机构地区:[1]天津理工大学智能计算及软件新技术重点实验室 [2]天津理工大学计算机视觉与系统省部共建教育部重点实验室,天津300191

出  处:《科技资讯》2017年第5期10-13,共4页Science & Technology Information

基  金:国家自然科学基金(项目编号:61170174);大学生创新训练计划项目(项目编号:201410060049;X2015033)的资助

摘  要:垃圾短信制造者出于商业目的或其他诈骗目的向手机用户大量发送垃圾短信或诈骗短信,使得手机用户不胜其扰。运营商在发送短信之前对短信加以辨识后,给可能是垃圾短信的信息贴上标签后再发送,将会大大降低手机用户受骗的机率。该文采用IF-IDF算法和离散特征的贝叶斯分类器,进行特征词选取,构建垃圾短信鉴别模型。通过垃圾短信训练数据集构建的中文垃圾短信贝叶斯分类模型,能够使垃圾短信的识别率保持在94%以上,具有较高的实用性。

关 键 词:贝叶斯分类器 中文垃圾短信 特征提取 特征选择 文本挖掘 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象