基于Scikit-Learn的垃圾短信过滤方法实证研究  被引量:6

An Empirical Study on Spam Messages Detection Method Based on Scikit-Learn

在线阅读下载全文

作  者:杨忆[1,2] 李建国 葛方振[1] 

机构地区:[1]淮北师范大学计算机科学与技术学院,安徽淮北235000 [2]河海大学计算机与信息学院,江苏南京211100

出  处:《淮北师范大学学报(自然科学版)》2016年第4期39-41,共3页Journal of Huaibei Normal University:Natural Sciences

基  金:安徽省高校自然科学重点项目(KJ2015A315,KJ2013A229);安徽省自然科学基金项目(1408085MF130);淮北师范大学青年科研项目(2013xqz06)

摘  要:文章为有效应对垃圾短信,在短信数据集"SMS Spam Collection"上,以Scikit-Learn为工具,通过实验对比验证,结果表明,在比较的7种垃圾短信过滤统计学习方法中,朴素贝叶斯和支持向量机方法在判别准确率方面明显优于其他方法,这2种方法可以作为其他方法用以比较的基准测试方法.In order to effectively deal with spam messages,this paper is verified by experiment in the SMS da-taset'SMS spam collection'. It is found that in the experimental comparison of seven kinds of spam filteringstatistical method,naive Bayesian and support vector machine in the discriminant accuracy was significantlybetter than the other methods.These two methods can be used as a benchmark test(baseline)method for theother methods.

关 键 词:垃圾短信 Scikit-Learn 分类 朴素贝叶斯法 支持向量机 

分 类 号:TP3-0[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象