统计学理论在邮件分类中的应用研究  

Research and Design of a Spam Filtering System Based on Statistical Learning Theory

在线阅读下载全文

作  者:汤伟[1] 程家兴[1] 纪霞[1] 

机构地区:[1]安徽大学计算智能与信号处理教育部重点实验室,安徽合肥230039

出  处:《计算机技术与发展》2008年第12期231-234,共4页Computer Technology and Development

基  金:国家自然科学基金(60273043);安徽大学研究生创新基金(20073053)

摘  要:分类问题,尤其是文本自动分类一直是机器学习与数据挖掘研究中的研究热点与核心技术,其中如朴素贝叶斯、KNN等近年来得到了广泛的关注和快速的发展。文中在统计学理论的基础上给出了一种基于支持向量机方法的文本分类算法,并设计出了相应的垃圾邮件过滤系统。实验证明与朴素贝叶斯方法相比,该算法极大地提高了分类准确率和查全率,具有应用推广的价值。Classification is one of the most important research fields in data mining and machine learning. In recent years, there have been extensive studies and rapid progresses in automatic text categorization. Proposes a SVM text categorization on the basis of statistic theory, and designs a corresponding spam email filtering system. Compared with the naive Bayes, the validity of this system is proved. At last some future directions of the research are given.

关 键 词:机器学习 文本分类 垃圾邮件 

分 类 号:TP31[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象