基于词汇扩展的垃圾邮件过滤方法  被引量:1

Method of Spam Filtering Based on Term Expansion

在线阅读下载全文

作  者:高丽平[1] 高亮[1] 

机构地区:[1]中原工学院,郑州450007

出  处:《中原工学院学报》2009年第6期4-6,16,共4页Journal of Zhongyuan University of Technology

基  金:国家自然科学基金项目(60472022)

摘  要:提出了一种基于统计的扩展敏感词库的方法.利用人工搜集的敏感词汇,计算垃圾邮件中其他词汇的权重,选取权重高的作为二级敏感词汇并将其分类;在过滤邮件时,将二级敏感词作为一级敏感词的补充.本方法不仅适用于中文,对英文文本同样适用,实验表明,本方法能提高垃圾邮件过滤的精度.This article proposes a new method of expanding the sensitive terms based on statistics. By the use of sensitive terms which are collected manully, the weight of other terms in spam will be calculated. The higher weighted terms will be selected as secondary sensitive terms and be classfied. As a supplementary, the secondary sensitive terms will help to filter the spam. This method is not only suitable for Chinese, but also for English text. The experiment indicated that this method can improve the recalling rate and the precision of spam filtration.

关 键 词:垃圾邮件 过滤 词汇扩展 网络安全 敏感词库 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象