基于多特征模糊关联的垃圾邮件过滤方法  

Spam Filtering Method Based on Fuzzy Relevancy of Multiple Features

在线阅读下载全文

作  者:廖明涛[1] 张德运[1] 侯琳[2] 李金库[1] 

机构地区:[1]西安交通大学网络所,陕西西安710049 [2]西安建筑科技大学信控学院,陕西西安710055

出  处:《微电子学与计算机》2008年第3期1-3,7,共4页Microelectronics & Computer

基  金:国家“八六三”计划项目(2003AA148010);国家火炬计划项目(2005EB011484)

摘  要:提出一种基于多特征模糊关联的垃圾邮件过滤方法.该方法分为预处理和实时处理两个阶段,在预处理阶段,分析训练样本集,提取邮件的发送源特征和文本特征的典型特征值集合,计算典型特征值与合法邮件类、垃圾邮件类之间的模糊关联度.在实时处理阶段,根据待分类邮件所包含的特征值,计算邮件的类支持度,然后利用Dempster-Shafer证据理论实现多个特征的分类融合与判决.实验结果表明,此方法能有效提高垃圾邮件过滤的查全率和查准率.This paper proposed a sparn filtering method based on fuzzy relevancy of multiple features, it consists of two stages: preprocessing and real-time processing. In the preprocessing stage, it analyzes training samples set, extracts typical terms of ernail transmission source and text features, calculates fuzzy relevancy between typical terms and ernail categories. In the real-tune processing state, it calculates support degree for categories aceording to the term values in email, then uses Dernpster-Shafer evidence theory to fuse the information provided by multiple features and make decision. The experiment showed that the method can effectively improve the recall rate and precision rate of sparn filtering.

关 键 词:垃圾邮件过滤 模糊关联 证据理论 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象