抗干扰词攻击的免疫垃圾邮件过滤模型  

Anti-noise word attack spam filtering model based on artificial immune system

在线阅读下载全文

作  者:王小伟[1] 郭红涛[2] 王中锋[3] 

机构地区:[1]郑州大学体育学院现代教育技术中心,河南郑州450044 [2]华北水利水电学院软件学院,河南郑州450011 [3]北京市劳动保护科学研究所安全与应急管理研究室,北京100054

出  处:《计算机工程与科学》2013年第12期173-177,共5页Computer Engineering & Science

基  金:河南省教育厅科学技术研究重点项目(12B520056;13B520253);郑州大学体育学院青年基金项目(2011C3003)

摘  要:针对当前基于人工免疫技术的垃圾邮件过滤算法中很少考虑干扰词攻击的情况,提出了一种抗干扰词攻击的免疫垃圾邮件过滤模型训练算法ANWAIS。该算法在基因库生成阶段,采用互信息差值作为评估函数,可以过滤掉垃圾邮件中的好词和正常邮件中的垃圾词,从而使基因库更能反映垃圾邮件的特征;同时,在抗体更新阶段,通过维护丢弃词表,可保证基因库的纯洁性。仿真实验表明,该算法能够比未考虑干扰词攻击的垃圾邮件过滤算法获得更好的抗体质量和更优的分类性能。Current spam filtering algorithms based on artificial immune system consider little about the noise word attack,so an immune-based anti-noise word attack spam filtering model,named AN-WAIS,is proposed in order to solve the problem.The algorithm uses the Mutual Information Difference as the Evaluation function to discard the good word in the spam and the spam word in the normal email during the stage of the generation of the gene library,so that the gene library can better reflect the characteristics of spam emails.Meanwhile,it can guarantee the purity of the gene library through maintaining the discard word table during the stage of the updating of the antibody.Experimental results show that ANWAIS can obtain higher quality antibody and have better classification performance than that of other spam filtering algorithms without considering the noise word attack.

关 键 词:人工免疫 干扰词攻击 垃圾邮件过滤 互信息差值 基因库 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象