检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]郑州大学体育学院现代教育技术中心,河南郑州450044 [2]华北水利水电学院软件学院,河南郑州450011 [3]北京市劳动保护科学研究所安全与应急管理研究室,北京100054
出 处:《计算机工程与科学》2013年第12期173-177,共5页Computer Engineering & Science
基 金:河南省教育厅科学技术研究重点项目(12B520056;13B520253);郑州大学体育学院青年基金项目(2011C3003)
摘 要:针对当前基于人工免疫技术的垃圾邮件过滤算法中很少考虑干扰词攻击的情况,提出了一种抗干扰词攻击的免疫垃圾邮件过滤模型训练算法ANWAIS。该算法在基因库生成阶段,采用互信息差值作为评估函数,可以过滤掉垃圾邮件中的好词和正常邮件中的垃圾词,从而使基因库更能反映垃圾邮件的特征;同时,在抗体更新阶段,通过维护丢弃词表,可保证基因库的纯洁性。仿真实验表明,该算法能够比未考虑干扰词攻击的垃圾邮件过滤算法获得更好的抗体质量和更优的分类性能。Current spam filtering algorithms based on artificial immune system consider little about the noise word attack,so an immune-based anti-noise word attack spam filtering model,named AN-WAIS,is proposed in order to solve the problem.The algorithm uses the Mutual Information Difference as the Evaluation function to discard the good word in the spam and the spam word in the normal email during the stage of the generation of the gene library,so that the gene library can better reflect the characteristics of spam emails.Meanwhile,it can guarantee the purity of the gene library through maintaining the discard word table during the stage of the updating of the antibody.Experimental results show that ANWAIS can obtain higher quality antibody and have better classification performance than that of other spam filtering algorithms without considering the noise word attack.
关 键 词:人工免疫 干扰词攻击 垃圾邮件过滤 互信息差值 基因库
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30