检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]东北大学网络中心,辽宁沈阳110004 [2]东北大学信息科学与工程学院,辽宁沈阳110004
出 处:《中国海洋大学学报(自然科学版)》2008年第S1期147-150,共4页Periodical of Ocean University of China
基 金:国家高技术研究发展计划项目(2006AA01Z214);国家自然科学基金项目(60673159;70671020);新世纪优秀人才支持计划项目;教育部科学技术研究重点项目(108040);高等学校博士学科点专项科研基金课题(20060145012;20070145017);辽宁省自然科学基金项目(20062022);长江学者和创新团队发展计划资助
摘 要:分析新垃圾邮件发现的意义,设计用来发现新垃圾邮件的相似度测量算法——Spam-SMA,该算法使用N元字串(N-Gram)作为比较用特征,基于该算法,在规则判分的反垃圾邮件框架下,提出1种新垃圾邮件发现机制,并通过对SpamAssassin的扩展实现了该机制。在邮件服务器上进行了多次实验,结果证明,该机制可有效实现新垃圾邮件的发现。The necessiy of a new overrun spam detection is analyzed.Then aspam detection algorithm based on similarity measure is designed, which is named Spam-SMA and it makes use of the N-gram as features for comparison.A mechanism of new overrun spam detection which uses the Spam-SMA algorithm is proposed based on the score-based rule anti-spam scheme,such as SpamAssassin,and a module of Spamassassin is implemented based on the mechanism.Experiment results show that this mechanism is effective.
关 键 词:垃圾邮件 N元字串 相似度测量 基于规则判分系统
分 类 号:TP393.098[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.64