检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]浙江警察学院计算机与信息技术系,浙江310053
出 处:《网络安全技术与应用》2016年第6期57-58,共2页Network Security Technology & Application
摘 要:基于规则的垃圾邮件过滤技术是目前常用的垃圾邮件过滤方法之一。基于规则的垃圾邮件过滤方法是通过训练样本,归纳总结出其中规律性的内容来得到显式规则,从而实现垃圾邮件分类的目的。为了对基于规则算法的邮件过滤方法进行比较,本文简要分析了Ripper、C4.5决策树和Adaboost这三种基于规则的常用算法,并利用开源的数据挖掘平台WEKA对三种算法的垃圾邮件过滤方法进行实验比较。实验结果表明:Ripper、C4.5决策树和Adaboost这三种算法都获得了80%以上的查准率和查全率,但相比较而言,Adaboost算法的查准率和查全率结果较好,获得了90%以上的查准率和查全率结果。
关 键 词:规则 RIPPER C4.5决策树 ADABOOST 垃圾邮件过滤 比较
分 类 号:TP393.098[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28