检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:邵叶秦[1] SHAO Ye-qin (Center of Modem Educational Technology, Nantong University, Nantong 226019, China)
机构地区:[1]南通大学现代教育技术中心,江苏南通226019
出 处:《电脑知识与技术》2014年第12期8119-8121,共3页Computer Knowledge and Technology
基 金:国家自然科学基金(61171132); 南通市应用研究计划项目(BK2012034)
摘 要:为了从大量的电子邮件中检测垃圾邮件,提出了一个基于Hadoop平台的电子邮件分类方法。不同于传统的基于内容的垃圾邮件检测,通过在Map Reduce框架上统计分析邮件收发记录,提取邮件账号的行为特征。然后使用Map Reduce框架并行的实现随机森林分类器,并基于带有行为特征的样本训练分类器和分类邮件。实验结果表明,基于Hadoop平台的电子邮件分类方法大大提高了大规模电子邮件的分类效率。To detect spams from the massive emails, an email classification method based on Hadoop platform is proposed. Different from the traditional context-based spam detection, the proposed method statistically analyze the email records by MapReduce framework to extract behavioral features of each email account. Then Random Forests classifier is implemented in parallel by MapReduce framework. Based on the samples with extracted behavioral features, Random Forests classifier is trained and utilized to classify emails. Experimental results show that, the Hadoop based email classification method largely increases the efficiency of massive email classification.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.71