检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]国防科学技术大学计算机学院,湖南长沙410073
出 处:《计算机工程与科学》2011年第9期34-41,共8页Computer Engineering & Science
基 金:国家自然科学基金资助项目(60873097);新世纪优秀人才支持计划资助项目(NCET-06-0926);国防科技大学优秀博士生创新资助项目(B080605)
摘 要:本文提出了一种个性化垃圾邮件过滤方法,它能够根据用户反馈自动学习出用户兴趣,并随时间的推移自动适应用户兴趣的变化。该方法首先抽取邮件的语言特征和行为特征构建多个基于规则的单独过滤器,然后采用SVM集成学习方法组合这些单独过滤器的结果。为了提高学习速度、减少用户提供反馈的数量,本文采用了主动学习方法挑选更加富含知识的邮件请求用户给出反馈。实验结果表明:集成学习和主动学习相结合的个性化过滤方法在个性化程度、分类准确率、过滤速度以及自动学习能力等方面具有更好的性能。This paper proposes a personal spam email filtering method, which can learn a user's in terests and update it automatically according to the user's feedback. The proposed method extracts the linguistic features and behavior ones to build some rule-based individual filters, and uses the SVM en- semble learning method to combine the multi-filter's results. Applying an active learning method to choose those knowledgeable emails with the user's labels, the method can minimize the number of la- beled emails and reach steady-state performance more quickly. The experimental results show the personal filtering method based on ensemble learning and active learning can capture personality, and achieve high performance with the considerations on accuracy, efficiency and learning ability.
关 键 词:垃圾邮件过滤 个性化 集成学习 主动学习 支持向量机
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.44