检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]合肥工业大学信息与网络中心,安徽合肥230009 [2]安徽大学计算机科学与技术学院,安徽合肥230039
出 处:《合肥工业大学学报(自然科学版)》2009年第12期1863-1866,共4页Journal of Hefei University of Technology:Natural Science
摘 要:文章对垃圾邮件过滤中的特征选择问题进行了研究,引入"词共现模型"考虑词语之间的语义联系信息,和传统的信息增益特征选择方法结合表示邮件,采用神经网络方法对邮件进行分类得到垃圾邮件过滤器。实验表明,文章提出的将词共现对和信息增益结合的特征选择方法能够提高垃圾邮件过滤的精确度。Feature selection for spam filtering is researched in this paper. The word co-occurrence model is introduced to analyze the semantic relation between phrases. Features representing emails are selected by word co-occurrence and information gain. The neural network is used to classify emails and construct the spare filter. The experiments show that the precision of spare filtering is increased by feature selection which combines word co-occurrence and information gain.
关 键 词:垃圾邮件过滤 信息增益 词共现模型 神经网络 交叉覆盖算法
分 类 号:TP393.08[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.143.24.174