检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:孙晶涛[1,2] 张秋余[1] 袁占亭[1] 董建设[1]
机构地区:[1]兰州理工大学计算机与通信学院,兰州730050 [2]中国石油化工股份有限公司甘肃石油分公司,兰州730030
出 处:《电子科技大学学报》2011年第1期95-99,共5页Journal of University of Electronic Science and Technology of China
基 金:十一五国家科技支撑计划资助项目(2006BAF01A21);甘肃省教育厅科研基金(0703-07);甘肃省自然科学基金项目(0803RJZA024)
摘 要:特征选择在垃圾邮件过滤中起着十分重要的作用,本文分析讨论了现有邮件特征选择方法所存在的不足,并在此基础上,提出一种基于博弈论的邮件特征选择模型。该模型将博弈论应用于邮件特征选择中,以达到约减信息规模,提高垃圾邮件过滤效率的目的。在设计特征选择模型时,考虑到邮件样本自身的模糊隶属性对特征选择所产生的影响,在特征点对邮件类别的区分度定义中,通过引入由相融性度量定义的样本模糊隶属度函数,提高博弈邮件特征选择模型对实际问题的处理能力。在CDSCE语料库上的实验表明,该邮件特征选择模型的性能优于同类其他特征选择方法,验证了该邮件特征选择模型的有效性。The shortages existed in the e-mail feature selection method is first analyzed.A new spam filtering feature selection model based on game theory is then proposed.The game theory is applied to feature selection of mail in order to reduce the scale of information and improve the efficiency of spam filtering.When designing the feature selection model,the impact acted by fuzzy membership of mail samples on feature selection is considered.The feature selection model's handling capacity for practical problems is enhanced by using a blending sample measure of fuzzy membership function in the definition of feature points to mail category discrimination.The experiments performed on CDSCE Corpus show that the mail feature selection is better than other feature selection methods.
关 键 词:中文垃圾邮件 特征选择 模糊聚类分析 博弈论 隶属度函数
分 类 号:TP393.098[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.145.83.240