检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机应用》2009年第10期2755-2757,共3页journal of Computer Applications
基 金:全国教育科学"十五"规划教育部重点基金项目(DCA050056);江苏省教育科学"十一五"规划项目(D/2006/01/096);教育部归国留学基金委项目
摘 要:提出一种利用遗传算法优化支持向量机来进行垃圾邮件的分类方法。首先对邮件进行预处理,然后利用遗传算法优化支持向量机的惩罚因子和核函数参数的组合,最后利用优化后的支持向量机对邮件进行分类。在由5 800篇邮件构成的数据集上进行实验的结果表明,该方法能达到89.67%的准确率,提高了对中文垃圾电子邮件过滤的准确性。A method of classifying E-mail by Support Vector Machines (SVM) and Genetic Algorithm (GA) was proposed. In the first step, the mails were preprocessed, and then the combination of support vector machine parameters of C and kernel function parameters was optimized by genetic algorithm. Finally, the E-mail was classified by the optimized SVM . The experiments on a data set composed of 5 800 mails show that the precision is 89.67%, which indicates that this method indeed improves the accuracy of filtering Chinese spam.
关 键 词:支持向量机 遗传算法 垃圾邮件 参数优化 模式识别
分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249