代价敏感支持向量机在垃圾邮件过滤中的应用  被引量:4

Application of Cost Sensitive SVM in Spam Filtering

在线阅读下载全文

作  者:董建设[1] 袁占亭[1] 张秋余[1] 

机构地区:[1]兰州理工大学计算机与通信学院,兰州730050

出  处:《计算机工程》2008年第10期131-132,146,共3页Computer Engineering

基  金:国家"863"计划基金资助项目(2002AA415270)

摘  要:支持向量机在垃圾邮件过滤中能达到较高的分类准确率,实际应用中,将正常邮件误判为垃圾邮件会给用户造成更大的损失。该文提出一个基于代价敏感支持向量机的垃圾邮件过滤方案,通过为正类和负类训练样本设置不同的错误惩罚系数对分类器进行训练,在保证较高的垃圾邮件召回率的前提下,尽可能降低正常邮件的误判率(假阳性率)。实验结果表明,该方案能有效地提高过滤器的整体性能,更好地满足垃圾邮件过滤的实际要求。SVM based filter can achieve higher accuracy in spam filtering. But in actual applications, it costs a lot for users to lose legitimate email. In this paper, a spam filtering method based on cost sensitive SVM is proposed. The standard SVM is reconstructed as cost sensitive learner by introducing various trade-off factors for positive and negative examples. The aim is to decrease the number of legitimate emails that are misclassified while maintain a high ratio spam recall. Experimental results show that the proposed method can enhance the filtering performance effectively.

关 键 词:支持向量机 垃圾邮件过滤 代价敏感 假阳性 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象