不平衡支持向量机的惩罚因子选择方法  被引量:15

Error-cost selection for biased support vector machines

在线阅读下载全文

作  者:金鑫[1] 李玉鑑[1] 

机构地区:[1]北京工业大学计算机学院,北京100124

出  处:《计算机工程与应用》2011年第33期129-133,共5页Computer Engineering and Applications

基  金:国家自然科学基金(No.61175004;No.60775010);北京市自然科学基金(No.4112009);北京市教委科技发展项目(No.KZ201210005007);北京工业大学高层次人才培养项目~~

摘  要:支持向量机在处理不平衡数据集时常常不能取得良好的效果,而基于不同惩罚因子的不平衡支持向量机能够较好地处理这个问题。阐述了支持向量机在不平衡数据集上失效的原因,讨论了不平衡支持向量机的求解算法,提出了一种根据数据集分布的平均密度直接选取惩罚因子的方法,以减少传统交叉验证方法选取参数所需的时间。实验表明,与其他方法相比,这种平均密度方法能够有效提高不平衡支持向量机在不平衡数据集上的识别效果。Standard SVM often performs poorly on imbalanced datasets,whereas biased-SVM can deal with the problem using two different error costs.This paper explains why SVM fails,discusses how to solve a biased-SVM,and proposes a direct method to determine the error costs,i.e.,"average density",in order to reduce the time needed for their selection via traditional cross validation.Experimental results show that the average density method can efficiently and effectively improve the performance of biased-SVM on imbalanced datasets,better than the other methods for comparison.

关 键 词:序列最小最优化 不平衡支持向量机 平均密度 惩罚因子 参数选取 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象