一种自动选择参数的加权支持向量机算法  被引量:9

A Weighted Support Vector Machines with Automatic Parameters Selection

在线阅读下载全文

作  者:刘爽[1] 贾传荧[1] 陈鹏[2] 

机构地区:[1]大连海事大学航海技术研究所,辽宁大连116026 [2]东软信息技术学院研发中心,辽宁大连116023

出  处:《计算机工程与应用》2006年第2期64-66,221,共4页Computer Engineering and Applications

基  金:交通部基础研究项目(编号:200432922504)

摘  要:C-SVM分类算法在不同类别样本数目不均衡的情况下,训练时的分类错误倾向于样本数目小的类别。样本集中出现重复样本时作为新样本重新计算,增加了算法的训练时间。针对这两种问题,分析了产生的原因,提出了一种加权支持向量机算法,补偿了类别差异造成的不利影响,加快了重复样本的决策速度。为提高算法的推广性能,在模型训练过程中引入遗传算法自动选择惩罚因子和核函数宽度两个参数。实验结果表明了该算法可以有效地解决类别不均衡和重复样本问题,且训练模型具有良好的推广性能。When training sets with uneven class sizes are used,the classification error based on C-Support Vector Machine is undesirably biased towards the class with fewer samples in the training set.When training with multi-duplicated samples,CTSVM depends on each sample leading to more time for training.A new weighted support vector machine algorithm is proposed based on the analysis of the cause of such problems,which compensates for the unfavorable impact caused by the uneven class sizes and makes the decision speed faster.To obtain a good generalization performance,genetic algorithm is used to tune the regularization parameter and parameter of the kernel function when training the model.Experiments show that the proposed approach can control the misclassification error rates of classes and deal with multi-duplicate samples with good generalization performance.

关 键 词:加权支持向量机 类别差异 重复样本 遗传算法 参数调节 

分 类 号:TP389.1[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象