基于间隔区域样本数量的加权支持向量机  被引量:4

Weighted SVM Based on the Number of Marginal Samples

在线阅读下载全文

作  者:王晔[1] 黄上腾[1] 

机构地区:[1]上海交通大学计算机系,上海200030

出  处:《计算机工程》2006年第6期31-33,共3页Computer Engineering

摘  要:分析了数量不对称的样本在允许训练误差的支持向量机训练时产生的最优分界面偏移的问题,认为支持向量机的最优分界面位置取决于间隔(margin)区域中正反例样本数量的比例,而不是传统加权支持向量机所采用的全部正反例样本的数量比。对间隔区域中正反例数量不对称的两类样本采用同样的折衷因子将导致最优分界面向间隔区域中样本较少的类别方向偏移。提出了将折中因子与间隔区域中样本的数量比例联系起来的加权支持向量机,并提出了一种在核函数特征空间估计间隔区域样本数量的方法。试验证明该方法可以提高加权支持向量机的分类性能。This paper analyzes the bias of the optimal hyperplane of SVMs when samples are imbalanced, and find that this bias determined by the proportion of samples in the margin, instead of the proportion of all samples, as traditional weighted SVMs adopted. When marginal samples are imbalanced, the using of same tradeoff factors cause a bias of the optimal hyperplane towards the class with lesser marginal samples. This paper proposes a new weighted SVM, whose tradeoff factors are related to the number of marginal samples. To calculate the number of marginal samples in the feature space of the kernel function, a method for estimation is also proposed. Experimental results show that the new method improves the classification performance.

关 键 词:支持向量机 不对称样本 间隔区域 最优分界面偏移 核函数特征空间 

分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象