检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机工程》2006年第6期31-33,共3页Computer Engineering
摘 要:分析了数量不对称的样本在允许训练误差的支持向量机训练时产生的最优分界面偏移的问题,认为支持向量机的最优分界面位置取决于间隔(margin)区域中正反例样本数量的比例,而不是传统加权支持向量机所采用的全部正反例样本的数量比。对间隔区域中正反例数量不对称的两类样本采用同样的折衷因子将导致最优分界面向间隔区域中样本较少的类别方向偏移。提出了将折中因子与间隔区域中样本的数量比例联系起来的加权支持向量机,并提出了一种在核函数特征空间估计间隔区域样本数量的方法。试验证明该方法可以提高加权支持向量机的分类性能。This paper analyzes the bias of the optimal hyperplane of SVMs when samples are imbalanced, and find that this bias determined by the proportion of samples in the margin, instead of the proportion of all samples, as traditional weighted SVMs adopted. When marginal samples are imbalanced, the using of same tradeoff factors cause a bias of the optimal hyperplane towards the class with lesser marginal samples. This paper proposes a new weighted SVM, whose tradeoff factors are related to the number of marginal samples. To calculate the number of marginal samples in the feature space of the kernel function, a method for estimation is also proposed. Experimental results show that the new method improves the classification performance.
关 键 词:支持向量机 不对称样本 间隔区域 最优分界面偏移 核函数特征空间
分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222