非均衡数据的支持向量机新方法  被引量:1

New method for support vector machine based on imbalanced data

在线阅读下载全文

作  者:解丹蕊[1] 韩建新[1] 薛惠锋[1] 杜喆[2] 

机构地区:[1]西北工业大学自动化学院,西安710072 [2]西安电子科技大学应用数学系,西安710071

出  处:《计算机应用研究》2009年第5期1654-1655,1666,共3页Application Research of Computers

基  金:国家自然科学基金资助项目(60574075);陕西省自然科学基金资助项目(2005F45)

摘  要:为了弥补支持向量机对非均衡样本集分类时倾向于较大类的不足,提出一种平衡策略。基于Fisher判别思想,计算出两类样本在分类超平面法向量上投影后的均值和方差,再依据两类错分概率相等准则,给出新的阈值计算方法对超平面进行调整。该方法可补偿非平衡数据分类的倾向性,提高预测分类精度。最后在非均衡的人工和真实数据集上的数值实验表明了该方法的可行性与有效性。Since support vector machine is unfair to the rare class for the classification of imbalanced data, proposed an adjustment method of the separating hyperplane. Based on Fisher discrimination, got the projected class mean and variance are by projecting two classes samples onto the normal vector of the separating hyperplane, then adjusted the threshold of the hyperplane, according to the principle that error probability of two classes are equal. The proposed algorithm could compensate the ill-effect of tendency and improved the accuracy. Simulations on imbalanced artificial and real data show that the feasibility and validity of the proposed method.

关 键 词:支持向量机 非平衡数据 分类 阈值 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象