检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陶新民[1] 郝思媛[1] 张冬雪[1] 李震[1]
机构地区:[1]哈尔滨工程大学信息与通信工程学院,哈尔滨150001
出 处:《控制与决策》2013年第7期978-984,共7页Control and Decision
基 金:国家自然科学基金面上项目(61074076);中国博士后科学基金项目(20090450119);中国博士点新教师基金项目(20092304120017);黑龙江省博士后基金项目(LBH-Z08227)
摘 要:针对传统支持向量机在数据失衡的情况下分类效果很不理想的问题,提出一种基于样本特性欠取样的不均衡SVM分类算法.该算法首先在核空间中依据样本信息量选择一定比例的靠近不均衡分类界面的多数类样本;然后根据样本密度信息选择最具有代表性的均衡多数类样本点,在减少多数类样本的同时使分类界面向多数类方向偏移.实验结果表明,所提出的算法与其他不均衡数据预处理方法相比,能有效提高SVM算法在失衡数据中少数类的分类性能、总体分类性能和鲁棒性.The classification result of classical support vector machine algorithm in the case of unbalanced data set is not satisfactory.Therefore,a under-sampling algorithm based on sample properties is presented.According to sample information in the kernel space,a certain percentage of majority instances located near the classification interface are selected.Then according to the sample’s density,the representive majority samples in the selected samples are selected,which can not only reduce the number of majority instances,but also make the SVM classification interface bias toward the majority instances.The experimental results show that compared with other data-preprocess methods for unbalanced dataset classification,the proposed method can improve the classification performance of SVM in the minority class data,the overall classification performance and robustness.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145