基于拆分集成的不均衡数据分类算法  被引量:1

Imbalanced Data Classification Algorithm Based on Split and Classifier Ensemble

在线阅读下载全文

作  者:杜红乐[1] 张燕[1] 

机构地区:[1]商洛学院数学与计算机应用学院,商洛726000

出  处:《计算机系统应用》2017年第8期223-226,共4页Computer Systems & Applications

基  金:陕西省自然科学基础研究计划(2015JM6347);陕西省教育厅科技计划(15JK1218);商洛学院科学与技术研究项目(15sky010)

摘  要:为改进SVM对不均衡数据的分类性能,提出一种基于拆分集成的不均衡数据分类算法,该算法对多数类样本依据类别之间的比例通过聚类划分为多个子集,各子集分别与少数类合并成多个训练子集,通过对各训练子集进行学习获得多个分类器,利用WE集成分类器方法对多个分类器进行集成,获得最终分类器,以此改进在不均衡数据下的分类性能.在UCI数据集上的实验结果表明,该算法的有效性,特别是对少数类样本的分类性能.To improve the performance of Support Vector Machine classifier for imbalanced data, an imbalanced data classification algorithm based on split and classifier ensemble is introduced. The majority class sample is divided into several sub sets by clustering, and each subset is combined with minority class sample to produce a training subset. Then the training subsets are learned and multiple classifiers are obtained. Finally the multiple classifiers are integrated and the ensemble classifier is obtained. Experimental results show the algorithm is effective for imbalanced dataset, especially for the minority class samples.

关 键 词:支持向量机 不均衡数据集 分类器集成 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象