不均衡数据集中基于Adaboost的过抽样算法  被引量:13

Over-sampling Algorithm Based on Adaboost in Unbalanced Data Set

在线阅读下载全文

作  者:韩慧[1] 王文渊[1] 毛炳寰[2] 

机构地区:[1]清华大学自动化系,北京100084 [2]中央财经大学统计系,北京100081

出  处:《计算机工程》2007年第10期207-209,共3页Computer Engineering

摘  要:为了提高不均衡数据集中少数类的分类性能,该文融合了提升和过抽样的优点,提出了基于提升算法Adaboost的过抽样算法MCMO-Boost,并且将其与决策树算法C4.5、提升算法Adaboost和过抽样算法SMOTE进行了实验比较与分析。结果表明,MCMO-Boost算法在少数类和数据集的总体分类性能方面都优于其它算法。To improve the classification performance of minority class, this paper combines the advantages of boosting and over-sampling, and presents an over-sampling algorithm based on MCMO-Boost of Adaboost. MCMO-Boost is compared with C4.5, Adaboost and SMOTE, and the results show that MCMO-Boost performs better than others for the classification performance of minority class and the whole data set.

关 键 词:不均衡数据集 过抽样 提升算法 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象