一种基于代价敏感集成决策树的不平衡数据分类方法研究  被引量:3

Research on Cost Senstive Decision Tree for Imbalanced Data

在线阅读下载全文

作  者:张珏[1] 田建学[1] 董婷[1] ZHANG Jue;TIAN Jian-xue;DONG Ting(School of Information Engineering, Yulin University, Yulin 719000, China)

机构地区:[1]榆林学院信息工程学院,陕西榆林719000

出  处:《榆林学院学报》2021年第2期53-55,共3页Journal of Yulin University

基  金:国家自然科学基金(51866015);陕西省教育厅科研专项(19JK0996);榆林市科技局项目(2019-77-3,2019-93-3);榆林学院一般科研项目(14YK37)。

摘  要:分类算法在不平衡数据分类中,对少数类样本识别率较低的问题,提出一种基于代价敏感集成决策树的分类方法(CSB-C5.0)。利用网格搜索法对集成迭代参数进行优化;通过构建集成决策树将多个决策树组合生成更准确的分类器,同时引入代价敏感因子,通过为不同种类的分类结果赋予不同的权重来提升少数类的分类识别率。以UCI数据中的数据集为研究对象,进行分类。仿真结果表明,与典型的不平衡数据分类算法SMOTEBoost、RUSBoost和标准的C5.0算法相比,CSB-C5.0方法有效地提高了少数类样本的性能。To overcome the low recognition rate of minority class in imbalanced data classification,an algorithm based on cost sensitive boosted decision tree is proposed.The grid search algorithm is used to fix the optimal trail parameter.Multiple decision tree is booted to generate a more accurate classifier,meanwhile cost sensitve matix paramete is used to optimize the classification results.The experiment results on UCI data show that the algorithm is better than SMOTEBoost,RUSBoost and Boosted C5.0.

关 键 词:不平衡数据 集成算法 代价敏感矩阵 网格搜索算法 

分 类 号:TP311.52[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象