基于Boosting算法的C5.0决策树不平衡数据分类算法  被引量:3

Boosting-based C5.0 Decision Tree Algorithm for Imbalanced Data Classification Problem

在线阅读下载全文

作  者:王植[1] 张珏[2] WANG Zhi;ZHANG Jue(Xi’an Aeronautical Polytechnic Institute,Xi’an 710089,China;College of Information Engineering,Yulin University,Yulin 719000,Shaanxi China)

机构地区:[1]西安航空职业技术学院,西安710089 [2]榆林学院信息理工学院,陕西榆林719000

出  处:《河南科学》2023年第1期7-12,共6页Henan Science

基  金:陕西省科技计划一般项目(2020NY-163);榆林市高新区科技计划项目(CXY-2021-30,CXY-2021-44);榆林市科技计划项目(CXY-2022-66)。

摘  要:为了改进不平衡数据的分类性能,提出一种可自动确定迭代参数trail值的集成C5.0决策树算法.首先,算法引入boosting集成框架到C5.0决策树算法中,从而生成新的集成分类器;其次,算法使用网格搜索法在一定范围内自动确定trail参数的值.实验结果表明,该算法在不平衡数据上的分类性能指标G-mean和MCC上具有优势.To improve the impact of imbalanced data on classification performance,an ensemble C5.0 decision tree algorithm which can automatically determine the value of the iterative parameter trail is proposed.Firstly,the boosting ensemble framework is introduced into the C5.0 decision tree algorithm to generate a new ensemble algorithm B-C5.0.Secondly,the grid search algorithm is used to search the optimal trail parameter.The experimental results show that the algorithm has advantages in the classification performance index G-mean and MCC on imbalanced data.

关 键 词:类不平衡问题 集成算法 C5.0决策树算法 网格搜索算法 

分 类 号:TN309[电子电信—物理电子学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象