基于互信息和随机森林的混合变量选择算法  被引量:7

Hybrid Variable Selection Algorithm Based on Mutual Information and Random Forest

在线阅读下载全文

作  者:赵伟卫[1] 李艳颖[2] 赵风芹[1] 魏洒洒 ZHAO Weiwei LI Yanying ZHAO Fengqin WEI Sasa(School of Mathematics and Statistics, Xidian University, Xi'an 710126, China School of Mathematics and Information Science, Baoji University of Arts and Science, Baoji 721013, Shaanxi Province, China)

机构地区:[1]西安电子科技大学数学与统计学院,西安710126 [2]宝鸡文理学院数学与信息科学学院,陕西宝鸡721013

出  处:《吉林大学学报(理学版)》2017年第4期933-939,共7页Journal of Jilin University:Science Edition

基  金:国家自然科学基金(批准号:61573266);国家自然科学基金青年基金(批准号:11626034;61602010);陕西省教育厅科研计划项目(批准号:16JK1047);西安电子科技大学博士科研启动项目(批准号:ZK2017020)

摘  要:针对单一变量选择算法中模型分类精度和泛化能力较低的问题,提出一种混合变量选择算法.该算法分为两个阶段:过滤阶段,利用互信息快速排除一部分无关变量,降低样本空间的维数;封装阶段,在置换理论框架下,利用随机森林精选剩余变量.实验结果表明,该算法与对比算法相比具有更高的分类精度和泛化能力.Aiming at the problem that the classification accuracy and generalization ability of model were low in single variable selection algorithms,we proposed a hybrid variable selection algorithm.The algorithm was divided into two stages.In filtration stage,mutual information was used to quickly exclude a part of irrelevant variables,which reduced the dimension of sample space.In wrapper stage,the random forest was used to refine the remaining variables in the framework of permutation theory.The experimental results show that,compared with the contrast algorithm,this algorithm has higher classification accuracy and generalization ability.

关 键 词:变量选择 互信息 随机森林 混合算法 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象