随机森林算法的影响分析  被引量:2

Influence Analysis of Random Forest

在线阅读下载全文

作  者:王淑玲[1] 黄之杰[1] 段红梅[1] 冯予[2] WANG Shu-ling;HUANG Zhi-jie;DUAN Hong-mei;FENG Yu(Department of FundarnentalAir Force Logistics College,Xuzhou 221000,China;School of Sciences,NUST,Nanjing 210094,China)

机构地区:[1]空军勤务学院基础部,江苏徐州221000 [2]南京理工大学理学院,江苏南京210094

出  处:《数学的实践与认识》2018年第19期296-301,共6页Mathematics in Practice and Theory

基  金:国家自然科学基金(11271189);院青年科研基金(KY2016D007B)对该研究的支持

摘  要:针对随机森林算法,研究了数据点的影响分析,主要目的是确定出数据集中可能存在的强影响点.首先,回顾了随机森林算法的研究现状;然后,定义了识别强影响点的诊断统计量;最后,通过对鸢尾花数据和cpu数据的分析,分别从分类和回归两种情形验证了上述诊断方法的有效性.成功地拓展了统计诊断方法的应用范围.In order to recognize the strong influence data, this paper studied the influence analysis of random forest algorithm. Firstly, the research status of the random forest algorithm is reviewed; Secondly, the diagnosis statistics for recognizing the strong influence data are defined. Finally, the effectiveness of the above diagnostic methods are verified through the analysis of the iris data and cpu data. This paper broadened the application scope of statistical diagnosis method successfully.

关 键 词:随机森林 强影响点 广义COOK距离 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象