用于分类的随机森林和Bagging分类树比较  被引量:17

A Comparison on Random Forest and Bagging Classification Tree in Classification

在线阅读下载全文

作  者:马景义[1,2] 谢邦昌[2,3] 

机构地区:[1]北京师范大学社会发展与公共政策学院,北京100875 [2]中央财经大学统计学院,北京100081 [3]辅仁大学统计资讯学系暨应用统计所,台湾台北24205

出  处:《统计与信息论坛》2010年第10期18-22,共5页Journal of Statistics and Information

基  金:中央财经大学"121"人才工程青年博士发展基金项目<数据挖掘中基于L1罚函数的规则化算法建模理论和应用研究>(QBJ0711);全国统计科学研究计划项目<"有指导"的电话调查技术-基于数据挖掘的理念>(2008LY049);教育部人文社会科学研究项目<预测建模中基于L1罚函数的规则化建模理论>(08JC910003);中央财经大学学科建设基金资助

摘  要:借助试验数据,从两种理论分析角度解释随机森林算法优于Bagging分类树算法的原因。将两种算法表述在两种不同的框架下,消除了这两种算法分析中的一些模糊之处。尤其在第二种分析框架下,更能清楚的看出,之所以随机森林算法优于Bagging分类树算法,是因为随机森林算法对应更小的偏差。The purpose of this paper is to explain why random forest is more competitive than Bagging classification tree in classification from two theoretical views by experiment data.Our analysis in two theoretical views may dissipate misunderstandings existing in the two ensemble methods,and the second analysis suggested by us shows random forest is more successful than bagging in bias reduction and may more evidently explain the reason that random forest is prior to Bagging classification tree than the first one.

关 键 词:组合方法 随机森林 Bagging分类树 

分 类 号:O212[理学—概率论与数理统计]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象