检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京师范大学社会发展与公共政策学院,北京100875 [2]中央财经大学统计学院,北京100081 [3]辅仁大学统计资讯学系暨应用统计所,台湾台北24205
出 处:《统计与信息论坛》2010年第10期18-22,共5页Journal of Statistics and Information
基 金:中央财经大学"121"人才工程青年博士发展基金项目<数据挖掘中基于L1罚函数的规则化算法建模理论和应用研究>(QBJ0711);全国统计科学研究计划项目<"有指导"的电话调查技术-基于数据挖掘的理念>(2008LY049);教育部人文社会科学研究项目<预测建模中基于L1罚函数的规则化建模理论>(08JC910003);中央财经大学学科建设基金资助
摘 要:借助试验数据,从两种理论分析角度解释随机森林算法优于Bagging分类树算法的原因。将两种算法表述在两种不同的框架下,消除了这两种算法分析中的一些模糊之处。尤其在第二种分析框架下,更能清楚的看出,之所以随机森林算法优于Bagging分类树算法,是因为随机森林算法对应更小的偏差。The purpose of this paper is to explain why random forest is more competitive than Bagging classification tree in classification from two theoretical views by experiment data.Our analysis in two theoretical views may dissipate misunderstandings existing in the two ensemble methods,and the second analysis suggested by us shows random forest is more successful than bagging in bias reduction and may more evidently explain the reason that random forest is prior to Bagging classification tree than the first one.
关 键 词:组合方法 随机森林 Bagging分类树
分 类 号:O212[理学—概率论与数理统计]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222