基于随机森林算法的大学生异动情况的预测  被引量:8

Prediction of degradation for undergraduate using random forest

在线阅读下载全文

作  者:马昕[1,2] 王雪[1] 杨洋[3] 

机构地区:[1]南京审计学院金审学院,江苏南京210029 [2]东南大学生物医学工程学院,江苏南京210096 [3]南京审计学院数学与统计学院,江苏南京210029

出  处:《江苏科技大学学报(自然科学版)》2012年第1期86-90,共5页Journal of Jiangsu University of Science and Technology:Natural Science Edition

基  金:国家自然科学基金资助项目(11001052);江苏省自然科学基金资助项目(BK2010480);南京审计学院青年基金资助项目(NSK2009/01)

摘  要:为了预测学生在大学一年级以后的异动情况,利用机器学习中的随机森林算法建立相应的预测模型.该模型选取了学生大学一年级的总学分和13门大学一年级的课程成绩作为特征,利用随机森林算法模型对该生异动情况建立了预测模型.在建立模型时,考虑到异动学生数量与非异动学生数量相差很大的问题,提出了解决这种不平衡数据集问题的方法.结果显示,此模型达到了较好的预测效果,总体预测准确率85.4%;Matthew相关系数0.6183.To predict the degradation for undergraduate, gorithm with a hybrid feature. The novel hybrid feature, we construct a prediction model using random forest al- which incorporates total credit of the freshman year and the detail, is used to establish the prediction model. The numbers of degradation and non-degradation uates in college are highly unbalanced, so a novel scheme is proposed to deal with the problem of datasets by downsizing the majority class. The RF model reaches excellent prediction performance whi 85.4% overall accuracv with Matthew's correlation coefficient nf O. 6118 3 undergradimbalanced ch achieves

关 键 词:随机森林 决策树 嵌套式交叉验证 异动 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象