检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李强 陈衍姣 LI Qiang;CHEN Yanjiao(College of Big Data Applications and Economics,Guizhou University of Finance and Economics,Guizhou Province Big Data Statistical Analysis Key Laboratory,Guiyang 550025,China)
机构地区:[1]贵州财经大学大数据应用与经济学院,贵州省大数据统计分析重点实验室,贵阳550025
出 处:《科技和产业》2022年第8期271-275,共5页Science Technology and Industry
基 金:国家社会科学基金(18XTJ004)。
摘 要:将随机森林应用到商业性养老保险购买行为预测过程中,对中国综合社会调查(CGSS)2017年问卷调查数据进行分析。首先运用SMOTE过采样来平衡数据集,其次采用网格搜索确认模型输入参数,最后将改进后的随机森林模型进行分类预测,并与支持向量机模型对比。实例结果表明,SMOTE过采样方法在处理非均衡数据方面表现良好,能够起到提高模型性能的效果,处理后的随机森林的分类效果优于支持向量机。The applications of random forests is used to predict commercial endowment insurance purchasing behavior.China’s general social survey(CGSS)questionnaire survey data in 2017 is analyzed.SMOTE sampling is used to balance data set,then grid search is used to confirm mode input parameters.Finally the improved random forest model predictions is classified.And it is compared with support vector machine model.The results show that SMOTE oversampling method has a good performance in treating disequilibrium data,can improve the model performance,and the classification effect of stochastic forest after treatment is better than that of SVM.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7