检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]楚雄师范学院经济与管理学院,云南 楚雄 [2]凯里学院大数据工程学院,贵州 凯里 [3]海军工程大学信息安全系,湖北 武汉
出 处:《计算机科学与应用》2020年第2期276-288,共13页Computer Science and Application
摘 要:国家电网省级通信管理系统TMS存在账物不一致、数据录入错误、缺失数据等问题,需要对大量数据进行分析处理并重新分类;为了提高分类学习的准确度,需要对数据的大量特征进行有效选择。本文将随机森林模型应用于特征选择,依据决策树数目、特征划分标准、特征划分候选子集中的最大特征数、特征重排后模型的准确率变化等多个参数,提出了一种优化的TMS系统数据的随机森林特征选择方法,通过实验进行了验证。TMS has some problems such as inconsistent accounts, wrong data input, missing data, and so on. It needs to analyze and re-classify a lot of data, and to improve the accuracy of classification learning, it needs to select a lot of data features effectively. In this paper, the stochastic forest model is applied to feature selection, according to the number of decision trees, the criteria of feature partition, the maximum feature number in the candidate subset of feature partition, the change of the accuracy of the model after feature rearrangement, etc. , an optimized random forest feature selection method for TMS data is proposed and verified by experiments.
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49