检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:谢妮妮
机构地区:[1]青海师范大学数学与统计学院
出 处:《数字技术与应用》2023年第2期53-57,共5页Digital Technology & Application
摘 要:糖尿病是多发慢性病,如何准确预测是否患有糖尿病以及找到影响糖尿病的因素对预防和控制糖尿病显得尤为重要。本文通过几种机器学习算法分析一组糖尿病数据比较几种模型的优劣及影响糖尿病的主要因素。首先在训练集上通过交叉验证找到每个模型的最优参数,然后根据混淆矩阵图计算出每个模型的F_(1)-score作为模型的评价标准。研究发现最适合该数据集的预测模型是Voting,其次是KNN、SVM及随机森林;属性的顺序是:Glucose,BMI,Diabetes Pedigree Function,Age,Blood Pressure,Pregnancies,Insulin,Skin Thickness。
关 键 词:机器学习算法 随机森林 混淆矩阵 交叉验证 KNN 最优参数 预测模型 评价标准
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249