检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:连晓丹[1] 黄坤平[1] 刘林[1] LIAN Xiaodan;HUANG Kunping;LIU Lin(Huizhou First Hospital.Huizhou Guangdong 516000,China)
出 处:《自动化与仪器仪表》2023年第6期170-174,共5页Automation & Instrumentation
基 金:广东省社会发展领域科技计划项目(20120318060)。
摘 要:三甲综合医院庞大的数据库中潜藏着有用信息,为了将这些信息挖掘出来,对医疗大数据进行聚类分析。通过基于无监督的学习算法(Unsupervised learning algorithm,ULA)进行数据自动清洗等预处理步骤,利用改进K-means算法对得到的数据进行聚类处理,构建相应的可视化分析系统,并进行应用分析。结果显示,整体上相较于其他三种算法,改进K-means算法的建模时间更短,准确率更高,最高可达89.90%;其在妊娠期检验数据中的活化部分凝血酶时间(Activated partial thrombin time,APTT)等类别聚类中对应ROC面积最大,聚类效果最佳,实现了医疗数据的有效挖掘。In order to mine useful information hidden in the vast database of tertiary comprehensive hospitals,this article con-ducts cluster analysis on medical big data.By using unsupervised learning algorithm(ULA)for data automatic cleaning and other preprocessing steps,the improved K-means algorithm is used to cluster the obtained data,construct a corresponding visual analysis system,and perform application analysis.The results show that overall,compared to the other three algorithms,the improved K-means algorithm has shorter modeling time and higher accuracy,with a maximum of 89.90%;It has the largest corresponding ROC area and the best clustering effect in categories such as activated partial thrombin time(APTT)in pregnancy test data.The article implements effective mining of medical data.
关 键 词:数据挖掘 医疗大数据 妊娠期检验数据 改进K-MEANS算法 可视化
分 类 号:TP273[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.118.155.106