一种面向预测任务的基于时间序列的病人表示学习方法  被引量:1

A Patient Sequential Representation Learning Method for Time-series Prediction Tasks

在线阅读下载全文

作  者:张乐[1] 方之家[1] 王祺 雷丽琪 阮彤[1] 高炬[2] ZHANG Le;FANG Zhijia;WANG Qi;LEI Liqi;RUAN Tong;GAO Ju(East China University of Science and Technology,Shanghai 200237,China;Shanghai Shuguang Hospital,Shanghai 200021,China)

机构地区:[1]华东理工大学自然语言处理与数据挖掘实验室,上海200237 [2]上海中医药大学附属曙光医院,上海200021

出  处:《山西大学学报(自然科学版)》2019年第1期111-119,共9页Journal of Shanxi University(Natural Science Edition)

基  金:国家高技术研究发展计划("863"计划)(2015AA020107);上海市科研计划项目(16511101000)

摘  要:针对多次住院的住院病人病历数据提出了一种通用的病人表示学习方法,首先根据病人的特性对医院病历进行二次建库,构建序列化的电子病历数据。然后使用循环神经网络自编码器模型来生成病人表示向量。该模型既能有效地建模序列化电子病历中的时序信息,又能在无监督条件下实现通用的病人表示学习。最后,将得到的病人表示向量作为特征,应用到心衰病人的死亡率预测与并发症预测任务之中。实验结果表明,这种表示学习方法相较其他基于原始电子病历数据的特征学习策略,在死亡预测上提高了约0.15的AUC值,并在10项并发疾病预测中获得4项最优,2项次优结果。This paper proposes a novel general-purpose patient representation learning approach to summarize sequential EHRs,we construct a sub-repository and convert raw data to series of record representation vectors,and we use an RNN autoencoder for patient representation learning.This model can not only effectively model the sequential information,but also learn a general patient representation under unsupervised conditions.We validate our representation as feature based on two tasks(i.e.,mortality prediction and comorbidity prediction).The experiment results show that compared to other methods based on raw HER data and alternative feature learning strategies,our representation improves the mortality prediction by about 0.15 of AUC,and abtains four optimal and two suboptimal results out of ten comorbidity predictions.

关 键 词:电子病历 时序信息 循环神经网络自编码器 表示学习 深度学习 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象