检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:奈存剑 杨亮 陈文昌 李林峰 任宇飞 汪火明 张晓祥[1] NAI Cun-jian;YANG Liang;CHEN Wen-chang;LI Lin-feng;REN Yu-fei;WANG Huo-ming;ZHANG Xiao-xiang(Tongji Hospital,Tongji Medical College,Huazhong University of Science and Technology,Wuhan 430030,Hubei Province,China;Yidu Cloud(Beijing)Technology Co.,Ltd.,Beijing 100039,China)
机构地区:[1]华中科技大学同济医学院附属同济医院,湖北武汉430030 [2]医渡云(北京)技术有限公司,北京100039
出 处:《中华医学图书情报杂志》2022年第10期27-32,共6页Chinese Journal of Medical Library and Information Science
基 金:国家卫生健康委标准修制订项目“临床医学术语标准协作开发机制研究”(2020090)。
摘 要:电子病历文本中存在错别字既不符合国家电子病历管理规范,又降低了自然语言处理技术的效果,影响了电子病历的价值挖掘与应用。阐述了一种基于在大量真实病历语料上训练出的预训练语言模型进行自动纠错的方法。实验证明,该方法在仿真数据集和真实病历数据集上检错和纠错都取得了很好的效果,运行效率很高,可以支持事中和事后的电子病历纠错,有效提升电子病历质量,推动电子病历的应用。The presence of misspelled words in electronic medical records(EMR)is not only inconsistent with the national electronic medical record management norms,but also reduces the effectiveness of natural language processing techniques,which in turn affects the value mining and application of EMR.A method of automatic typo correction based on a pre-trained language model trained on a large corpus of real-world medical records was elaborated in this paper.Experiments showed that the method performed well in error detection and correction on both simulated and real-world datasets.The method operates with high efficiency and can support error correction of EMR during and after the event,which can effectively improve the quality and thus promote the application of EMR.
分 类 号:R197[医药卫生—卫生事业管理] TP391.1[医药卫生—公共卫生与预防医学]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.21.28.69