融合HowNet的中文电子病历命名实体识别  被引量:2

Named Entity Recognition of Chinese EMR Based on HowNet

在线阅读下载全文

作  者:张军亮[1,2] 方雪梅 雒曼 孙晶晶 Zhang Junliang

机构地区:[1]新乡医学院管理学院,河南新乡453003 [2]新乡医学院卫生信息资源研究中心,河南新乡453003 [3]Envoy Global公司数据分析部,伊利诺依芝加哥60606

出  处:《情报理论与实践》2021年第10期18-26,共9页Information Studies:Theory & Application

基  金:国家社会科学基金一般项目“基于语义网的医疗健康信息组织与服务模式研究”(项目编号:19BTQ076);国家社会科学基金重点项目“大数据环境下领域知识加工与组织模式研究”(项目编号:20ATQ006);四川省高校人文社会科学重点研究基地--四川学术成果分析与应用研究中心重点项目“健康数据的知识库构建及服务模式研究”(项目编号:SCAA17-003)的阶段性成果。

摘  要:中文电子病历中存在大量非结构化的文本信息,其中的医学命名实体识别是生物医学领域知识组织和服务的基础。文章首先分析了中文电子病历特征的词语、词性、语素和词的组成等语法特征,以及HowNet语义特征;然后,运用CRF模型,提出了基于CRF医学命名实体的识别方案;最后,实验表明融合HowNet的中文电子病历命名实体识别方法具有较好的效果。Named entities recognition of Chinese electronic medical records(EMR),which include a lot of unstructured text information,is the basis of medical information organization and service.Firstly,based on the characteristics of Chinese EMR,this paper analyzes the grammatical features of words,part of speech,morpheme and word structure,as well as the semantic features of HowNet.Then,a recognition scheme of medical named entity based on CRF is proposed.Finally,the experimental results show that medical named entity recognition method of the Chinese EMR based on HowNet is effective.

关 键 词:中文电子病历 医学命名实体 命名实体识别 HOWNET 

分 类 号:R197.323[医药卫生—卫生事业管理] TP391.1[医药卫生—公共卫生与预防医学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象