融合医学词典的条件随机场模型多文本实体识别研究  

Research on Multi-text Entity Recognition Based on Conditional Random Field Model with the Integration of Medical Dictionary

在线阅读下载全文

作  者:沈同平 俞磊 SHEN Tongping;YU Lei(School of Medicine and Information Engineering,Anhui University of Chinese Medicine,Hefei 230012,China)

机构地区:[1]安徽中医药大学医药信息工程学院,合肥230012

出  处:《长春大学学报》2021年第12期1-5,共5页Journal of Changchun University

基  金:国家自然科学基金项目(61701005);2019年高校优秀青年骨干人才国外访学研究项目(gxgwfx2019026);安徽省质量工程项目(2017mooc223,2020jyxm1029);安徽省高校人文社会科学研究重点项目(SK2020A0244);安徽高校自然科学研究重点项目(KJ2020A0443);安徽中医药大学校级质量工程项目(2021zlgc046);安徽中医药大学人文重点项目(2020rwzd07);安徽中医药大学自然重点项目(2020zrzd18,2019zrzd11,2018zryb06)。

摘  要:针对不同的文本类型,CRF模型在实体识别效率效果存在较大差异。使用通用文本简历数据集和医学文本CCKS2017医学数据集进行模型对比验证,结果表明CRF模型在专业医学文本上识别效果较差。为了提升在医学文本上的识别效果,构建了专业的医学词典,实验结果表明,CRF+词典的模型能够有效提升在医学文本中各类医学实体的识别效果。CRF model has great differences in the effect of entity recognition efficiency on different text types.The paper uses the general text resume data set and the medical text CCKS2017 medical data set to carry out model comparison and verification.The results show that CRF model has a poor recognition effect on professional medical text.In order to improve the recognition effect on medical texts,a professional medical dictionary is constructed.Experimental results show that the model of CRF+dictionary can effectively improve the recognition effect of various medical entities in medical texts.

关 键 词:CRF模型 优化 实体识别 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象