基于全局上下文机制的实体关系联合抽取方法  

作  者:张云涛 黄莺 ZHANG Yuntao;HUANG Ying

机构地区:[1]三峡大学计算机与信息学院,湖北宜昌443000

出  处:《信息技术与信息化》2025年第1期140-146,共7页Information Technology and Informatization

基  金:国家重点研究发展计划资助项目“城镇安全风险评估与应急保障技术研究”(2016YFC0802500)。

摘  要:目前,中文电子病历进行实体关系抽取存在着因医疗文本表达模糊不准确、文本结构复杂而造成医疗关系识别不准确的问题。针对这一问题,文章提出了一种基于全局上下文机制的中文电子病历实体关系联合抽取模型——GCPRel。首先,该模型通过BERT获取词表示。其次,借助全局上下文机制,将过去完成时和将来进行时的句子表征整合至每个单元格的句子表征内,以此更有效地捕捉文本里的上下文信息。再次,借助所获取的文本表征和词性信息,提取所有潜在的主语-宾语组合对。最后,通过biaffine模型为每个实体对分配可能的关系,得到医疗文本的三元组。采用CHIP2020关系抽取数据集和糖尿病数据集进行实验验证,结果显示,在CHIP2020关系抽取数据集上的Precision为62.413%,Recall为60.737%,F1值为61.563%;在糖尿病数据集上的Precision、Recall和F1值分别为83.487%、80.583%和82.009%,证明了该模型的三元组抽取性能优于其它基线模型。

关 键 词:关系抽取 联合抽取 全局上下文机制 词性信息 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象