基于可控解码策略的生成式生物医学事件抽取  

Generative Biomedical Event Extraction Based on Controllable Decoding

在线阅读下载全文

作  者:苏方方 李霏 姬东鸿[1] SU Fangfang;LI Fei;JI Donghong(Key Laboratory of Aerospace Information Security and Trusted Computing(Ministry of Education),School of National Cybersecurity,Wuhan University,Wuhan,Hubei 430072,China)

机构地区:[1]武汉大学国家网络安全学院、空天信息安全与可信计算教育部重点实验室,湖北武汉430072

出  处:《中文信息学报》2023年第11期68-80,共13页Journal of Chinese Information Processing

基  金:国家自然科学基金(62176187)。

摘  要:该文在预训练语言模型T5的框架基础上构建了一个生成式生物医学事件抽取模型,该方法可以自由定义输出序列,由此可以联合建模触发词识别、关系抽取和论元组合三个子任务。模型采用了生成序列字典树和事件类型-论元角色字典树,用于规范序列生成和减少论元角色的搜索空间。另外还采用可控解码策略便于限制每一步生成时所使用的候选词汇集,最后在训练时使用了课程学习,便于T5模型熟悉生物医学语料和有层次结构的完整事件的学习。该文模型在Genia 2011年和Genia 2013年的语料上分别获得了62.40%和54.85%的F1值,说明了使用生成式的方式进行生物医学事件抽取是可行的。This paper presents a generative biomedical event extraction model based on the framework of the pre-trained language model T5,which allows the joint modeling of the three subtasks of trigger recognition,relation extraction and argument combination.The model employs a trie-based constrained decoding algorithm,which regulates sequence generation and reduces the search space for argument roles.Finally,curriculum learning algorithm is used in training,which familiarizes T5 with biomedical corpora and events with hierarchical structure.The model obtains 62.40%F1-score on the Genia 2011 and 54.85%F1-score on the Genia 2013,respectively,demonstrating the feasibility of using a generative approach to biomedical event extraction.

关 键 词:生物医学事件抽取 生成式模型 可控解码策略 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象