检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:苏方方 李霏 姬东鸿[1] SU Fangfang;LI Fei;JI Donghong(Key Laboratory of Aerospace Information Security and Trusted Computing(Ministry of Education),School of National Cybersecurity,Wuhan University,Wuhan,Hubei 430072,China)
机构地区:[1]武汉大学国家网络安全学院、空天信息安全与可信计算教育部重点实验室,湖北武汉430072
出 处:《中文信息学报》2023年第11期68-80,共13页Journal of Chinese Information Processing
基 金:国家自然科学基金(62176187)。
摘 要:该文在预训练语言模型T5的框架基础上构建了一个生成式生物医学事件抽取模型,该方法可以自由定义输出序列,由此可以联合建模触发词识别、关系抽取和论元组合三个子任务。模型采用了生成序列字典树和事件类型-论元角色字典树,用于规范序列生成和减少论元角色的搜索空间。另外还采用可控解码策略便于限制每一步生成时所使用的候选词汇集,最后在训练时使用了课程学习,便于T5模型熟悉生物医学语料和有层次结构的完整事件的学习。该文模型在Genia 2011年和Genia 2013年的语料上分别获得了62.40%和54.85%的F1值,说明了使用生成式的方式进行生物医学事件抽取是可行的。This paper presents a generative biomedical event extraction model based on the framework of the pre-trained language model T5,which allows the joint modeling of the three subtasks of trigger recognition,relation extraction and argument combination.The model employs a trie-based constrained decoding algorithm,which regulates sequence generation and reduces the search space for argument roles.Finally,curriculum learning algorithm is used in training,which familiarizes T5 with biomedical corpora and events with hierarchical structure.The model obtains 62.40%F1-score on the Genia 2011 and 54.85%F1-score on the Genia 2013,respectively,demonstrating the feasibility of using a generative approach to biomedical event extraction.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.216.8.36