基于概念预测和关系预测的AMR解析与对齐方法

An AMR Parsing and Alignment Method Based on Concept and Relation Prediction

作　　者：陈亮[1] 高博飞常宝宝[1] 张亦驰 CHEN Liang;GAO Bofei;CHANG Baobao;ZHANG Yichi(National Key Laboratory for Multimedia Information Processing,Peking University,Beijing 100871,China)

机构地区：[1]北京大学多媒体信息处理全国重点实验室,北京100871

出　　处：《中文信息学报》2024年第7期18-30,共13页Journal of Chinese Information Processing

基　　金：国家自然科学基金(61936012)。

摘　　要：抽象语义表示(Abstract Meaning Representation,AMR)是一种深层次的句子级语义表示形式,其将句子中的语义信息抽象为由概念结点与关系组成的有向无环图,相比其他较为浅层的语义表示形式如语义角色标注、语义依存分析等,AMR因其出色的深层次语义信息捕捉能力,被广泛运用在例如信息抽取、智能问答、对话系统等多种下游任务中。AMR解析过程将自然语言转换成AMR图。虽然AMR图中的大部分概念结点和关系与句子中的词语具有较为明显的对齐关系,但原始的英文AMR语料中并没有给出具体的对齐信息。为了克服对齐信息不足给AMR解析以及AMR在下游任务上的应用造成的阻碍,Li等人[14]提出并标注了具有概念和关系对齐的中文AMR语料库。然而,现有的AMR解析方法并不能很好地在AMR解析的过程中利用和生成对齐信息。因此,该文首次提出了一种可以利用并且生成对齐信息的AMR解析方法,包括了概念预测和关系预测两个阶段。该文提出的方法具有高度的灵活性和可扩展性,实验结果表明,该方法在公开数据集CAMR 2.0和CAMRP 2022盲测集分别取得了77.6(+10.6)和70.7(+8.5)的Align Smatch分数,超过了过去基于序列到序列(Sequence-to-Sequence)模型的方法。该文同时对AMR解析的性能和细粒度指标进行详细的分析,并对存在的改进方向进行了展望。该文的代码和模型参数已经开源到https://github.com/pkunlp-icler/Two-Stage-CAMRP,供复现与参考。Abstract Meaning Representation(AMR)is a semantic representation that captures the sentence-level meaning through directed acyclic graph with conceptual nodes and relations.This representation surpasses other shallow semantic representations,such as semantic role labeling and semantic dependency parsing,making it suitable for various downstream tasks including information extraction,question answering,and dialog system.AMR parsing,the process of converting natural language into an AMR graph,faces the challenge due to the lack of alignment information in the original English AMR corpus.In this paper,we present a novel AMR parsing method that leverages and generates alignment information,comprising two stages:concept prediction and relation prediction.Our approach outperforms previous sequence-to-sequence model based methods by achieving AlignSmatch scores of 77.6(+10.6)and 70.7(+8.5)on the publicly available dataset CAMR2.0 and the blind test set CAMRP2022,respectively.We provide a detailed analysis of both the performance and fine-grained metrics of AMR parsing,and discuss the potential for improvement,with the code and model parameters available at https://github.com/pkunlp-icler/Two-Stage-CAMRP.

关键词：语义解析抽象语义表示中文自然语言处理

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于概念预测和关系预测的AMR解析与对齐方法

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于概念预测和关系预测的AMR解析与对齐方法

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索