检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈亮[1] 高博飞 常宝宝[1] 张亦驰 CHEN Liang;GAO Bofei;CHANG Baobao;ZHANG Yichi(National Key Laboratory for Multimedia Information Processing,Peking University,Beijing 100871,China)
机构地区:[1]北京大学多媒体信息处理全国重点实验室,北京100871
出 处:《中文信息学报》2024年第7期18-30,共13页Journal of Chinese Information Processing
基 金:国家自然科学基金(61936012)。
摘 要:抽象语义表示(Abstract Meaning Representation,AMR)是一种深层次的句子级语义表示形式,其将句子中的语义信息抽象为由概念结点与关系组成的有向无环图,相比其他较为浅层的语义表示形式如语义角色标注、语义依存分析等,AMR因其出色的深层次语义信息捕捉能力,被广泛运用在例如信息抽取、智能问答、对话系统等多种下游任务中。AMR解析过程将自然语言转换成AMR图。虽然AMR图中的大部分概念结点和关系与句子中的词语具有较为明显的对齐关系,但原始的英文AMR语料中并没有给出具体的对齐信息。为了克服对齐信息不足给AMR解析以及AMR在下游任务上的应用造成的阻碍,Li等人[14]提出并标注了具有概念和关系对齐的中文AMR语料库。然而,现有的AMR解析方法并不能很好地在AMR解析的过程中利用和生成对齐信息。因此,该文首次提出了一种可以利用并且生成对齐信息的AMR解析方法,包括了概念预测和关系预测两个阶段。该文提出的方法具有高度的灵活性和可扩展性,实验结果表明,该方法在公开数据集CAMR 2.0和CAMRP 2022盲测集分别取得了77.6(+10.6)和70.7(+8.5)的Align Smatch分数,超过了过去基于序列到序列(Sequence-to-Sequence)模型的方法。该文同时对AMR解析的性能和细粒度指标进行详细的分析,并对存在的改进方向进行了展望。该文的代码和模型参数已经开源到https://github.com/pkunlp-icler/Two-Stage-CAMRP,供复现与参考。Abstract Meaning Representation(AMR)is a semantic representation that captures the sentence-level meaning through directed acyclic graph with conceptual nodes and relations.This representation surpasses other shallow semantic representations,such as semantic role labeling and semantic dependency parsing,making it suitable for various downstream tasks including information extraction,question answering,and dialog system.AMR parsing,the process of converting natural language into an AMR graph,faces the challenge due to the lack of alignment information in the original English AMR corpus.In this paper,we present a novel AMR parsing method that leverages and generates alignment information,comprising two stages:concept prediction and relation prediction.Our approach outperforms previous sequence-to-sequence model based methods by achieving AlignSmatch scores of 77.6(+10.6)and 70.7(+8.5)on the publicly available dataset CAMR2.0 and the blind test set CAMRP2022,respectively.We provide a detailed analysis of both the performance and fine-grained metrics of AMR parsing,and discuss the potential for improvement,with the code and model parameters available at https://github.com/pkunlp-icler/Two-Stage-CAMRP.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145