检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:亢晓勉 宗成庆[1,2] KANG Xiao-Mian;ZONG Cheng-Qing(National Laboratory of Pattern Recognition(Institute of Automation,Chinese Academy of Sciences),Beijing 100190,China;School of Artificial Intelligence,University of Chinese Academy of Sciences,Beijing 100049,China)
机构地区:[1]模式识别国家重点实验室(中国科学院自动化研究所),北京100190 [2]中国科学院大学人工智能学院,北京100049
出 处:《软件学报》2022年第10期3806-3818,共13页Journal of Software
基 金:国家重点研发计划(2017YFB1002100);国家自然科学基金(U1836221)。
摘 要:篇章翻译方法借助跨句的上下文信息以提升篇章的翻译质量.篇章具有结构化的语义信息,可以形式化地表示为基本篇章单元之间的依存关系.但是目前的神经机器翻译方法很少利用篇章的结构信息.为此,提出了一种篇章翻译模型,能够在神经机器翻译的编码器-解码器框架中显式地建模基本篇章单元切分、篇章依存结构预测和篇章关系分类任务,从而得到结构信息增强的篇章单元表示.该表示分别通过门控加权和层次注意力的方式,与编码和解码的状态向量进行融合.此外,为了缓解模型在测试阶段对篇章分析器的依赖,在训练时采用多任务学习的策略,引导模型对翻译任务和篇章分析任务进行联合优化.在公开数据集上的实验结果表明,所提出的方法能够有效地建模和利用篇章单元间的依存结构信息,从而达到提升译文质量的目的.Document-level translation methods improve translation quality with cross-sentence contextual information.Document contains structural semantic information,which can be formally represented as dependency relations between elementary discourse units(EDUs).However,existing neural machine translation(NMT)methods seldom utilize discourse structural information.Therefore,this study proposes a document-level translation method that can explicitly model EDU segmentation,discourse dependency structure prediction,and discourse relation classification tasks in the encoder-decoder framework of NMT,so as to obtain the representation of EDU enhanced by structural information.The representation is integrated with the encoding and decoding state vectors by gating weighted fusion and hierarchical attention,respectively.In addition,in order to alleviate the dependence on discourse parsers at the inference phase,the multi-task learning strategy is applied to guide the joint optimization of translation and discourse analysis tasks.Experimental results on public datasets show that the proposed method can effectively model and utilize the dependency structural information between discourse units to improve the translation quality significantly.
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7