基于修辞结构的篇章级神经机器翻译  

Document-level neural machine translation based on rhetorical structure

作  者:姜云卓 贡正仙[1] JIANG Yunzhuo;GONG Zhengxian(School of Computer Science&Technology,Soochow University,Suzhou 215008,China)

机构地区:[1]苏州大学计算机科学与技术学院,江苏苏州215008

出  处:《计算机工程与科学》2025年第1期180-190,共11页Computer Engineering & Science

基  金:国家自然科学基金(61976148)。

摘  要:虽然篇章级神经机器翻译发展多年,并取得了长足的进步,但是其大部分工作都是从模型的角度出发,利用上下文字词信息来构建有效的网络结构,忽视了使用跨句子的篇章结构和修辞信息对模型进行指导。针对这一问题,在修辞结构理论的指导下,提出了对篇章单元和修辞结构树特征分别进行编码的方法。实验结果表明,所提方法加强了编码器对篇章结构和修辞上的表征能力,使用该方法对模型进行改进后,其翻译结果在多个数据集上都获得了明显提升,性能超过了多个优质的基线模型,并且在提出的定量评估方法和人工分析中译文质量上也表现出了明显改善。Despite years of development and significant progress in document-level neural machine translation,most efforts have focused on building effective network structures from a model perspective by utilizing contextual word information,neglecting the guidance of cross-sentence discourse structure and rhetorical information for the model.Addressing this issue,under the guidance of Rhetorical Structure Theory,a method for separately encoding discourse units and rhetorical structure tree features is proposed.Experimental results show that the proposed method enhances the encoder s ability to represent discourse structure and rhetorical aspects.The improved model surpasses several high-quality baseline models,achieving notable improvements in translation performance across multiple datasets.Additionally,significant improvements in translation quality are demonstrated through the proposed quantitative evaluation method and human analysis.

关 键 词:神经机器翻译 篇章分析 篇章翻译 修辞结构理论 

分 类 号:H085[语言文字—语言学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象