检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:姜云卓 贡正仙[1] JIANG Yunzhuo;GONG Zhengxian(School of Computer Science&Technology,Soochow University,Suzhou 215008,China)
机构地区:[1]苏州大学计算机科学与技术学院,江苏苏州215008
出 处:《计算机工程与科学》2025年第1期180-190,共11页Computer Engineering & Science
基 金:国家自然科学基金(61976148)。
摘 要:虽然篇章级神经机器翻译发展多年,并取得了长足的进步,但是其大部分工作都是从模型的角度出发,利用上下文字词信息来构建有效的网络结构,忽视了使用跨句子的篇章结构和修辞信息对模型进行指导。针对这一问题,在修辞结构理论的指导下,提出了对篇章单元和修辞结构树特征分别进行编码的方法。实验结果表明,所提方法加强了编码器对篇章结构和修辞上的表征能力,使用该方法对模型进行改进后,其翻译结果在多个数据集上都获得了明显提升,性能超过了多个优质的基线模型,并且在提出的定量评估方法和人工分析中译文质量上也表现出了明显改善。Despite years of development and significant progress in document-level neural machine translation,most efforts have focused on building effective network structures from a model perspective by utilizing contextual word information,neglecting the guidance of cross-sentence discourse structure and rhetorical information for the model.Addressing this issue,under the guidance of Rhetorical Structure Theory,a method for separately encoding discourse units and rhetorical structure tree features is proposed.Experimental results show that the proposed method enhances the encoder s ability to represent discourse structure and rhetorical aspects.The improved model surpasses several high-quality baseline models,achieving notable improvements in translation performance across multiple datasets.Additionally,significant improvements in translation quality are demonstrated through the proposed quantitative evaluation method and human analysis.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.116.51.45