利用循环翻译提高维汉机器翻译性能实践探究  

在线阅读下载全文

作  者:敖乃翔 郭锐 宜年 艾山·吾买尔 

机构地区:[1]新疆联海创智信息科技有限公司,新疆乌鲁木齐830010 [2]新疆多语种信息技术重点实验室,新疆乌鲁木齐830046

出  处:《电脑知识与技术》2022年第22期1-4,共4页Computer Knowledge and Technology

基  金:《多模态信息感知与智能处理创新团队》天山创新团队计划(项目编号:2020D14044)。

摘  要:目前通常使用反向翻译来提升翻译模型的性能。因为通过反向翻译获得的伪造数据质量参差不齐,一般需要筛选反向翻译得到的句子,然后与真实数据混合使用。因此,该文在维汉机器翻译任务中,对利用BLEU值、MAS、BERT及多种相似度计算方法融合等进行深入对比分析,并提供详细的统计分析。通过实验发现循环翻译在很大程度上可以隐式地区分不同领域的数据。CCMT19维汉翻译任务上,通过将不同筛选方法的融合,翻译性能有1.95个bleu的提升。

关 键 词:反向翻译 循环翻译 筛选 相似度 

分 类 号:TP183[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象