面向水运领域的汉泰噪声平行语料过滤方法  

作  者:陈锡 陈奥博 

机构地区:[1]昆明理工大学信息工程与自动化学院,云南昆明650000 [2]云南省人工智能重点实验室,云南昆明650000

出  处:《中国水运》2025年第6期57-58,140,共3页

摘  要:近年来,随着科研工作者们不断的努力,目前神经机器翻译模型已经具备了很好的性能,极大地促进了不同国家水上运输过程中的信息交流。但是神经机器翻译模型成功的关键是,需要有大规模且高质量的平行语料作为训练集。显然,这种大规模的平行语料在英法、英德和中英等高资源语言对之间很容易获取,而在低资源语言对之间却很难获取到足够规模并且高质量的平行语料,因此在低资源语言对之间训练的神经机器翻译模型的性能不佳。文中主要设计了一个基于词嵌入的方法对噪声平行语料进行评分并过滤,还分别对比了其他几种方法,最后还分析了各种过滤方法对不同种类噪声的过滤效果以及不同分词器对最后训练结果的影响。

关 键 词:水上运输 噪声 过滤 机器翻译 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象