检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]昆明理工大学信息工程与自动化学院,云南昆明650000 [2]云南省人工智能重点实验室,云南昆明650000
出 处:《中国水运》2025年第6期57-58,140,共3页
摘 要:近年来,随着科研工作者们不断的努力,目前神经机器翻译模型已经具备了很好的性能,极大地促进了不同国家水上运输过程中的信息交流。但是神经机器翻译模型成功的关键是,需要有大规模且高质量的平行语料作为训练集。显然,这种大规模的平行语料在英法、英德和中英等高资源语言对之间很容易获取,而在低资源语言对之间却很难获取到足够规模并且高质量的平行语料,因此在低资源语言对之间训练的神经机器翻译模型的性能不佳。文中主要设计了一个基于词嵌入的方法对噪声平行语料进行评分并过滤,还分别对比了其他几种方法,最后还分析了各种过滤方法对不同种类噪声的过滤效果以及不同分词器对最后训练结果的影响。
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.131.37.22