检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]黑龙江大学信息技术研究所,哈尔滨150082
出 处:《计算机工程与应用》2010年第16期135-139,共5页Computer Engineering and Applications
基 金:国家自然科学基金(No.60773069;No.60873169)~~
摘 要:在当前的基于统计的翻译方法中,双语语料库的规模、词对齐的准确率对于翻译系统的性能有很大的影响。虽然大规模语料库可以改善词语对齐的准确度,提高系统的性能,但同时会以增加系统的负载为代价,因此目前对于统计机器翻译方法的研究在使用大规模语料库的基础上,同时寻求其他可以提高系统性能的方法。针对以上问题,提出一种把双语词典应用在统计机器翻译中的方法,不仅优化了词对齐的准确率,而且得出质量更高的翻译结果,在一定程度上缓解了数据稀疏问题。Based on the current statistical machine translation,the size of corpus and the accuracy of word alignment mainly affect the performance of SMT systems.Though large bilingual corpus can improve the accuracy of word alignment and the performance of the system,at the cost of increasing the load of the system at the same time.So nowdays the research about statistical machine translation is not only on the basis of using large bilingual corpus,but also seeks other methods to improve the performance of the system.This paper proposes an approach,in which the bilingual dictionary is integrated in the SMT system.The approach can improve the accuracy of word alignment,and can also get a better result,and to a certain extent,the problem of Sparse Data is eased.
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.198