双语词典在统计机器翻译中的应用  

Application of bilingual dictionary in statistical machine translation

在线阅读下载全文

作  者:王丽[1] 韩习武[1] 

机构地区:[1]黑龙江大学信息技术研究所,哈尔滨150082

出  处:《计算机工程与应用》2010年第16期135-139,共5页Computer Engineering and Applications

基  金:国家自然科学基金(No.60773069;No.60873169)~~

摘  要:在当前的基于统计的翻译方法中,双语语料库的规模、词对齐的准确率对于翻译系统的性能有很大的影响。虽然大规模语料库可以改善词语对齐的准确度,提高系统的性能,但同时会以增加系统的负载为代价,因此目前对于统计机器翻译方法的研究在使用大规模语料库的基础上,同时寻求其他可以提高系统性能的方法。针对以上问题,提出一种把双语词典应用在统计机器翻译中的方法,不仅优化了词对齐的准确率,而且得出质量更高的翻译结果,在一定程度上缓解了数据稀疏问题。Based on the current statistical machine translation,the size of corpus and the accuracy of word alignment mainly affect the performance of SMT systems.Though large bilingual corpus can improve the accuracy of word alignment and the performance of the system,at the cost of increasing the load of the system at the same time.So nowdays the research about statistical machine translation is not only on the basis of using large bilingual corpus,but also seeks other methods to improve the performance of the system.This paper proposes an approach,in which the bilingual dictionary is integrated in the SMT system.The approach can improve the accuracy of word alignment,and can also get a better result,and to a certain extent,the problem of Sparse Data is eased.

关 键 词:统计机器翻译 双语词典 双语语料库 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象