基于模板的机器翻译系统中模板库的自动构建技术  被引量:4

Auto-extraction of template library in template based machine translation(TBMT) system

在线阅读下载全文

作  者:林贤明[1] 李堂秋[1] 史晓东[1] 

机构地区:[1]厦门大学计算机科学系,福建厦门361005

出  处:《计算机应用》2004年第9期127-128,135,共3页journal of Computer Applications

基  金:国家 8 63计划项目 (2 0 0 1AA1 1 4 1 1 0 ) ;福建省科技重点项目 (2 0 0 1H0 2 3)

摘  要:基于模板的机器翻译 (TemplateBasedMachineTranslation ,TBMT)系统需要一个具有较大规模、句型覆盖面广泛的模板库 ,而这样的模板库单凭手工无法构建 ,需要利用计算机自动构建 ,提出了一种利用基于动态规划的相似模型与基于系统聚类法的分类模型 ,从句子对齐的双语语料库中抽取模板库的方法。该方法是在句子对齐的语料库中 ,首先运用系统聚类法对其进行聚类 ,使得包含相同模板的句子对被聚成一类 ,然后根据句子的相似度模型计算句子之间的相似度 ,进而从各个子类中将模板抽取出来 ,构建出整个模板库。TBMT need to include a large template library which must be built automatically. We presented a method to build the template library from the parallel corpora with setence aligned. First, we classified the sentences into several sentence sets by system cluster method so that the sentences in the same class had the same template. Then we calculated the similar degree of every two sentences according to the similar degree model. Last we extracted the template from every set. Thus the template library was built up.

关 键 词:模板库 自动抽取 系统聚类 相似度模型 基于模板的机器翻译 

分 类 号:TP391.2[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象