检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机应用》2004年第9期127-128,135,共3页journal of Computer Applications
基 金:国家 8 63计划项目 (2 0 0 1AA1 1 4 1 1 0 ) ;福建省科技重点项目 (2 0 0 1H0 2 3)
摘 要:基于模板的机器翻译 (TemplateBasedMachineTranslation ,TBMT)系统需要一个具有较大规模、句型覆盖面广泛的模板库 ,而这样的模板库单凭手工无法构建 ,需要利用计算机自动构建 ,提出了一种利用基于动态规划的相似模型与基于系统聚类法的分类模型 ,从句子对齐的双语语料库中抽取模板库的方法。该方法是在句子对齐的语料库中 ,首先运用系统聚类法对其进行聚类 ,使得包含相同模板的句子对被聚成一类 ,然后根据句子的相似度模型计算句子之间的相似度 ,进而从各个子类中将模板抽取出来 ,构建出整个模板库。TBMT need to include a large template library which must be built automatically. We presented a method to build the template library from the parallel corpora with setence aligned. First, we classified the sentences into several sentence sets by system cluster method so that the sentences in the same class had the same template. Then we calculated the similar degree of every two sentences according to the similar degree model. Last we extracted the template from every set. Thus the template library was built up.
关 键 词:模板库 自动抽取 系统聚类 相似度模型 基于模板的机器翻译
分 类 号:TP391.2[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229