融合句法信息的双语词对齐方法研究  

A Fusion Word Alignment Model Constructing Method Based on Linguistic Information

在线阅读下载全文

作  者:张贯虹[1] ZHANG Guan-hong (Hefei University Key Laboratory of Network and Intelligent Information Processing, Hefei 260601,China)

机构地区:[1]合肥学院网络与智能信息处理重点实验室,安徽合肥260601

出  处:《电脑知识与技术》2014年第3期1519-1523,共5页Computer Knowledge and Technology

基  金:安徽省教育厅自然科学基金一般项目(KJ20128147);安徽省高等学校省级优秀青年人才基金项目(2012SQRL171);安徽省自然科学基金青年项目(1308085QF115)

摘  要:词对齐研究是多文种信息处理工作的一项不容忽略的基础性研究内容。通过针对中文和蒙古文词对齐研究中存在的形态和词序不对称以及支撑词对齐研究的对齐语料缺乏问题,开展融合语言信息的中蒙混合词对齐模型构建方法研究。利用产生式词对齐结果以及中蒙两种语言的语言信息作为潜特征,建立高质量的融合语言信息的中蒙混合词对齐模型。实验结果证明,该文提出方法对于利用可比语料抽取对齐语料是可行的。Generative model and discriminative model are taken as two mainly approaches in word alignment field. To solve the problems of Chinese-Mongolian word alignment such as asymmetric morphological structure and word order, is presented in a discriminative framework using the result of generative word alignment and Chinese and Mongolian contextual information as la-tent variables for Chinese-Mongolian word alignment task. This work provides a new method and some theoretical support for performance improvement of word alignment of smaller scale corpus.

关 键 词:句子对齐 短语翻译 中文短语 

分 类 号:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象