检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张贯虹[1] ZHANG Guan-hong (Hefei University Key Laboratory of Network and Intelligent Information Processing, Hefei 260601,China)
机构地区:[1]合肥学院网络与智能信息处理重点实验室,安徽合肥260601
出 处:《电脑知识与技术》2014年第3期1519-1523,共5页Computer Knowledge and Technology
基 金:安徽省教育厅自然科学基金一般项目(KJ20128147);安徽省高等学校省级优秀青年人才基金项目(2012SQRL171);安徽省自然科学基金青年项目(1308085QF115)
摘 要:词对齐研究是多文种信息处理工作的一项不容忽略的基础性研究内容。通过针对中文和蒙古文词对齐研究中存在的形态和词序不对称以及支撑词对齐研究的对齐语料缺乏问题,开展融合语言信息的中蒙混合词对齐模型构建方法研究。利用产生式词对齐结果以及中蒙两种语言的语言信息作为潜特征,建立高质量的融合语言信息的中蒙混合词对齐模型。实验结果证明,该文提出方法对于利用可比语料抽取对齐语料是可行的。Generative model and discriminative model are taken as two mainly approaches in word alignment field. To solve the problems of Chinese-Mongolian word alignment such as asymmetric morphological structure and word order, is presented in a discriminative framework using the result of generative word alignment and Chinese and Mongolian contextual information as la-tent variables for Chinese-Mongolian word alignment task. This work provides a new method and some theoretical support for performance improvement of word alignment of smaller scale corpus.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.116.26.90