面向复杂形态语言机器翻译的多模型融合词性标注研究被引量：1

Research on Multi-Models Combined Part-Of-Speech Tagging for Machine Translation Between Languages with Complex Morphology

作　　者：李晓[1] 蒋同海[1] 周喜[1] 王磊[1] 杨雅婷[1]

机构地区：[1]中国科学院新疆理化技术研究所,乌鲁木齐830011

出　　处：《网络新媒体技术》2014年第1期60-64,共5页Network New Media Technology

基　　金：中国科学院战略性先导科技专项课题"新疆少数民族信息处理"(课题编号:XDA06030400)

摘　　要：针对维汉机器翻译中所存在的效率低下以及数据稀疏等问题,本文提出一种多模型融合的词性标注方法。该方法在维吾尔语浅层形态分析的基础上,结合渐进标注模型(Progressive POS,PPOS)对噪音数据的过滤能力及泛化标注模型(Generalize POS,GPOS)的泛化表示能力,对维吾尔语进行词性标注。实验证明,使用该方法进行维吾尔语词性标注,其标注效果已接近实用。For the Inefficient and data sparse in Uyghur Part-Of-Speech（ POS） tagging,this paper presents a tagging method that merged multi-models. The tagging method based on the shallow morphological analysis of Uyghur,and combined the noise data filtering capability of the Progressive Part-Of-Speech model and generalization capability of the Generalize POS model. Experiments show that with the tagging method mentioned above,the quality of Uyghur Part-Of-Speech tagging is closing to the practical.

关键词：维汉机器翻译维吾尔语词性标注感知器算法泛化复杂形态语言

分类号：TP391.2[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

面向复杂形态语言机器翻译的多模型融合词性标注研究被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

面向复杂形态语言机器翻译的多模型融合词性标注研究 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

面向复杂形态语言机器翻译的多模型融合词性标注研究被引量：1