基于HMM的哈萨克语词性标注研究被引量：3

RESEARCH ON KAZAKH PART-OF-SPEECH TAGGING BASED ON HIDDEN MARKOV MODELS

出　　处：《计算机应用与软件》2012年第2期31-33,共3页Computer Applications and Software

基　　金：国家自然科学基金(60763005);国家教育部;国家语委民族语言文字规范标准建设及信息化科研项目(MZ115-92)

摘　　要：词性标注在自然语言信息处理领域中扮演着重要角色,是句法分析、信息抽取、机器翻译等自然语言处理的基础,对于哈萨克语同样如此。在基于词典静态标注的基础上分析了隐马尔科夫模型HMM(H idden M arkovModel)模型参数的选取、数据平滑以及未登录词的处理方法,利用基于统计的方法对哈萨克语熟语料进行训练,然后用V iterb i算法实现词性标注。实验结果表明利用HMM进行词性标注的准确率有所提高。Part-of-speech（POS） tagging plays a key role in natural language information processing.It is the basis of natural language processing including syntactic parsing,information retrieval,and machine translation,etc.,and the same for Kazak as well.In the thesis we analyse the selection of HMM model parameters,data smoothing and the processing approach for new words based on static tagging on dictionary,and use statistics-based means to train mature Kazak corps;then we adopt the Viterbi algorithm to implement part-of-speech tagging.Experimental results show that the preciseness of POS tagging is improved with the use of HMM.

关键词：隐马尔科夫模型哈萨克语词性标注自然语言处理

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于HMM的哈萨克语词性标注研究被引量：3

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于HMM的哈萨克语词性标注研究 被引量：3

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于HMM的哈萨克语词性标注研究被引量：3