基于统计语言模型的双向词类标注方法被引量：2

A Two-Directions Method of Chinese Corpus Tagging Based on Statistical Language Model

出　　处：《计算机科学》2003年第9期59-60,168,共3页Computer Science

摘　　要：1引言在自然语言处理中,词类标注是一项重要的工作,它为句法分析、机器翻译、自然语言理解等提供语法知识.在进行自然语言的词类标注时,由于词的多词类现象,有许多词在不同的上下文中有不同的词类,汉语词类标注过程其实就是一个词类排歧过程[12].In the paper, we introduce chinese corpus tagging based on statistical language model (bi.gram model)and Huang-Yu's smoothing method. Especially, we also suggest a two.directions method based on statistical language model, namely, we not only compute probability of P(C | W)(W = W1W2W3..., wm),but also compute probability of P (C|wnwn-1......w1). From our experience we can see it can enhance the accuracy of Chinese corpus tagging using this method of two directions computation.

关键词：自然语言处理统计语言模型双向词类标注方法知识库信息处理

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于统计语言模型的双向词类标注方法被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于统计语言模型的双向词类标注方法 被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于统计语言模型的双向词类标注方法被引量：2