基于统计语言模型的双向词类标注方法  被引量:2

A Two-Directions Method of Chinese Corpus Tagging Based on Statistical Language Model

在线阅读下载全文

作  者:刘启和[1] 詹思瑜[1] 杨国纬[1] 

机构地区:[1]电子科技大学计算机学院,成都610054

出  处:《计算机科学》2003年第9期59-60,168,共3页Computer Science

摘  要:1引言 在自然语言处理中,词类标注是一项重要的工作,它为句法分析、机器翻译、自然语言理解等提供语法知识.在进行自然语言的词类标注时,由于词的多词类现象,有许多词在不同的上下文中有不同的词类,汉语词类标注过程其实就是一个词类排歧过程[12].In the paper, we introduce chinese corpus tagging based on statistical language model (bi.gram model)and Huang-Yu's smoothing method. Especially, we also suggest a two.directions method based on statistical language model, namely, we not only compute probability of P(C | W)(W = W1W2W3..., wm),but also compute probability of P (C|wnwn-1......w1). From our experience we can see it can enhance the accuracy of Chinese corpus tagging using this method of two directions computation.

关 键 词:自然语言处理 统计语言模型 双向词类标注方法 知识库 信息处理 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象