应用条件随机场进行汉语词法分析研究被引量：2

Research of applying conditional random fields to Chinese lexical analysis

出　　处：《计算机工程与设计》2007年第2期486-488,共3页Computer Engineering and Design

摘　　要：中文分词是一个困难的、重要的被广泛研究的序列数据建模问题。以往应用条件随机场进行汉语分词时,将分词转化为对汉字的标注,造成了大量的冗余的候选切分,以至于在分词过程中大大降低了分词的速度。提出了使用词图作为基础的标记序列来完成汉语的词法分析,这样充分利用了现有的词典资源,在属性框架的选择时也可以方便地融合语言知识,并且长度歧视及状态歧视方面的影响也被减到最小。提出了应用条件随机场来构建统一的汉语词法分析。Chinese word segmentation is a difficult, important and widely-studied sequence modeling problem. Precious applications applying conditional random fields to Chinese words segmentation convert segmentation to character-based begin/inside tagging caused a number of redundant segmentation candidates which makes in the segmenting process segmenting speed slower. Using the words lattice as the fundamental sequence to be tagged to achieve Chinese lexical analysis is presented. Then the lexicon is used efficiently, and language knowledge is integrated easily in feature template selecting, and influences of label and length bias are minimized. A unified approach is presented for Chinese lexical analysis using conditional random fields.

关键词：汉语词法分析条件随机场最大熵序列数据标记属性函数

分类号：TP391.1[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

应用条件随机场进行汉语词法分析研究被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

应用条件随机场进行汉语词法分析研究 被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

应用条件随机场进行汉语词法分析研究被引量：2