基于混合统计模型的汉语命名实体识别方法被引量：21

A Mixed Statistical Model-Based Method for Chinese Named Entity Recognition

出　　处：《计算机工程与科学》2006年第6期135-139,共5页Computer Engineering & Science

基　　金：国家自然科学基金资助项目(60403050)

摘　　要：本文针对三种重要的命名实体,即人名、地名、组织名,提出了一种隐马尔可夫模型(HMM)和最大熵模型(ME)相结合的汉语命名实体识别的方法。该方法的特点在于使命名实体识别和词性标注两个任务一体化;融合两种统计模型进行命名实体识别,其中HMM从整体上(句子范围内)对命名实体识别进行约束,ME则在局部范围内(当前词的上下文范围)估计一个词串被标记为某种命名实体的概率。实验表明,这种方法能较好地识别上述三种命名实体。This paper presents a method for Chinese Named Entity （NE） recognition using a mixed statistical model. Our NE recognition concentrates on three types of NEs personal names, location names and organization names. This method is characterized as the following two aspects. At first, it provides a unified framework tO incorporate NE recognition and Part-of-Speech lagging together. Secondly, it makes use of two statistical models, taking HMM to contrain the recogni tion in the scope of a sentence, taking ME to calculate the probability of the entity in the context. Experimental results show that the method can effectively recognize the above-mentioned three named entities.

关键词：命名实体识别隐马尔可夫模型最大熵模型

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于混合统计模型的汉语命名实体识别方法被引量：21

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于混合统计模型的汉语命名实体识别方法 被引量：21

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于混合统计模型的汉语命名实体识别方法被引量：21