基于统计方法的中文姓名识别研究  被引量:3

Statistical Chinese Personal Name Recognition

在线阅读下载全文

作  者:贾品贵[1] 杨一平[1] 卢朋[1] 

机构地区:[1]中国科学院自动化所综合信息中心,北京100080

出  处:《计算机工程与应用》2006年第31期168-170,共3页Computer Engineering and Applications

摘  要:采用统计方法来识别中文姓名。该方法将中文姓名的识别过程分为姓名候选和姓名确认两个阶段。采用隐马尔可夫模型(HMM)分类器从未经切分的汉字串中候选姓名。利用人名与上下文词汇的互信息对候选人名进行最后的确认。该方法是完全数据驱动的,不需要姓名识别模板和规则。试验结果表明,该方法的召回率为82.7%,准确率为89.6%。Automatic recognition of Chinese personal name is an important part of Chinese Named Entity recognition.A statistical approach for Chinese personal name is presented in this paper.That is:a Hidden Markov Model(HMM) classifier is applied for the extraction of candidate names from character sequence;mutual information between name and its context words is introduced for final recognition of Chinese name.This approach is data-driven without any template or rule.The test experiments show that the precision and recall rate reach 89.6% and 82.7% respectively.

关 键 词:中文姓名识别 基于汉字 隐马尔可夫模型 互信息 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象