基于最大熵模型的中文姓名识别  被引量:5

Identification of Chinese Names Based on Maximum Entropy Model

在线阅读下载全文

作  者:贾宁[1] 张全[2] 

机构地区:[1]中国科学院研究生院,北京100039 [2]中国科学院声学研究所,北京100080

出  处:《计算机工程》2007年第9期31-33,共3页Computer Engineering

基  金:国家"973"计划基金资助项目"自然语言理解的交互引擎研究"(2004CB318104);中国科学院声学研究所创新资助项目

摘  要:最大熵模型可以对非常广泛的自然语言现象建立概率模型,该文提出了一种使用统计模型的中文姓名识别方法,采用最大熵原则建立统计模型,并运用该模型计算姓名概率。系统采用真实语料进行开放测试的结果表明,在保证一定准确率的情况下,系统召回率可达90%以上。Maximum entropy model can be used to found probability model of many natural language problem. This paper presents an approach for Chinese name recognition based on statistic model. It founds the model with maximum entropy principle, and calculates name probability by the model. It gets good recalling rates and precision by open test on actual corpus. The method is practicable.

关 键 词:中文姓名识别 最大熵 特征函数 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象