基于统计的中文姓名识别方法研究  被引量:23

The Research of Chinese Names Recognition Method Based on Statistics

在线阅读下载全文

作  者:张锋[1] 樊孝忠[1] 许云[1] 

机构地区:[1]北京理工大学计算机科学工程系,北京100081

出  处:《计算机工程与应用》2004年第10期53-54,77,共3页Computer Engineering and Applications

摘  要:该文在大规模标注语料的基础上统计分析了中文姓名前置词频率、中文姓氏用字频率、中文名字用字频率、中文姓名后置词频率。利用这些统计数据在词语粗分的基础上实现了中文姓名的自动识别,实验测试结果:准确率93.82%、召回率89.37%。This paper prsents a method about Chinese names automatic recognition by analyzing usage frequency of word before Chinese name ,Chinese surname ,Chinese firstname and the word after Chinese name on the basis of large scale corpus.After test,the recall rate and precision rate are respectively93.82%and89.37%.

关 键 词:自动分词 未登录词 中文姓名识别 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象