基于统计方法的中文姓名识别  被引量:34

Identification of Chinese Names Based on Statistics

在线阅读下载全文

作  者:黄德根[1] 杨元生[1] 王省[1] 张艳丽[1] 钟万勰[2] 

机构地区:[1]大连理工大学计算机科学与工程系,大连116024 [2]大连理工大学工程力学研究所,大连116024

出  处:《中文信息学报》2001年第2期31-37,44,共8页Journal of Chinese Information Processing

摘  要:专有名词的识别对自动分词有重要意义。本文针对如何识别中文姓名做了有益的尝试 ,主要采用基于统计方法 ,进行中文姓名识别。本文建立了有监督学习机制 ,提出了句子切分结果可信度等概念 ,并在此基础上建立了较好的统计模型 ,系统闭式精确率和召回率分别达 95 .97%和 95 .5 2 % ,开式精确率和召回率分别达 92 .37%和 88.6 2 %Identification of Chinese names is one of important techniques to improve the accuracy of automatic word segmentation. This paper proposes an effective model based on statistics to identify Chinese names. It establishes rewards punishment mechanism and supervised learning mechanism, and presents the reliability for the word segmentation in the model. The experiments show that the precision and recall rate respectively reach 95.97% and 95.52% by close test, while the precision and recall rate are 92.37% and 88.62% by open test.

关 键 词:双词同现频度 单词频度 学习机制 中文姓名识别 自动分词 统计模型 召回率 可信度 

分 类 号:TP391.43[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象