基于统计方法的中文姓名识别被引量：48

Statistical Chinese Person Names Identification

机构地区：[1]复旦大学计算机科学系,上海200433

出　　处：《中文信息学报》2000年第3期16-24,36,共10页Journal of Chinese Information Processing

基　　金：上海市教委重点学科基金;国家自然科学基金;日本富士通公司资助

摘　　要：本文介绍一个中文姓名的自动识别系统 ,该系统使用从姓名样本库和真实文本语料库中得到的大量统计数据 ,以提高系统识别性能。我们从 1 994年人民日报中随机抽取 1 0 0篇文章作为测试样本 ,实验结果表明 ,准确率和召回率可同时达到 90 %以上。This paper presents an automatic identifying system of Chinese names.The system makes use of a large amount of statistical data,which are extracted from real name library and real text corpus,to enhance its identifying performance.The testing sample,including 100 articles,are extracted from the People's Daily 1994 News Corpus.The experiment shows that the recall and the precision can both reach above 90%.

关键词：自动分词未登录词中文姓名识别统计方法

分类号：TP391.41[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于统计方法的中文姓名识别被引量：48

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于统计方法的中文姓名识别 被引量：48

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于统计方法的中文姓名识别被引量：48