基于统计方法的中文姓名识别  被引量:48

Statistical Chinese Person Names Identification

在线阅读下载全文

作  者:刘秉伟[1] 黄萱菁[1] 郭以昆[1] 吴立德[1] 

机构地区:[1]复旦大学计算机科学系,上海200433

出  处:《中文信息学报》2000年第3期16-24,36,共10页Journal of Chinese Information Processing

基  金:上海市教委重点学科基金;国家自然科学基金;日本富士通公司资助

摘  要:本文介绍一个中文姓名的自动识别系统 ,该系统使用从姓名样本库和真实文本语料库中得到的大量统计数据 ,以提高系统识别性能。我们从 1 994年人民日报中随机抽取 1 0 0篇文章作为测试样本 ,实验结果表明 ,准确率和召回率可同时达到 90 %以上。This paper presents an automatic identifying system of Chinese names.The system makes use of a large amount of statistical data,which are extracted from real name library and real text corpus,to enhance its identifying performance.The testing sample,including 100 articles,are extracted from the People's Daily 1994 News Corpus.The experiment shows that the recall and the precision can both reach above 90%.

关 键 词:自动分词 未登录词 中文姓名识别 统计方法 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象