基于Naive Bayes的中文人名识别研究  被引量:2

Chinese Person Name Recognition Based on Naive Bayes

在线阅读下载全文

作  者:曾辉[1] 王俊[1] 熊李艳[1] 

机构地区:[1]华东交通大学信息工程学院,南昌330013

出  处:《科学技术与工程》2015年第6期83-86,98,共5页Science Technology and Engineering

基  金:国家自然科学基金(61363072);教育部人文社科基金(11YJC740157;09YJC740027);江西省自然科学基金(20114BAB201027)资助

摘  要:在传统的只统计人名用字的Naive Bayes分类算法的基础上,将人名上下文边界融入其中,并利用从大规模语料库中统计的人名用字、边界模板频率对人名定界,再通过扩散操作召回遗漏人名。该方法简单易行,并能取得很好的效果。实验结果表明,其F值达到了93.28%。On the basis of the traditional Naive Bayesian classification algorithm that just considered character of Chinese person name,person name's up and down boundary words was brought in it. In order to overcome the difficulty of boundary defining,Chinese name 's character frequency and boundary templates ' frequency were counted from tagged corpus. Then these recognized person names are used to match the missed occurrence in the text. The method is easy and the final result is good. Experimental results show that the F-value for recognition of Chinese person name was increased.

关 键 词:NAIVE BAYES 分类算法 边界模板 人名识别 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象