基于多层条件随机场的中文命名实体识别  被引量:25

Study on Chinese named entity recognition based on cascaded conditional random fields

在线阅读下载全文

作  者:胡文博[1,2] 都云程[1,2] 吕学强[1,2] 施水才[1,2] 

机构地区:[1]北京信息科技大学中文信息处理研究中心,北京100101 [2]北京拓尔思信息技术有限公司,北京100101

出  处:《计算机工程与应用》2009年第1期163-165,227,共4页Computer Engineering and Applications

基  金:国家高技术研究发展计划(863);北京市属市管高校人才强教计划项目(No.PXM2007_014224_044677,No.PXM2007_014224_044676);北京市教委科技发展计划项目(No.KM200710772010)~~

摘  要:命名实体识别属于自然语言处理的基础研究领域,是信息抽取、信息检索、机器翻译、组块分析、问答系统等多种自然语言处理技术的重要基础。主要研究中文命名实体中对复杂地名和复杂机构名的识别,提出一种基于多层条件随机场的命名实体识别的方法。对大规模真实语料进行开放测试,两项识别的召回率、准确率和F值分别达到91.95%、89.99%、90.50%和90.07%、88.72%、89.39%。Named entity recognition is one of the fundamental problems in many natural language processing applications,such as information extraction,information retrieval,machine translation,shallow parsing and question answering system.This paper mainly researches the recognition of the complex location and complex organization in Chinese named entity.This paper presents a new algorithm of named entity recognition based on cascaded conditional random fields.We experimentally evaluate the algorithm on large-scale corpus.In open test,the recall,precision and F-measure achieves of 2 recognitions are 91.95%,89.99% ,90.50% and 90.07%, 88.72%, 89.39%.

关 键 词:条件随机场 命名实体识别 命名实体 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象