检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:胡文博[1,2] 都云程[1,2] 吕学强[1,2] 施水才[1,2]
机构地区:[1]北京信息科技大学中文信息处理研究中心,北京100101 [2]北京拓尔思信息技术有限公司,北京100101
出 处:《计算机工程与应用》2009年第1期163-165,227,共4页Computer Engineering and Applications
基 金:国家高技术研究发展计划(863);北京市属市管高校人才强教计划项目(No.PXM2007_014224_044677,No.PXM2007_014224_044676);北京市教委科技发展计划项目(No.KM200710772010)~~
摘 要:命名实体识别属于自然语言处理的基础研究领域,是信息抽取、信息检索、机器翻译、组块分析、问答系统等多种自然语言处理技术的重要基础。主要研究中文命名实体中对复杂地名和复杂机构名的识别,提出一种基于多层条件随机场的命名实体识别的方法。对大规模真实语料进行开放测试,两项识别的召回率、准确率和F值分别达到91.95%、89.99%、90.50%和90.07%、88.72%、89.39%。Named entity recognition is one of the fundamental problems in many natural language processing applications,such as information extraction,information retrieval,machine translation,shallow parsing and question answering system.This paper mainly researches the recognition of the complex location and complex organization in Chinese named entity.This paper presents a new algorithm of named entity recognition based on cascaded conditional random fields.We experimentally evaluate the algorithm on large-scale corpus.In open test,the recall,precision and F-measure achieves of 2 recognitions are 91.95%,89.99% ,90.50% and 90.07%, 88.72%, 89.39%.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117