检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:宗萍[1,2] 施水才[1,2] 王涛[1,2] 吕学强[1,2]
机构地区:[1]北京信息科技大学中文信息处理研究中心,北京100101 [2]北京拓尔思信息技术股份有限公司,北京100101
出 处:《现代图书情报技术》2009年第2期51-55,共5页New Technology of Library and Information Service
基 金:“863”计划重点项目“跨媒体搜索关键技术研究及服务产品开发”(项目编号:2006AA010105);国家自然科学基金项目“基于语义分析和统计的自动主题标引研究”(项目编号:60872133);北京市属高等学校人才强教计划项目“创新团队-智能搜索引擎和文本挖掘”(项目编号:PXM2007_014224_044677)的研究成果之一
摘 要:采用基于条件随机场的方法,对ACE评测的英文语料中的地理行政类型实体(Geographical Political Enti-ties,GPE)及其子类型进行识别。提出一种从ACE语料中选取的特征集,并根据不同的特征组合对GPE识别的贡献与其它特征集进行比较,实验表明该特征集能取得较高的召回率和准确率。This paper detects Geographical Political Entities (GPE) and it subtypes from the English corpus of Automatic Content Extraction (ACE) evaluation, based on Conditional Random Fields (CRFs). A feature set is extracted from the ACE corpus, and contributions of different feature sets to the detection of GPE entities are evaluated in the experiments. The results show that the feature set extracted in this paper can get higher rate of recall and accuracy.
关 键 词:ACE评测 地理行政实体 实体识别 条件随机场 特征选择
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117