刘利

作品数:2被引量:19H指数:2
导出分析报告
供职机构:西南交通大学信息科学与技术学院更多>>
发文主题:词频统计词频成词机构名识别信息抽取更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机应用与软件》《计算机应用研究》更多>>
所获基金:国家自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-2
视图:
排序:
基于多特征融合的网页正文信息抽取被引量:4
《计算机应用与软件》2014年第7期47-49,77,共4页刘利 戴齐 尹红风 贾真 胡万亭 
国家自然科学基金项目(61152001;61170111);中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题(20110102)
当今主流网页分为单正文体网页和多正文体网页。这些网页的正文信息都具有多个正文特征。想要准确定位正文信息所在位置,可以从其所具有的多个特征和网页设计者的设计习惯着手。鉴于此,融合这些特征提出一种基于多特征融合的网页正文信...
关键词:单正文体 多正文体 多特征 信息抽取 
一种基于词频统计的组织机构名识别方法被引量:15
《计算机应用研究》2013年第7期2014-2016,共3页胡万亭 杨燕 尹红风 贾真 刘利 
国家自然科学基金资助项目(61152001;61170111);中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题(20110102)
命名实体识别是自然语言处理必不可少的重要部分,其中组织机构名识别占了很大的比例。提出了基于词频统计的组织机构名识别方法。训练数据主要通过百度百科词条整理得到。训练时,利用百度百科词条名在词条文本中的频数统计进行机构构成...
关键词:统计 词频 机构名构成词 组织机构名识别 
检索报告 对象比较 聚类工具 使用帮助 返回顶部