抽取算法

作品数:169被引量:649H指数:12
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:杨静宇任世锦阮彤叶琪谢飞更多>>
相关机构:北京邮电大学浙江大学南京理工大学南京大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家教育部博士点基金国家社会科学基金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=中文信息学报x
条 记 录,以下是1-4
视图:
排序:
基于密度及文本特征的新闻标题抽取算法被引量:6
《中文信息学报》2018年第10期78-86,共9页彭圳生 巩青歌 高志强 段妍羽 曾子贤 
陕西省中国青年自然科学基金(2015JQ6224)
为从大量的复杂非规范网页结构中自动抽取出新闻标题,该文提出一种基于密度和文本特征的新闻标题抽取算法(title extraction with density and text-features,TEDT)。主要通过融合网页文本密度分布和语言特征的语料判定模型,将网页划分...
关键词:标题抽取 密度分布 文本特征 信息检索 
一种改进的实体关系抽取算法——OptMultiR被引量:2
《中文信息学报》2018年第9期66-74,共9页延浩然 靳小龙 贾岩涛 程学旗 
国家重点研发计划项目(2016YFB1000902;2017YFC0820404);国家自然科学基金(61772501;61572473;61572469;91646120)
作为知识图谱构建过程中的关键步骤,关系抽取这一从海量自然语言文本中抽取实体间关系的任务近年来得到了越来越广泛的关注。如今,远程监督(distant supervision)方法通过与已有知识库(knowledge base)中的实体和关系进行对齐,可以直接...
关键词:关系抽取 远程监督 多实例多标签学习 
基于模式的远监督关系抽取算法被引量:3
《中文信息学报》2017年第4期122-131,共10页王加楠 鲁强 
国家自然科学基金(61402532)
远监督关系抽取算法能够自动将关系库中的关系与无标注的文本对齐,以进行文本中的关系抽取。目前提出的远监督关系抽取算法中,大多数是基于特征的。然而,此类算法在将实例转换为特征时,经常会出现关键信息不突出、数据集线性不可分等问...
关键词:远监督 关系抽取 模式 核方法 
一种基于信息熵的中文高频词抽取算法被引量:22
《中文信息学报》2006年第5期40-43,90,共5页任禾 曾隽芳 
为扩展分词词典,提高分词的准确率,本文提出了一种基于信息熵的中文高频词抽取算法,其结果可以用来识别未登录词并扩充现有词典。我们首先对文本进行预处理,将文本中的噪音字和非中文字符转化为分隔符,这样文本就可以被视为用分隔符分...
关键词:人工智能 自然语言处理 分词 中文抽词 信息熵 高频词 
检索报告 对象比较 聚类工具 使用帮助 返回顶部