抽取

作品数:8767被引量:23464H指数:55
导出分析报告
相关领域:自动化与计算机技术医药卫生更多>>
相关作者:杨静宇余正涛朱巧明程学旗周国栋更多>>
相关机构:北京邮电大学中国科学院哈尔滨工业大学清华大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 作者=周国栋x
条 记 录,以下是1-10
视图:
排序:
属性抽取研究综述被引量:5
《软件学报》2023年第2期690-711,共22页徐庆婷 洪宇 潘雨晨 姚建民 周国栋 
国家重点研发计划(2020YFB1313601);国家自然科学基金(62076174,62076175);江苏省研究生科研与实践创新计划(KYCX21_2955)。
属性抽取是一种自动识别和提取属性表述文字的自然语言处理任务.首先重温了属性抽取的基本任务、权威数据资源和通用评测规范,并在此基础上全面回顾了现有前沿技术,包括基于统计策略和特征工程的传统抽取技术以及利用深度学习的神经抽...
关键词:自然语言处理 属性抽取 深度学习 
基于知识蒸馏与模型集成的事件论元抽取方法被引量:1
《计算机工程》2022年第7期97-103,共7页王士浩 王中卿 李寿山 周国栋 
国家自然科学基金(61806137,61702518);江苏省高等学校自然科学研究面上项目(18KJB520043)。
目前先进的事件论元抽取方法通常使用BERT模型作为编码器,但BERT巨大的参数量会降低效率,使模型无法在计算资源有限的设备中运行。提出一种新的事件论元抽取方法,将事件论元抽取教师模型蒸馏到2个不同的学生模型中,再对2个学生模型进行...
关键词:事件论元抽取 知识蒸馏 模型集成 预训练语言模型 模型压缩 
基于产品建模的评论问题生成研究
《计算机科学》2022年第2期272-278,共7页肖康 周夏冰 王中卿 段湘煜 周国栋 张民 
国家自然科学基金青年科学基金项目(61806137,61702518)。
问题自动生成是自然语言处理领域的一个研究热点,旨在从文本中生成自然问句。随着电子商务的不断发展,网络上产生了大量关于产品的评论。面对海量的评价信息,如何快速挖掘产品信息相关的关键评价,从而生成与产品各个层面息息相关的问答...
关键词:问题生成 指针模型 注意力机制 联合学习 属性抽取 
基于门控图卷积与动态依存池化的事件论元抽取被引量:5
《计算机科学》2021年第S02期52-56,共5页王士浩 王中卿 李寿山 周国栋 
国家自然科学基金青年科学基金项目(61806137)。
事件论元抽取是事件抽取任务中一个极具挑战性的子任务。该任务旨在抽取事件中的论元及论元扮演的角色。研究发现,句子的语义特征和依存句法特征对事件论元抽取都有着非常重要的作用,现有的方法往往未考虑如何将两种特征有效地融合起来...
关键词:事件论元抽取 图卷积 依存句法特征 语义特征 门控机制 
基于框架语义扩展训练集的有监督事件检测方法被引量:4
《中文信息学报》2019年第5期82-92,131,共12页张婧丽 周文瑄 洪宇 姚建民 周国栋 朱巧明 
国家自然科学基金(61672367;61672368;61773276);国防部科技战略先导计划(17-ZLXD-XX-02-06-04)
事件检测是信息抽取领域的一个重要研究方向,目前的事件检测方法往往受限于数据稀疏、语料例句分布不平衡和歧义问题。该文研究发现框架语义知识库FrameNet(FN)含有丰富的已标注框架的语料,并且FN中定义的框架和事件检测中定义的事件具...
关键词:事件检测 信息抽取 框架语义 
基于注意力机制与文本信息的用户关系抽取被引量:8
《中文信息学报》2019年第3期87-93,共7页赵赟 吴璠 王中卿 李寿山 周国栋 
国家自然科学基金(61331011;61672366)
随着社交媒体的发展,用户之间的关系网络对于社交媒体的分析有很大的帮助。因此,该文主要研究用户好友关系检测。以往的关于用户好友关系抽取的研究主要基于社交媒体上的结构化信息,比如其他好友关系,用户的不同属性等。但是,很多时候...
关键词:好友判断 关系预测 社交网络 注意力机制 
基于双向LSTM网络的不确定和否定作用范围识别被引量:6
《软件学报》2018年第8期2427-2447,共21页钱忠 李培峰 周国栋 朱巧明 
国家自然科学基金(61331011;61472265;61772354);江苏省科技计划(BK20151222)~~
不确定和否定信息抽取,是自然语言处理领域中的重要任务和研究热点.针对不确定和否定作用范围识别任务,提出一种基于两层双向LSTM神经网络的作用范围识别方法.首先,对于从线索词到达词语的句法路径,使用第1层双向LSTM神经网络从中学习...
关键词:信息抽取 不确定和否定信息 作用范围识别 LSTM神经网络 Bioscope语料 
中文嵌套命名实体识别语料库的构建被引量:14
《中文信息学报》2018年第8期19-26,共8页李雁群 何云琪 钱龙华 周国栋 
国家自然科学基金(61373096;61331011;61673290)
嵌套命名实体含有丰富的实体和实体间语义关系,有助于提高信息抽取的效率。由于缺少统一的标准中文嵌套命名实体语料库,目前中文嵌套命名实体的研究工作难于比较。该文在已有命名实体语料的基础上采用半自动化方法构建了两个中文嵌套命...
关键词:中文嵌套命名实体识别 条件随机场 信息抽取 语料库 
自动关键词抽取研究综述被引量:92
《软件学报》2017年第9期2431-2449,共19页赵京胜 朱巧明 周国栋 张丽 
国家自然科学基金(61272260;61273320)~~
自动关键词抽取是从文本或文本集合中自动抽取主题性或重要性的词或短语,是文本检索、文本摘要等许多文本挖掘任务的基础性和必要性的工作.探讨了关键词和自动关键词抽取的内涵,从语言学、认知科学、复杂性科学、心理学和社会科学等多...
关键词:自动关键词抽取 机器学习 统计 主题 语言网络图 
基于整数线性规划的商家属性抽取研究被引量:1
《中文信息学报》2017年第6期190-195,204,共7页孙庆英 王中卿 朱巧明 周国栋 
国家自然科学基金(61272260;61773276);江苏省科技计划(BK20151222)
商家属性是指商家本身具备的一些属性,比如就餐环境、停车位等。商家属性对于用户决策有很大的帮助,比如用户开车去就餐,就会关心饭店是否提供停车位。该文提出了一种新的基于整数线性规划的商家属性抽取模型,用来自动地从评论文本中抽...
关键词:商家属性 属性抽取 整数线性规划 最大熵 
检索报告 对象比较 聚类工具 使用帮助 返回顶部