抽取

作品数:8767被引量:23464H指数:55
导出分析报告
相关领域:自动化与计算机技术医药卫生更多>>
相关作者:杨静宇余正涛朱巧明程学旗周国栋更多>>
相关机构:北京邮电大学中国科学院哈尔滨工业大学清华大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 作者=吕学强x
条 记 录,以下是1-10
视图:
排序:
FGITA:一种基于细粒度对齐的多模态命名实体识别框架
《小型微型计算机系统》2025年第4期769-775,共7页吕学强 王涛 游新冬 赵海兴 才藏太 陈玉忠 
北京市自然科学基金项目(4212020)资助;国家自然科学基金项目(62171043)资助;北京未来区块链与隐私计算高级创新中心、中央引导地方性项目(2020L3024)资助;北京市教育委员会研究与发展计划项目(KM202111232001)资助;图神经网络与数据挖掘应用平台项目(2022-ZJ-T02)资助.
命名实体识别任务旨在识别出非结构化文本中所包含的实体并将其分配给预定义的实体类别中.随着互联网和社交媒体的发展,文本信息往往伴随着图像等视觉模态信息出现,传统的命名实体识别方法在多模态信息中表现不佳.近年来,多模态命名实...
关键词:多模态 命名实体识别 信息抽取 知识图谱 对比学习 
结合关键词指导与大语言模型近端策略优化的专利关键句抽取
《北京信息科技大学学报(自然科学版)》2025年第1期20-29,共10页万甜 吕学强 马登豪 
国家自然科学基金项目(62171043);北京市自然科学基金项目(4232025);青海省创新平台建设专项(2022-ZJ-T02)。
针对现有专利关键句抽取方法对标注数据依赖性强以及大语言模型训练成本高的问题,提出了一种结合关键词指导(keyword guidance,KG)与大语言模型近端策略优化(proximal policy optimization,PPO)的关键句抽取方法KG-PPO。首先,构建关键词...
关键词:关键句抽取 大语言模型 联合匹配模型 近端策略优化 中文专利 
两阶段式专利技术问题抽取方法
《中文信息学报》2025年第1期56-64,78,共10页吕学强 刘兆楠 游新冬 罗艺雄 
国家自然科学基金(62171043);北京市自然科学基金(4212020);国防科技重点实验室基金(6412006200404);北京信息科技大学"勤信人才"培育计划项目(QXTCP B201908);北京市市教委科研计划资助项目(KM202111232001)。
专利技术问题阐明了当前专利所在技术主题下存在的具体问题,同时也是当前专利需要解决的问题。专利中已有的摘要虽然实现了对整体专利文本的信息压缩,但部分专利文本的摘要中缺失了对专利技术问题的描述。针对专利技术问题缺失的情况,...
关键词:专利技术问题 句子抽取 神经网络 
EMSS:一种基于Span匹配的中文实体抽取方法
《小型微型计算机系统》2024年第9期2087-2093,共7页游新冬 刘陌村 韩君妹 吕学强 
国家自然科学基金项目(62171043)资助;北京市自然科学基金项目(4212020)资助;国家语委项目(ZDI145-10,YB145-3)资助;国防科技重点实验室基金项目(6412006200404)资助;北京市市教委科研计划资助项目(KM202111232001)资助;华能集团总部科技项目(HNKJ21-HF43)资助.
基于Span(跨度)的实体抽取模型目前在英文数据集上取得了优异的效果,且已被证明跨度实体抽取比传统的序列标注实体抽取的效果更好.本文提出了一种基于跨度与拼接的中文命名实体抽取模型(EMSS),EMSS使用端到端的span抽取模型,文本经过BER...
关键词:实体抽取 跨度 神经网络 
面向煤矿机电设备领域的三元组抽取方法
《计算机应用》2024年第7期2026-2033,共8页游新冬 问英姿 佘鑫鹏 吕学强 
国家语委项目(ZDI145-10);北京市自然科学基金资助项目(4212020);华能集团总部科技项目(HNKJ21-HF43)。
针对机电设备领域相关语料匮乏、关系类型特征挖掘不充分以及文本包含重叠三元组的问题,提出一种融合提示学习与先验知识以迭代式对抗训练的三元组抽取方法TBPA(Triplet extraction Based on Prompt and Antagonistic training)。首先,...
关键词:煤矿机电设备 三元组抽取 提示学习 迭代式对抗训练 自构语料库 
多特征融合的专利功效短语抽取
《计算机工程与设计》2024年第5期1413-1419,共7页游新冬 赵颖 刘佳琦 吕学强 
国家自然科学基金项目(62171043);北京市自然科学基金项目(4212020);国家语委基金项目(ZDI145-10、YB145-3);国防科技重点实验室基金项目(6412006200404);北京市教育委员会科学研究计划基金项目(KM202111232001)。
为提高专利功效短语抽取的准确率和召回率,保障专利布局等研究工作的高质量进行,提出一种融合多特征的专利功效短语抽取模型。基于Bert-BiLSTM-CRF的整体框架,利用Bert模型对文本进行向量化,融合偏旁部首、五笔、词长+词性等特征输入到B...
关键词:多特征融合 专利功效短语 深度学习 词语抽取 双向长短期记忆模型 条件随机场模型 词向量模型 
面向武器装备领域的复杂三元组抽取方法
《小型微型计算机系统》2024年第3期521-528,共8页游新冬 刘陌村 葛昊杰 肖刚 吕学强 
国防科技重点实验室基金项目(6412006200404)资助;国家自然科学基金项目(62171043)资助.
为解决武器装备领域中单实体重叠和实体对重叠的复杂三元组的抽取问题,提出了挂载武器装备领域知识结合多轮对抗攻击的复杂三元组抽取方法(RDA),该方法通过武器装备领域微调后的Bert获取更具领域语义的文本向量;利用在嵌入层发起多轮对...
关键词:三元组抽取 武器装备领域 复杂命名实体识别 单层指针网络 多轮对抗攻击 RDA 
稀疏样本下长术语的抽取方法
《数据分析与知识发现》2024年第1期135-145,共11页吕学强 杨雨婷 肖刚 李育贤 游新冬 
国家自然科学基金项目(项目编号:62171043);国防科技重点实验室基金项目(项目编号:6412006200404);北京市自然科学基金项目(项目编号:4212020)的研究成果之一。
【目的】为解决武器装备领域样本稀疏和长术语难以识别的问题,提出头尾指针和主动学习相结合的方法。【方法】首先,使用BERT预训练语言模型得到词向量表示,利用头尾指针网络对长术语进行抽取;然后提出新的主动学习采样策略,在未标注样...
关键词:术语抽取 主动学习 头尾指针网络 BERT 武器装备 
融合关键信息的科技文献创新点生成方法被引量:1
《计算机工程与设计》2023年第4期1267-1273,共7页李宝安 刘翔 王宗辉 吕学强 游新冬 
国家自然科学基金项目(62171043);北京市自然科学基金项目(4212020);国防科技重点实验室基金项目(6412006200404);北京信息科技大学“勤信人才”培育计划基金项目(QXTCP B201908);北京市市教委科研计划基金项目(KM202111232001)。
相较传统的阅读方式,利用摘要生成等技术生成文献的创新点存在正确性低、事实准确性差、与原文的关键信息有偏差等问题。据此,提出一种融合关键信息的科技文献创新点生成方法,在该领域构建一个中文长文本-生成创新点语料库,提出一个领...
关键词:创新点生成 摘要生成 知识抽取 强化学习 指针网络 事实准确性 语料库构建 
一种融合实体类别特征的医疗领域关系抽取方法被引量:1
《北京信息科技大学学报(自然科学版)》2022年第6期19-25,共7页游新冬 赵明智 王星予 徐戈 吕学强 
国家自然科学基金资助项目(62171043);国家语委资助项目(ZDI145-10,YB145-3);北京市自然科学基金资助项目(4212020);中央引导地方资助项目(2020L3024)。
关系抽取是自然语言处理中的核心任务,也是构建医疗领域知识图谱中的关键问题。现有的关系抽取方法鲜有融合实体类别的特征,针对医疗领域中实体类别的特点,提出一种融合实体类别特征的医疗领域关系抽取方法CBBS(category BERT BiLSTM Si...
关键词:关系抽取 实体类别 BERT 序列标注 混合模型 
检索报告 对象比较 聚类工具 使用帮助 返回顶部