抽取

作品数:8714被引量:23334H指数:55
导出分析报告
相关领域:自动化与计算机技术医药卫生更多>>
相关作者:杨静宇余正涛朱巧明程学旗周国栋更多>>
相关机构:北京邮电大学中国科学院哈尔滨工业大学清华大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=中文信息学报x
条 记 录,以下是1-10
视图:
排序:
两阶段式专利技术问题抽取方法
《中文信息学报》2025年第1期56-64,78,共10页吕学强 刘兆楠 游新冬 罗艺雄 
国家自然科学基金(62171043);北京市自然科学基金(4212020);国防科技重点实验室基金(6412006200404);北京信息科技大学"勤信人才"培育计划项目(QXTCP B201908);北京市市教委科研计划资助项目(KM202111232001)。
专利技术问题阐明了当前专利所在技术主题下存在的具体问题,同时也是当前专利需要解决的问题。专利中已有的摘要虽然实现了对整体专利文本的信息压缩,但部分专利文本的摘要中缺失了对专利技术问题的描述。针对专利技术问题缺失的情况,...
关键词:专利技术问题 句子抽取 神经网络 
面向垂直领域上下文特性的少样本关系抽取方法
《中文信息学报》2025年第1期65-78,共14页任浩 李韧 杨建喜 肖桥 杨小霞 蒋仕新 王笛 
国家自然科学基金(62003063);重庆市自然科学基金(CSTB2023NSCQ-MSX0145);重庆市教委科学技术研究项目(KJZD-M202300703)。
现有的少样本关系抽取解决方案主要基于通用领域语料,尚未充分考虑垂直领域中存在的长文本、关系重叠等问题,面对垂直领域上下文时其关系抽取性能有待提升。针对上述问题,该文以桥梁检测领域和医疗健康领域为背景,提出了一种面向垂直领...
关键词:少样本关系抽取 垂直领域 RoBERTa 原型网络 
一种注意力引导知识增强的事件因果关系识别方法
《中文信息学报》2025年第1期89-100,共12页徐博 孙晋辰 林鸿飞 宗林林 
辽宁省社会科学规划基金(L22CTQ002)。
事件因果关系识别是自然语言处理领域的重要任务,由于因果关系表达方式多样且以隐式表达为主,现有方法难以准确识别。该文将外部结构化知识融入事件因果关系识别任务,提出一种注意力引导知识增强的事件因果关系识别方法。首先,通过BERT...
关键词:事件抽取 因果识别 知识图谱 注意力机制 自然语言处理 
融合词先验知识的MOOCs课程概念抽取
《中文信息学报》2025年第1期101-111,120,共12页聂凡 刘德喜 张子靖 刘喜平 廖国琼 万常选 
国家自然科学基金(62272206,62272205,62462034);江西省主要学科学术和技术带头人培养计划领军人才项目(20213BCJL22041);江西省自然科学基金(20212ACB202002,20242BAB25119);江西省教育厅科学技术研究项目(GJJ2200501)。
针对中文大规模开放在线课程(Massive Open Online Courses,MOOCs)视频字幕中课程概念词性丰富、领域特性显著等特点,该文提出一种融合词性、词性规则和词典等词先验知识(Word Prior Knowledge,WPK)的课程概念抽取模型WPK-MCC。该模型...
关键词:课程概念抽取 词先验知识 词汇集群 全局信息 
基于知识迁移的情感—原因对抽取
《中文信息学报》2025年第1期121-132,共12页赵凤园 刘德喜 万齐智 刘喜平 廖国琼 万常选 
国家自然科学基金(62272206,62272205,62462034);江西省主要学科学术和技术带头人培养计划领军人才项目(20213BCJL22041);江西省自然科学基金(20212ACB202002,20242BAB25119);江西省教育厅科学技术研究项目(GJJ2200501)。
现有的情感—原因对抽取模型均没有通过加入外部知识来提升情感—原因对的抽取效果。该文提出基于知识迁移的情感—原因对抽取模型(ECPE-KT),采用知识库获取文本的显性知识编码;随后引入外部情感分类语料库迁移得到子句的隐性知识编码;...
关键词:情感—原因对抽取 知识辅助 相对位置 预测概率 
数字人文视域下的青藏高原文旅知识图谱构建研究——以塔尔寺为例
《中文信息学报》2024年第12期97-105,共9页李鑫豪 赵维纳 马龙龙 安波 
国家自然科学基金(62266036);科技援藏援疆援青专项(202104e11020006);省部共建藏语智能信息处理及应用国家重点实验室自主课题基金(2022-SKL-012);中国社会科学院数据库专项资助(2024SJK017);国家社会科学基金(22BTQ010)。
青藏地区素有“高原文化宝库”之称。然而受闭塞的交通条件和较滞后的经济水平的限制,青藏地区文旅资源的保护与弘扬工作始终处于滞后状态。为改善这一现状,该文以数字人文为导向,提出一套文旅知识图谱构建范式,在提示学习框架下采用联...
关键词:青藏文化 提示学习 联合抽取 塔尔寺知识图谱 
基于图结构特征和语义关联度的无监督藏文关键短语抽取方法
《中文信息学报》2024年第11期70-78,共9页章菁 李镀 杨进 任航 羊琴 群诺 
国家自然科学基金(62162057,61872254);新一代人工智能国家科技重大专项(2022ZD0116100);四川省科学技术计划(2021JDRC0004);西藏大学研究生高水平人才培养项目(2022-GSP-S100)。
在资源稀缺、语义结构复杂的藏文语境下,关键短语抽取是一项具有挑战性的自然语言处理任务。现有藏文关键短语抽取方法依赖于词频和位置等统计特征,忽略了词汇间的语义关系。该文提出了一种基于图结构特征和语义关联度的无监督藏文关键...
关键词:藏文关键短语抽取 图结构特征 语义关联度 
基于多任务联合学习的多片段机器阅读理解方法研究
《中文信息学报》2024年第11期79-90,共12页张虎 范越 李茹 
国家自然科学基金(62176145)。
片段抽取式阅读理解是机器阅读理解任务中的一项重要研究内容,现有的相关研究主要关注单片段抽取,然而,实际应用中很多阅读理解问题的答案由文本的多处不连续片段组成,这使得多片段抽取式阅读理解研究受到越来越多的关注。已有的多片段...
关键词:机器阅读理解 多片段抽取 自然语言理解 多任务联合学习 
面向属性级情感三元组抽取的情感融合数据增强方法
《中文信息学报》2024年第11期114-122,共9页杨帆 张冕 周夏冰 张民 
国家自然科学基金(62176174);江苏高校优势学科建设工程资助项目。
针对属性级情感三元组抽取任务数据稀缺的问题,该文提出一种融合实例相关情感信息的数据增强方法。首先,以机器阅读理解的形式训练情感分类器,用于获取意见词对属性词所表达情感的稠密向量表示;其次,在情感稠密向量表示的指导下,以掩码...
关键词:数据增强 属性级情感三元组抽取 掩码语言模型 
结合全局对应矩阵和相对位置信息的古汉语实体关系联合抽取
《中文信息学报》2024年第11期35-45,共11页胡益裕 左家莉 涂传龙 曾雪强 万中英 王明文 
国家自然科学基金(62466027,61866018,62266023,62266021);江西省教育厅科学技术研究项目(GJJ2200330)。
目前,基于全局对应矩阵的联合抽取模型在英文领域和现代汉语领域的实体关系抽取任务上取得了SOTA(state-of-the-art)结果,然而在古汉语实体关系抽取任务上表现相对较差。这首先由于当前的古汉语实体关系数据集具有数据规模小、数据标注...
关键词:古汉语数据集构建 实体关系联合抽取 全局对应矩阵 相对位置信息 
检索报告 对象比较 聚类工具 使用帮助 返回顶部