抽取

作品数:8767被引量:23464H指数:55
导出分析报告
相关领域:自动化与计算机技术医药卫生更多>>
相关作者:杨静宇余正涛朱巧明程学旗周国栋更多>>
相关机构:北京邮电大学中国科学院哈尔滨工业大学清华大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 学科=自动化与计算机技术—控制科学与工程x
条 记 录,以下是1-10
视图:
排序:
融合罪名分类的涉案新闻主题分析方法
《计算机工程》2025年第4期208-216,共9页尹兆良 黄于欣 余正涛 王冠文 艾传鲜 
国家自然科学基金(U21B2027,61972186,62266027,62266028);云南省重大科技专项(202302AD080003,202202AD080003);云南省基础研究项目(202301AT070393,202301AT070471)。
介绍涉案新闻主题分析的应用场景以及现有方法的不足之处。针对这些不足,提出一种融合罪名分类的主题分析模型BERT-ECTM。该模型利用法律文书中的罪名信息作为监督信号,与涉案新闻文本相融合作为主题分析模型的输入,以提高涉案新闻主题...
关键词:文本主题抽取 罪名分类 BERT-ECTM模型 涉案偏好 文本语义 语义特征编码 变分推断 
基于知识图谱的电力调度自动化作业工作票生成方法
《福州大学学报(自然科学版)》2025年第2期135-143,共9页李泽科 陈书里 陈斌 陈荃韡 杨旭 许贻杰 刘延华 
福建省自然科学基金资助项目(2021J01625);国网福建省电力有限公司科技项目(521300230007)。
针对电力调度自动化作业工作票自动生成问题,采用基于上下文信息的多源数据处理方法,将作业文档转化为结构化记录和非结构化文本;通过设计融合类别信息的实体关系联合抽取模型,结合双向编码器表示等技术,对作业文档中的实体和关系进行抽...
关键词:工作票 电力调度自动化 知识图谱 实体关系抽取 
基于位置特征与语义分割的方面级情感三元组抽取方法
《成都信息工程大学学报》2025年第2期143-150,共8页杨爱琳 吴震 王燚 黄超 杨渭平 
四川省科技计划资助项目(2023YFG0292、2021ZYD0011);国家社会科学基金资助项目(23BSH061);四川省社会科学资助项目(SC21B034)。
方面情感三元抽取任务定义为识别句子中的方面术语、情感极性和意见术语。近期一种端到端的网格标注方法有效缓解了流水线框架中误差传播的问题,却忽略了字符间的位置关系以及局部上下文信息,导致模型无法充分挖掘文本中的局部情感特征...
关键词:三元抽取 语义分割 位置编码 情感分析 网格标注 
多模态信息抽取研究综述
《软件学报》2025年第4期1665-1691,共27页王永胜 李培峰 王中卿 朱巧明 
国家自然科学基金(62276177,61836007);江苏高校优势学科建设工程项目。
多模态信息抽取任务是指从非结构化或半结构化的多模态数据(包含文本和图像等)中提取结构化知识.其研究内容主要包含多模态命名实体识别、多模态实体关系抽取和多模态事件抽取.首先对多模态信息抽取任务进行分析,然后对多模态命名实体...
关键词:多模态信息抽取 多模态命名实体识别 多模态实体关系抽取 
基于实体类别信息的数据分析与关系抽取模型构建
《吉林大学学报(理学版)》2025年第2期428-436,共9页杨航 张啸成 张永刚 
吉林省自然科学基金(批准号:20200201447JC)。
针对文档级关系抽取任务中的实体多提及问题和实体对噪音问题,使用实体的类别信息,提出一个基于实体类别信息的关系抽取模型(EUT模型),该模型通过实体类别判断和类别对产生的关系类别先验两个子任务提高关系抽取结果.实体类别判断任务...
关键词:文档级关系抽取 知识图谱 结构化先验 自然语言处理 
面向低资源关系抽取的自训练方法
《软件学报》2025年第4期1620-1636,共17页郁俊杰 王星 陈文亮 张民 
国家自然科学基金(62376177,61936010)。
自训练是缓解标注数据不足问题的常见方法,其通常做法是利用教师模型去获取高置信度的自动标注数据作为可靠数据.然而在低资源场景关系抽取任务上,该方法不仅存在教师模型泛化能力差的问题,而且受到关系抽取任务中易混淆关系类别的影响...
关键词:自然语言处理 信息抽取 关系抽取 低资源 自训练 
融合大规模医学事实的跨语言双层知识图谱
《软件学报》2025年第3期1240-1253,共14页王楚童 李明达 孙孟轩 王静 杨雪冰 牛景昊 贺志阳 张文生 
科技创新2030—“新一代人工智能”重大项目(2018AAA0102100);国家自然科学基金(62203437)。
得益于信息化技术的快速发展和医疗信息系统的普及,医学数据库中积淀了海量的医学事实,如患者临床诊疗事件以及医学专家共识等.如何从医学事实中提炼出知识,进而对其管理和合理利用,是推进诊疗自动化和智能化的关键.知识图谱作为一种新...
关键词:医学事实 医疗知识图谱 双层知识表示 信息抽取 知识融合 
基于大语言模型技术的古籍限定域关系抽取及应用研究
《情报学报》2025年第2期200-219,共20页刘畅 张琪 王东波 沈思 吴梦成 刘浏 苏雨诗 
国家社会科学基金重大项目“中国古代典籍跨语言知识库构建及应用研究”(21&ZD331)。
古籍文本中的细粒度知识单元的自动抽取和结构化能够为群体传记、历史地图等古籍数字人文研究提供数据基础。基于判别式模型的抽取方法严重受制于古汉语本身语义的复杂性和训练样本的缺失,抽取效果和领域迁移的效果受到影响,相关研究亟...
关键词:大语言模型 古籍智能 限定域关系抽取 AI生成数据 数字人文 
基于深度学习的中共党史知识图谱构建被引量:1
《图书馆论坛》2025年第2期22-34,共13页岳文玉 曹树金 曹茹烨 赵怡珑 
国家社会科学基金社科学术社团主题学术活动资助课题研究类项目“中国共产党历史知识图谱与知识索引构建研究”(项目编号:21STA028);2024年度福建省习近平新时代中国特色社会主义思想研究中心项目“面向党史学习教育的中国共产党历史知识图谱构建及应用研究”(项目编号:FJ2024XZB037);2024年度福建省习近平新时代中国特色社会主义思想研究中心研究基地专项项目“习近平总书记关于党史重要论述的知识挖掘研究”研究成果。
利用深度学习技术对权威党史资料中大量且多类型的实体知识进行细粒度的知识组织和挖掘,有助于实现党史知识的二次增值,提高权威党史资料的利用效率。文章以党史学习教育用书出版座谈会指定的四本权威党史图书为主要数据集构建党史知识...
关键词:知识图谱 中共党史 大语言模型(LLM) 知识抽取 Bert4keras 
基于多语义表示的两阶段交互式论点对抽取方法
《北京邮电大学学报》2025年第1期14-20,共7页于宁 石宇 刘建毅 
国家自然科学基金项目(U21B2020);北京邮电大学中央高校基本科研业务费项目(2021XD-A11-3)。
交互式论点对抽取的目的是从两篇相关的论辩性文本中抽取出多对具有交互性的论点对。现有的方法将该任务分解为论点挖掘和论点对抽取两个子任务,并对子任务进行联合建模,进行多任务学习。然而,在这类方法中,两个不同的子任务共享相同的...
关键词:多语义表示 大语言模型 交互式论点对抽取 
检索报告 对象比较 聚类工具 使用帮助 返回顶部