抽取

作品数:8767被引量:23464H指数:55
导出分析报告
相关领域:自动化与计算机技术医药卫生更多>>
相关作者:杨静宇余正涛朱巧明程学旗周国栋更多>>
相关机构:北京邮电大学中国科学院哈尔滨工业大学清华大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 作者=余正涛x
条 记 录,以下是1-10
视图:
排序:
融合罪名分类的涉案新闻主题分析方法
《计算机工程》2025年第4期208-216,共9页尹兆良 黄于欣 余正涛 王冠文 艾传鲜 
国家自然科学基金(U21B2027,61972186,62266027,62266028);云南省重大科技专项(202302AD080003,202202AD080003);云南省基础研究项目(202301AT070393,202301AT070471)。
介绍涉案新闻主题分析的应用场景以及现有方法的不足之处。针对这些不足,提出一种融合罪名分类的主题分析模型BERT-ECTM。该模型利用法律文书中的罪名信息作为监督信号,与涉案新闻文本相融合作为主题分析模型的输入,以提高涉案新闻主题...
关键词:文本主题抽取 罪名分类 BERT-ECTM模型 涉案偏好 文本语义 语义特征编码 变分推断 
基于阅读理解的汉越跨语言新闻事件要素抽取方法
《中文信息学报》2024年第6期86-95,共10页朱恩昌 余正涛 高盛祥 黄于欣 郭军军 
国家自然科学基金(U21B2027,U23A20388,62266028);云南省重大科技专项计划项目(202302AD080003,202202AD080003,202303AP140008);云南省基础研究重点项目(202301AS070047);昆明理工大学“双一流”创建联合专项(202201BE070001-021)。
新闻事件要素抽取旨在抽取新闻文本中描述主题事件的事件要素,如时间、地点、人物和组织机构名等。传统的事件要素抽取方法在资源稀缺型语言上性能欠佳,且对长文本语义建模困难。对此,该文提出了基于阅读理解的汉越跨语言新闻事件要素...
关键词:新闻事件要素抽取 长文本语义建模 跨语言知识迁移 阅读理解 
基于孪生对比网络的汉语-东南亚语言多语言平行句对抽取
《模式识别与人工智能》2023年第10期931-941,共11页周远卓 毛存礼 沈政 张思琦 余正涛 王振晗 
国家自然科学基金项目(No.62166023,U21B2027,61972186);云南省科技重大专项项目(No.202103AA080015,202203AA 080004,202302AD080003);云南省基础研究计划项目(No.202301AT070471)资助。
平行句对抽取应用在东南亚稀缺资源语言上性能不佳,主要原因在于缺少训练语料,导致句对抽取模型表征能力较差.因此,文中提出基于孪生对比网络的汉语-东南亚语言多语言平行句对抽取方法,从模型结构、训练策略与数据三方面提升性能.首先,...
关键词:平行句对抽取 对比学习 联合训练 孪生网络 
案件要素异构图的舆情新闻抽取式摘要被引量:1
《计算机工程与应用》2023年第4期112-119,共8页李刚 余正涛 黄于欣 
国家重点研发计划(2018YFC0830105,2018YFC0830100);国家自然科学基金(61972186,61762056,61472168);云南省重大科技专项计划(202002AD080001);云南省高新技术产业专项(201606);云南省基础研究专项面上项目(202001AT070046,202001AT070047);云南省应用基础研究计划重点项目(2019FA023)。
案件舆情摘要是指从与司法案件相关的舆情信息中抽取与案件相关的句子作为摘要。在案件舆情文本中通常包含如涉案人员、案发地点等案件要素,这些案件要素对于摘要生成有着重要的指导意义。因此,针对案件舆情文本的特点,提出一种基于案...
关键词:案件舆情摘要 案件要素 图注意力机制 异构图 
基于回译和比例抽取孪生网络筛选的汉越平行语料扩充方法被引量:4
《计算机工程与科学》2022年第10期1861-1868,共8页王可超 郭军军 张亚飞 高盛祥 余正涛 
国家自然科学基金(61732005,61761026,61866020,61672271,61762056,61972186);国家重点研发计划(2019QY1801,2019QY1802,2019QY1800)。
回译作为翻译中重要的数据增强方法,受到了越来越多研究者的关注。其基本思想为首先基于平行语料训练基础翻译模型,然后利用模型将单语语料翻译为目标语言,组合为新语料用于模型训练。然而在汉-越低资源场景下,训练得到的基础翻译模型...
关键词:汉越平行语料扩充 回译 数据增强 比例抽取 孪生网络 
基于关键词结构编码的涉案微博评价对象抽取模型
《数据采集与处理》2022年第5期1026-1035,共10页王静赟 余正涛 相艳 陈龙 
国家重点研发计划(2018YFC0830105,2018YFC0830101,2018YFC0830100);云南省重大科技专项计划项目(202002AD080001);云南省基础研究专项面上项目(202001AT070047,202001AT070046)。
涉案微博评价对象抽取旨在从微博评论中识别出用户评价的案件对象词项,有助于掌握大众对于特定案件不同方面的舆论。现有方法通常将评价对象抽取视为一个序列标注任务,但并未考虑涉案微博的领域特点,即评论通常围绕正文中出现的案件关...
关键词:结构编码 涉案微博 舆情 评价对象抽取 
基于双嵌入卷积神经网络的涉案微博评价对象抽取
《计算机科学》2021年第12期319-323,共5页王晓涵 谭陈琛 相艳 余正涛 
国家重点研发计划(2018YFC0830105,2018YFC0830101,2018YFC0830100);云南省基础研究专项面上项目(202001AT070047,202001AT070046);国家自然科学基金(61762056,61972186);云南省高新技术产业专项(201606)。
涉案微博的评价对象抽取是一个特定领域的任务,其评价对象词表达多样且含义与通用领域不同,仅依赖于通用领域的词嵌入无法很好地表征这些评价对象词。为此,提出了一种综合利用领域词嵌入和通用词嵌入的涉案微博评价对象抽取方法。首先...
关键词:微博 评价对象抽取 双嵌入 卷积神经网络 
基于语义自适应编码的汉-越伪平行句对抽取方法
《中文信息学报》2021年第9期58-65,共8页郭军军 田应飞 余正涛 高盛祥 闫婉莹 
国家自然科学基金(61732005,61672271,61761026,61762056,61866020);国家重点研发计划(2019QY1802)。
伪平行句对抽取是缓解汉-越低资源机器翻译中数据稀缺问题的关键任务,同时也是提升机器翻译性能的重要手段。传统的伪平行句对抽取方法都是基于语义相似性度量,但是传统基于深度学习框架的语义表征方法没有考虑不同词语语义表征的难易程...
关键词:数据稀缺 语义表征 自适应编码 
基于案件属性感知的案件倾向性抽取式摘要被引量:3
《山西大学学报(自然科学版)》2021年第3期445-453,共9页闫婉莹 郭军军 余正涛 田应飞 李岩 
国家重点研发计划(2018YFC0830105,2018YFC0830100);国家自然科学基金(61866020,61972186,61762056,61472168);。
涉案新闻文本摘要是从法院舆情数据文本中提取与案件相关的文本信息。涉案新闻文本通常包含大量的案件细节信息及案件属性词,并包含准确的主题句凝练,这为涉案新闻文本摘要的抽取带来了极大的挑战,应用于特定领域的文本摘要方法也因此...
关键词:涉案新闻文本摘要 案件属性感知 选择性编码 联合打分与选择 
联合罪名预测的涉案新闻重叠实体关系抽取被引量:2
《南京理工大学学报》2021年第1期46-55,共10页张明芳 余正涛 郭军军 高盛祥 线岩团 
国家重点研发计划(2018YFC0830105,2018YFC0830101,2018YFC0830100);国家自然科学基金(61972186,61761026,61762056);云南省基础研究计划(202001AT070046,202001AS070014,2018FB104);云南省重大科技专项计划(202002AD08001-5);云南省高科技人才项目(201606)。
涉案新闻重叠实体关系抽取对于构建案件知识图谱有着重要意义。传统的方法通过定位关系指示符来抽取重叠实体关系,在涉案新闻中,预测罪名的关键词可以作为定位关系指示符的重要依据。该文提出一种联合罪名预测的涉案新闻重叠实体关系抽...
关键词:涉案新闻 重叠实体关系 罪名预测 强化学习 知识图谱 关系抽取 
检索报告 对象比较 聚类工具 使用帮助 返回顶部