肖诗斌

作品数:39被引量:321H指数:9
导出分析报告
供职机构:北京信息科技大学计算机学院更多>>
发文主题:RSS自然语言处理TRS中文信息处理支持向量机更多>>
发文领域:自动化与计算机技术文化科学交通运输工程语言文字更多>>
发文期刊:《北京信息科技大学学报(自然科学版)》《情报学报》《信息系统工程》《计算机工程》更多>>
所获基金:国家自然科学基金北京市教委科技发展计划国家高技术研究发展计划北京市属高等学校人才强教计划资助项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
图检索增强生成研究综述
《人工智能与机器人研究》2025年第2期402-413,共12页周俭航 肖诗斌 
近年来,通过整合外部知识库来提高大语言模型(LLM)的性能,检索增强生成(RAG)取得了显著的成功。通过引用外部知识库,RAG可以完善LLM输出,从而有效解决幻觉、缺乏领域特定知识和过时信息等问题。然而,数据库中不同实体之间复杂的关系结...
关键词:GraphRAG 大语言模型 检索增强生成 
基于深度学习的生成式文本摘要综述被引量:2
《软件导刊》2024年第5期212-220,共9页陈明轩 肖诗斌 王洪俊 
随着互联网飞速发展,文本数据呈现指数级增长,为文档管理、文本分类、信息检索等文本处理任务带来了前所未有的挑战。研究人员虽然开发了各种基于深度学习(DL)的生成式摘要(ATS)模型,但大部分最先进的ATS模型均基于DL架构,基于DL的生成...
关键词:自动文本摘要 深度学习 生成式摘要 自然语言处理 自然语言生成 
基于改进CRNN算法的专利附图标记识别
《软件导刊》2022年第12期38-45,共8页孙雪姣 肖诗斌 都云程 
北京市海淀区发展和改革委员会项目(2019-2021)。
基于深度学习技术对机械领域的专利附图进行研究,充分发掘与利用专利附图信息,寻求专利检索的补充手段,提出一种基于改进CRNN算法的专利附图标记识别方法CRNN_Eca。将特征提取的骨干网络改为ResNet34,融合ECA-Net中的ECA模块构成Eca-Res...
关键词:专利附图标记 文本识别 注意力机制 自然语言处理 深度学习 
基于ECA-Net与多尺度结合的细粒度图像分类方法被引量:22
《计算机应用研究》2021年第11期3484-3488,共5页毛志荣 都云程 肖诗斌 施水才 
针对细粒度图像分类问题提出了一种有效的算法以实现端到端的细粒度图像分类。ECA-Net中ECA(efficient channel attention)模块是一种性能优势显著的通道注意力机制,将其与经典网络ResNet-50进行融合构成新的基础卷积神经网络ResEca;通...
关键词:注意力机制 深度学习 细粒度图像分类 多尺度 
多项选择式机器阅读理解综述被引量:1
《北京信息科技大学学报(自然科学版)》2021年第5期91-96,共6页马晨辉 施水才 肖诗斌 
对近几年迅速发展的多项选择式机器阅读理解的研究进展进行了归纳总结。首先介绍了多项选择式阅读理解的任务以及评价方法;其次介绍了当前多项选择式阅读理解的数据集;然后对多项选择式机器阅读理解的传统特征匹配方法进行了梳理,并概...
关键词:机器阅读理解 自然语言处理 深度学习 预训练模型 
多情景跨领域中文文本智能校对关键技术及应用
《中国科技成果》2021年第18期75-75,共1页张仰森 亓文法 施水才 陈若愚 吴云芳 肖诗斌 黄改娟 王洪俊 乔春庚 蒋玉茹 尤建清 段瑞雪 张良 
数字化时代,多种应用情景的电子文本大量涌现,包括各种编码输入法、OCR识别、机器翻译、语音识别等产生的文本,并在新闻和图书出版、各种公文处理、网络媒体处理等跨领域得到广泛应用。电子文本中经常会出现字词、句法、语义级的各种错...
关键词:电子文本 中文文本 文本校对 智能校对 机器翻译 跨领域 公文处理 国家自然科学基金 
基于改进EAST算法的专利附图标记检测被引量:1
《北京信息科技大学学报(自然科学版)》2021年第4期95-100,共6页范楠 肖诗斌 王焕鹏 施水才 
为充分利用发明专利和实用新型专利的附图信息,进一步研究利用专利附图提高专利检索的效率,提出一种基于改进EAST算法的专利附图标记检测方法。对专利附图标记进行检测时,改进特征提取阶段的骨干网络为ResNet50,并且融合空间注意力和通...
关键词:专利附图标记 文本检测 注意力机制 EAST 
基于融合词性的BiLSTM-CRF的期刊关键词抽取方法被引量:10
《数据分析与知识发现》2021年第3期101-108,共8页成彬 施水才 都云程 肖诗斌 
【目的】利用CRF模型处理序列标注问题的优势,通过将词性信息和CRF模型融入BiLSTM网络,实现期刊关键词的自动抽取。【方法】将关键词抽取问题视为一个序列标注问题。对期刊文本进行分词和词性标注的预处理;对预处理后的文本使用Word2Ve...
关键词:抽取 条件随机场 深度学习 双向长短期记忆网络 
基于混合注意力机制的中文文本蕴含识别方法被引量:1
《北京信息科技大学学报(自然科学版)》2020年第3期89-93,98,共6页黄生斌 肖诗斌 都云程 施水才 
将注意力机制应用于中文文本蕴含识别研究,提出了一种基于混合注意力机制的中文文本蕴含识别方法。为使模型能捕获文本间更丰富的语义信息,利用混合注意力机制获取文本词语级别和句子级别的语义信息,将不同级别的语义信息进行融合后对...
关键词:中文文本蕴含 深度学习 混合注意力机制 
基于分支ResNet-50的EAST场景文字检测算法被引量:5
《北京信息科技大学学报(自然科学版)》2020年第3期94-98,共5页龙言 施水才 肖诗斌 
针对自然场景文字检测任务中多尺度文本提取效果不佳的问题,改进EAST算法的ResNet基础网络单元,采用分支结构的特征提取方法,使得算法能够感知到更加深层次的文本特征。实验证明,在ICDAR2015数据集上,分支结构的EAST算法相比原始EAST算...
关键词:自然场景 文字检测 分支结构 EAST 
检索报告 对象比较 聚类工具 使用帮助 返回顶部