场景文本

作品数:117被引量:342H指数:9
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:金连文白翔罗昕孙亚杰黄双萍更多>>
相关机构:华南理工大学中国科学技术大学华中科技大学哈尔滨工业大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家科技重大专项黑龙江省教育厅科学技术研究项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于多模态特征融合的场景文本识别
《计算机应用研究》2025年第4期1274-1280,共7页蔡明哲 王满利 窦泽亚 张长森 
国家自然科学基金资助项目(52074305);河南省科技攻关项目(242102221006);河南省研究生教育改革与质量提升工程资助项目(YJS2024AL026);河南理工大学光电传感与智能测控河南省工程实验室开放基金资助项目(HELPSIMC-2020-00X)。
为了解决自然场景文本图像因为遮挡、扭曲等原因难以识别的问题,提出基于多模态特征融合的场景文本识别网络(multimodal scene text recognition,MMSTR)。首先,MMSTR使用共享权重内部自回归的排列语言模型实现多种解码策略;其次,MMSTR...
关键词:场景文本 特征融合 语言模型 注意力机制 残差网络 
引入多级特征与通道注意力复杂场景文本检测算法
《制造业自动化》2025年第3期127-133,共7页贾小云 翁佳顺 刘颜荦 
国家自然科学基金(61971272)。
针对在多样化环境下进行文本识别时遇到的诸如文本倾斜和大小不一致等挑战,提出了一种融合注意力机制和特征整合的高效文本识别算法。首先,通过在深度卷积神经网络的特征提取阶段加入注意力机制,促进了不同层次之间的信息互动,从而减少...
关键词:文本检测 复杂场景 多级特征 通道注意力 
基于多头注意力的场景文本图像超分辨率网络
《福建师范大学学报(自然科学版)》2025年第1期21-29,共9页朱佳楠 邢树礼 
国家重点研发计划项目(2019YFD0900905);国家自然科学基金项目(61773415)。
场景文本图像超分辨率(STISR)技术旨在提高低分辨率文本图像中的分辨率和可读性,是下游文本识别任务的基础性工作。利用深度卷积神经网络完成STISR的现有方法缺乏对文本图像全局信息的考虑,导致恢复结果不稳定,在处理视觉相似的低分辨...
关键词:场景文本 图像超分辨率 文本识别 文本先验 卷积网络 多头注意力 
改进的DenseNet的密集场景文本检测方法
《计算机与数字工程》2025年第1期196-201,共6页吕鹏鹏 於跃成 齐秀芳 
场景文本检测是近年来极具挑战性的任务,针对自然场景中密集文本检测受限、漏检的特点,提出了面向场景文本的检测方法。首先,采用可变形ROI池代替平均池化层改进DenseNet网络作为特征提取网络,实现对不同尺度的文本进行自适应局部定位,...
关键词:图像处理 文本检测 可变卷积 自然场景 
基于多头注意力机制与长短期记忆网络的自然场景文本识别
《传感技术学报》2024年第12期2107-2112,共6页姚炜 冯宪伟 
2024年度江苏省教育科学规划重点课题项目(B-b/2024/02/116);2024年度江苏省教育科学规划重点课题项目(B-b/2024/02/116)。
随着计算机视觉和自然语言处理技术的不断发展,自然场景文本检测与识别技术已成为计算机视觉领域的研究热点之一。提出了一种基于多头注意力机制与长短期记忆网络(LSTM)的自然场景文本检测与识别方法。该方法通过结合目标检测算法和序...
关键词:文本检测与识别 多头注意力机制 自然场景文本 长短期记忆网络 
基于非局部特征增强的场景文本检测算法
《计算机与数字工程》2024年第12期3728-3734,共7页罗佳辉 方承志 杨豪 
国家自然科学基金项目(编号:61977039)资助。
为准确区分自然场景中的相邻文本实例,快速精确定位文字实例,提出一种非局部特征增强的文本检测算法。该算法在DBNet的基础上,以轻量级网络resnet-18作为骨干网络,采用特征金字塔增强模块(FPEM)和特征金字塔融合模块(FFM)来弥补轻量级...
关键词:文本检测 特征增强 改进的非局部网络 可微二值化 focal loss 
中英文场景文本图像的检测和识别算法
《计算机与现代化》2024年第12期84-90,99,共8页王艳媛 茅正冲 
国家自然科学基金青年基金资助项目(6170185);国家自然科学基金资助项目(61901206)。
场景文本图像的背景复杂,检测算法难以定位文本区域,导致识别难度较高。为了同时检测和识别中文和英文的场景文本图像内容,并提高其检测和识别的准确率,提出一种基于ABCNetv2网络改进的算法模型TD-ABCNetv2。针对文本的形状、排列和字...
关键词:场景文本 中文文本检测 SKNet 注意力机制 交并比 
基于像素聚合的自然场景文本检测模型
《组合机床与自动化加工技术》2024年第11期13-17,23,共6页张华东 钟羽中 涂海燕 佃松宜 
国家重点研发计划项目(2018YFB1307401)。
针对自然场景文本检测面临的文本形状差异大、场景复杂干扰多等诸多挑战,提出了一种基于像素聚合的自然场景文本检测模型。首先,设计了上采样和长短跳跃的嵌套巢式连接的特征融合模块,通过融合残差网络ResNet18提取的多尺度、多阶段的特...
关键词:特征融合 像素聚合 文本检测 字符分割 
基于改进MTSv2的场景文本检测和识别算法研究
《计算机测量与控制》2024年第9期256-261,共6页王艳媛 茅正冲 杨雨涵 
国家自然科学基金(61901206);国家自然科学基金青年项目(6170185)。
在自然场景图像中,丰富的文本内容对于全面理解场景非常重要。针对自然场景文本图像存在背景复杂、文本粘连、文本多角度等问题,提出一种基于改进MTSv2的文本检测和识别算法;检测算法以MTSv2为基础网络,采用CBAM注意力机制增大特征图中...
关键词:场景文本 文本检测 文本识别 CBAM CE-FPN 注意力机制 
基于双分支序列残差注意力的场景文本图像超分辨率重建
《计算机工程》2024年第9期286-295,共10页李大海 吕春桂 王振东 
国家自然科学基金(61563019,61562037)。
针对现有场景文本图像超分辨率重建方法存在的重建文本图像细节信息丢失和边缘模糊的问题,提出一种基于双分支序列残差注意力的重建方法DSRASRN。首先,DSRASRN采用一种新的双分支序列残差注意力模块(DSRAB),该模块采用双分支结构分别专...
关键词:超分辨率重建 场景文本图像 双分支序列残差 特征增强 边缘感知 
检索报告 对象比较 聚类工具 使用帮助 返回顶部