文本识别

作品数:309被引量:4316H指数:16
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:金连文黄双萍王斌林文辉吴非更多>>
相关机构:深圳市腾讯计算机系统有限公司北京百度网讯科技有限公司平安科技(深圳)有限公司华南理工大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金广东省哲学社会科学规划项目教育部人文社会科学研究基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于python对图像文本检测定位识别方法研究
《信息系统工程》2025年第4期47-50,共4页吴金聪 朱大洲 屠振华 
农业农村部重大信息化平台运维专项“食物营养信息管理咨询平台运维”(项目编号:102125191610420009001);中国农业科学院基本科研业务费专项院级统筹项目“食物营养健康科普信息监测与创作模式研究”(项目编号:Y2024XK11)。
在自然场景中,文本的形态、颜色、大小以及排列方式各不相同,加之复杂的背景干扰,传统的文本检测方法往往难以取得理想的效果。与传统Faster-CNN相比,TLDN与TRN混合模型设计得更轻量,实时实现快速跟踪。TLDN(Text Location Detection Ne...
关键词:卷积神经网络 循环神经网络 文本识别 
基于多模态特征融合的场景文本识别
《计算机应用研究》2025年第4期1274-1280,共7页蔡明哲 王满利 窦泽亚 张长森 
国家自然科学基金资助项目(52074305);河南省科技攻关项目(242102221006);河南省研究生教育改革与质量提升工程资助项目(YJS2024AL026);河南理工大学光电传感与智能测控河南省工程实验室开放基金资助项目(HELPSIMC-2020-00X)。
为了解决自然场景文本图像因为遮挡、扭曲等原因难以识别的问题,提出基于多模态特征融合的场景文本识别网络(multimodal scene text recognition,MMSTR)。首先,MMSTR使用共享权重内部自回归的排列语言模型实现多种解码策略;其次,MMSTR...
关键词:场景文本 特征融合 语言模型 注意力机制 残差网络 
基于DBNet与CRNN融合模型的卷烟激光码识别方法
《计算机与现代化》2025年第4期96-102,共7页马琦 文钰栋 梁尚荣 王可 
卷烟激光码识别是烟草稽查工作的重要手段。针对烟码背景复杂导致检测识别率低的问题,本文提出一种基于DBNet与CRNN融合模型的烟码识别方法。首先采用DBNet模型对烟码区域进行检测,通过引入可微分二值化实现烟码的准确定位与提取;然后采...
关键词:卷烟激光码 目标检测 文本识别 DBNet CRNN 
基于DBNet+SVTR的微电子组装电路字符识别系统
《电子与封装》2025年第4期24-30,共7页李颖 万永 罗驰 袁家军 简燕 
微电子组装技术的发展推动组装电路的类型和产量不断增长,因此作业智能化水平亟需提升,且需对每只电路的生产状态进行实时追踪记录。基于DBNet和SVTR网络模型的电路管壳批号识别系统采用端到端的光学字符识别(OCR)模型,结合分布式技术...
关键词:图像处理 文本识别 文本检测 OCR DBNet SVTR 
基于视觉技术的X、γ剂量率仪数字识别系统
《现代电子技术》2025年第6期118-126,共9页王雨青 黄政林 刘新昊 李英帼 韦应靖 
为提高X、γ剂量率仪检定、校准的自动化程度,提出一种基于计算机视觉的X、γ剂量率仪数字识别系统。该系统可实现摄像头视频采集、采集图像预处理、仪表图像的文本检测与识别以及识别结果的后处理。分别采用DBNet与CRNN-CTC作为文本检...
关键词:数字识别系统 机器视觉技术 深度学习 图像处理 文本检测 文本识别 计量检定 
基于多尺度字符特征提取的场景文本识别算法研究
《工业控制计算机》2025年第3期59-61,共3页崔瑞雪 舒琪 王旭智 万旺根 孙学涛 张振 
在场景文字识别任务中,字符特征的提取是至关重要的一环,对于提高识别准确率具有举足轻重的作用。为了提高模型在处理文字弯曲、拥挤、变形、模糊等复杂情况时的性能,提出了一种基于多尺度字符特征提取的场景文本识别算法,以表现优异的S...
关键词:多尺度字符特征提取 文本识别 深度学习 
瑞典:推出转录手写文档的AI模型和开源软件
《陕西档案》2025年第1期61-61,共1页
瑞典国家档案馆针对大量手写文档和敏感数据文档的转录需求,推出了免费版的AI转录模型Swedish Lion Libre,以及相应的开源软件HTRflow。该模型和开源软件由瑞典国家档案馆的AI实验室开发,融合了目前最新的瑞典手写文本识别(HTR)模型,为...
关键词:开源软件 数据文档 文本识别 国家档案馆 开源工具 数据分析 免费版 数字档案 
基于多头注意力的场景文本图像超分辨率网络
《福建师范大学学报(自然科学版)》2025年第1期21-29,共9页朱佳楠 邢树礼 
国家重点研发计划项目(2019YFD0900905);国家自然科学基金项目(61773415)。
场景文本图像超分辨率(STISR)技术旨在提高低分辨率文本图像中的分辨率和可读性,是下游文本识别任务的基础性工作。利用深度卷积神经网络完成STISR的现有方法缺乏对文本图像全局信息的考虑,导致恢复结果不稳定,在处理视觉相似的低分辨...
关键词:场景文本 图像超分辨率 文本识别 文本先验 卷积网络 多头注意力 
基于CRNN改进的中文街景文本识别技术
《成都信息工程大学学报》2025年第1期1-6,共6页任锐 王晓娅 文成玉 
四川省科技计划资助项目(2023YFS0422)。
现实场景中存在图像扭曲、背景复杂、弯曲倾斜等不规则文字形状,提取其中的文字信息可提高图像的语义信息和帮助分析上下文,从而更好地理解场景图像。针对场景文本的复杂问题,提出基于CRNN(卷积循环神经网络)改进的端到端场景文本识别...
关键词:文本识别 卷积神经网络 注意力机制 双向长短期记忆 
融合双重注意力机制的缅甸语图像文本识别方法
《中文信息学报》2025年第1期47-55,共9页王奉孝 毛存礼 余正涛 高盛祥 黄于欣 刘福浩 
国家自然科学基金(61732005,U21B2027,62166023,61866019);云南省自然科学基金(2019FA023);云南省重大科技专项计划(202103AA080015,202002AD080001)。
由于缅甸语字符具有独特的语言编码结构以及字符组合规则,现有图像文本识别方法在缅甸语图像识别任务中无法充分关注文字边缘的特征,会导致缅甸语字符上下标丢失的问题。因此,该文基于Transformer框架的图像文本识别方法做出改进,提出...
关键词:缅甸语 文本识别 通道和空间注意力 特征增强 文字边缘特征 
检索报告 对象比较 聚类工具 使用帮助 返回顶部