检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘艳菊 伊鑫海[2] 李炎阁 张惠玉 刘彦忠 LIU Yanju;YI Xinhai;LI Yange;ZHANG Huiyu;LIU Yanzhong(School of Mathematics and Information Science,Nanjing Normal University of Special Education,Nanjing 210038,China;School of Computer and Control Engineering,Qiqihar University,Qiqihar,Heilongjiang 161000,China)
机构地区:[1]南京特殊教育师范学院数学与信息科学学院,南京210038 [2]齐齐哈尔大学计算机与控制工程学院,黑龙江齐齐哈尔161000
出 处:《计算机工程与应用》2022年第4期52-63,共12页Computer Engineering and Applications
基 金:国家自然科学基金青年基金项目(61403222);黑龙江省教育厅基本科研业务费科研项目(135309466)。
摘 要:随着深度学习技术在计算机视觉领域的发展,场景文本检测与文字识别技术也有了突破性的进展。受到自然场景下极端光照、遮挡、模糊、多方向多尺度等情况的影响,无约束的场景文本检测与识别仍然面临着巨大的挑战。从深度学习的角度对场景文本检测和文字识别技术进行深入研究,总结出在文本检测技术中将基于分割的方法与回归的方法优势相结合,可以解决小文本区域的召回率较低的问题,同时适应多尺度文本;在文本识别方法中将CTC机制与Attention机制相结合,可以相互监督以提升识别性能,降低长文本识别的出错率。With the development of deep learning technology in the field of computer vision,there are breakthroughs in scene text detection and text recognition technology.Affected by extreme lighting,occlusion,blur,multi-direction and multi-scale in natural scenes,there are still huge challenges facing unconstrained scene text detection and recognition.In this paper,the scene text detection and text recognition technology are studied deeply from the perspective of deep learning,and the method and regression based on segmentation in the text detection technology are summarized.The combination of the advantages of the method can solve the problem of low recall rate of small text areas,while adapting to multi-scale text.Through the combination of the CTC mechanism and the Attention mechanism in the text recognition method,mutual supervision can be achieved,the recognition performance is improved,and the error rate of long text recognition is reduced.
关 键 词:深度学习 计算机视觉 自然场景 文本检测 文字识别
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.177