结合感受野增强和全卷积网络的场景文字检测方法  被引量:6

Text Detection in Natural Scene Images Based on Enhanced Receptive Field and Fully Convolution Network

在线阅读下载全文

作  者:李晓玉 宋永红[2] 余涛 LI Xiao-Yu;SONG Yong-Hong;YU Tao(School of Software Engineering,Xi'an Jiaotong University,Xi'an 710049;College of Artificial Inteligence,Xi'an Jiao-tong University,Xi'an 710049)

机构地区:[1]西安交通大学软件学院,西安710049 [2]西安交通大学人工智能学院,西安710049

出  处:《自动化学报》2022年第3期797-807,共11页Acta Automatica Sinica

基  金:陕西省自然科学基础研究计划(2018JM6104);国家重点研究开发计划(017YFB1301101)资助。

摘  要:自然场景图像质量易受光照及采集设备的影响,且其背景复杂,图像中文字颜色、尺度、排列方向多变,因此,自然场景文字检测具有很大的挑战性.本文提出一种基于全卷积网络的端对端文字检测器,集中精力在网络结构和损失函数的设计,通过设计感受野模块并引入Focalloss、GIoUloss进行像素点分类和文字包围框回归,从而获得更加稳定且准确的多方向文字检测器.实验结果表明本文方法与现有先进方法相比,无论是在多方向场景文字数据集还是水平场景文字数据集均取得了具有可比性的成绩.The quality of natural scene images is influenced easily by the shooting environment and conditions,and scene image background is relatively complex and has a strong interference for detection,besides,text in scene images may have different colors,fonts,sizes,directions,languages and so on,all these situations make natural scene text detection be still a challenging research topic.This paper proposes an end-to-end text detector based on fully convolution network.We focus on the design of the network structure and the loss function,through adding the enhanced receptive field module and introducing Focalloss,GIoUloss for pixels classification and text boxes regression respectively,we gain a more stable accurate multi-oriented text detector.Our method provides promising performance compared to the recent state-of-the art methods on both the multi-oriented scene text dataset and horizontal text dataset.

关 键 词:感受野增强 Focalloss GIo Uloss 全卷积网络 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术] TP183[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象