基于自适应色彩聚类和上下文信息的自然场景文本检测  被引量:2

Natural Scene Text Detection Based on Adaptive Color Clustering and Context Information

在线阅读下载全文

作  者:邹北骥[1,2] 郭建京 朱承璋[1,2] 杨文君[1,2] 徐子雯 ZOU Bei-ji;GUO Jian-jing;ZHU Cheng-zhang;YANG Wen-jun;XU Zi-wen(School of Information Science and Engineering,Central South University,Changsha,Hunan 410083,China;Center for Ophthalmic Imaging Research,Central South University,Changsha,Hunan 410083,China)

机构地区:[1]中南大学信息科学与工程学院,湖南长沙410083 [2]中南大学眼科医学影像处理研究中心,湖南长沙410083

出  处:《电子学报》2018年第6期1436-1444,共9页Acta Electronica Sinica

基  金:国家自然科学基金(No.61573380;No.61702559);湖南省科技计划项目(No.2017WK2074);中南大学创新创业师生共创项目(No.2017gczd016)

摘  要:自然场景文本检测是图像内容分析和理解的重要前提.本文提出一种基于自适应色彩聚类和上下文信息分析的方法,用于检测自然场景图像文本.首先,将层次聚类和参数自学习策略结合,设计一种自适应色彩聚类方法,提取图像中的候选字符.该自适应色彩聚类方法能针对不同图像自动学习权重阈值,有较好的字符召回率.然后,利用文本中字符成行出现的性质,设计一种基于上下文信息的字符验证策略,既能保证较高字符召回率,也能有效移除非文本字符.最后,合并字符构建文本行,并通过后处理得到文本检测结果.在ICDAR2013公共数据集上的实验结果表明:本文分别获得74.17%的召回率,83.40%的准确率和78.52%的F得分.与其他文本检测方法相比,本文获得了较好的文本检测性能,说明本文方法的优越性.Natural scene text detection is an important task for image analysis and understanding. In this paper,a natural scene text detection method is proposed,using adaptive color clustering and context information analysis. Firstly,combining hierarchical clustering with self-learning strategy,we design an adaptive color clustering method,which learns clustering weights automatically and generates high character recall. Then,considering text in images usually containing several characters,we propose a character verification strategy based on image context information,which can guarantee high character recall and remove non-text components at the same time. Finally,characters are merged to text lines,and further post-processing is applied to generate final text detection results. Experiments on the ICDAR2013 publicly available dataset show that we obtain recall of 74. 17%,precision of 83. 40% and F-score of 78. 52%. Compared with other text detection methods,our method obtains better text detection performance,indicating superiority of the proposed method.

关 键 词:自然场景文本检测 自适应色彩聚类 上下文信息 自学习策略 

分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象