基于稀疏编码直方图的TSM识别场景文本算法被引量：3

Histograms of sparse codes based TSM for scene text recognition

出　　处：《计算机工程与设计》2016年第4期988-992,1090,共6页Computer Engineering and Design

基　　金：2014年国家科技支撑计划基金项目(2014BAH30B01)

摘　　要：基于部件的树结构模型(TSM)使用的底层特征梯度直方图(HOG)对文字特征表达性不强,且降维时易造成信息丢失。针对该问题,构建以稀疏编码直方图(HSC)为底层特征的基于部件的树结构模型(HSC-TSM)识别场景文本。将K-SVD学习字典用于计算稀疏编码,逐像素地将稀疏编码聚合成HSC,描述文字的局部外观信息;通过奇异值分解对HSC进行降维,避免信息丢失。HSC-TSM在数据集ICDAR 2003上对各类文字的识别率比TSM高3.08%-10.28%,在数据集ICDAR 2003和SVT上的单词识别率分别提升了5.30%和3.62%。The histograms of gradient（HOG）as low-level feature of the part-based tree-structured model（TSM）is not representative for characters,and it can easily lead to the loss of information when reducing the dimensions.To solve the problem,histograms of sparse codes（HSC）as low-level feature of the part-based tree-structured model（HSC-TSM）was constructed to recognize scene text.Sparse codes were computed with dictionaries learnt from data using K-SVD,and per-pixel sparse codes were aggregated into HSC,the local appearance information was better described.The dimensions of HSC were reduced by singular value decomposition to avoid the loss of information.The recognition rates of HSC-TSM recognizing various categories of characters on ICDAR 2003 dataset are 3.08%-10.28% higher than that of TSM,the word recognition rates on ICDAR 2003 and SVT dataset are respectively increased by 5.30% and 3.62%.

关键词：场景文本识别基于部件的树结构模型奇异值分解稀疏编码直方图

分类号：TP242.62[自动化与计算机技术—检测技术与自动化装置]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于稀疏编码直方图的TSM识别场景文本算法被引量：3

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于稀疏编码直方图的TSM识别场景文本算法 被引量：3

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于稀疏编码直方图的TSM识别场景文本算法被引量：3