基于文字局部结构相似度量的开放集文字识别方法  

Open-set Text Recognition via Part-based Similarity

在线阅读下载全文

作  者:刘畅 杨春 殷绪成[1] LIU Chang;YANG Chun;YIN Xu-Cheng(School of Computer and Communication Engineering,University of Science and Technology Beijing,Beijing 100083)

机构地区:[1]北京科技大学计算机与通信工程学院,北京100083

出  处:《自动化学报》2024年第10期1977-1987,共11页Acta Automatica Sinica

基  金:新一代人工智能国家科技重大专项(2020AAA0109701);国家杰出青年科学基金(62125601);国家自然科学基金(62076024)资助。

摘  要:开放集文字识别(Open-set text recognition,OSTR)是一项新任务,旨在解决开放环境下文字识别应用中的语言模型偏差及新字符识别与拒识问题.最近的OSTR方法通过将上下文信息与视觉信息分离来解决语言模型偏差问题.然而,这些方法往往忽视了字符视觉细节的重要性.考虑到上下文信息的偏差,局部细节信息在区分视觉上接近的字符时变得更加重要.本文提出一种基于自适应字符部件表示的开放集文字识别框架,构建基于文字局部结构相似度量的开放集文字识别方法,通过对不同字符部件进行显式建模来改进对局部细节特征的建模能力.与基于字根(Radical)的方法不同,所提出的框架采用数据驱动的部件设计,具有语言无关的特性和跨语言泛化识别的能力.此外,还提出一种局部性约束正则项来使模型训练更加稳定.大量的对比实验表明,本文方法在开放集、传统闭集文字识别任务上均具有良好的性能.Open-set text recognition(OSTR)is an emerging task that aims to address language bias and novel characters in open-world text recognition applications.Recent OSTR methods have achieved some success by decoupling the potentially biased context information with visual information.However,they tend to overlook the increasing importance of visual details.Given the biases in contextual information,detailed visual information became much more important in differentiating visually close characters.This work proposes an adaptive part-representation-based open-set text recognition framework and an open-set text recognition method via part-based similarly to improve the visual details modeling by explicitly modeling different character parts.Unlike radical-based methods,the proposed framework adopts a data-driven parting scheme,hence is language agnostic.A localization constraint is further proposed to address the instability caused by the parting scheme.The full framework steadily outperforms its baseline and yields reasonable performance on the close-set benchmarks.

关 键 词:开放集文字识别 开放集学习 泛用零样本学习 组成学习 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象