面向文本检测的藏文古籍文档图像超分辨率重建  

Text Detection Oriented Super Resolution Reconstruction of Tibetan Ancient Scripts

在线阅读下载全文

作  者:郝玉胜 李健伟 王维兰[1] 王筱娟 林强 HAO Yusheng;LI Jianwei;WANG Weilan;WANG Xiaojuan;LIN Qiang(School of Mathematics and Computer Science,Northwest Minzu University,Lanzhou,Gansu 730070,China;Key Laboratory of Computational Nuclear Medicine,Northwest Minzu University,Lanzhou,Gansu 730070,China)

机构地区:[1]西北民族大学数学与计算机科学学院,甘肃兰州730070 [2]西北民族大学计算核医学实验室,甘肃兰州730070

出  处:《中文信息学报》2024年第10期54-63,共10页Journal of Chinese Information Processing

基  金:国家自然科学基金(62166036);中央高校基本科研业务费(31920220132);甘肃省高等学校创新基金(2021B-067);教学部产学合作协同育人项目(202102383034);甘肃省科技计划项目(22JR5RA187);西北民族大学教育教学改革研究一般项目(2023XJYBJG-43)。

摘  要:针对藏文古籍文档图像普遍因低质、视觉效果不佳严重影响图像中文本区域的检测和识别问题,该文构建了一个藏文古籍文档图像超分辨率数据集TAMSRD,同时提出了一种基于卷积神经网络的超分辨率重建方法,为领域内藏文古籍文档图像的超分辨率重建问题提供了有意义的参考。该文所提模型在ICDAR 2013/2015/2017,MSRA_TD500和TAMSRD共5个数据集上的实验结果表明:①该文所设计的超分辨率网络模型能够有效提高低质藏文古籍文档图像的视觉质量,重建图像的峰值信噪比(PSNR)、结果相似性指标(SSIM)以及自然图像质量评估指标(NIQE)都有明显的改善;②超分辨率网络模型对低质藏文古籍文档图像的重建,能够大幅改善各类场景图像文本检测模型的性能。在各个数据集上,MSER方法的召回率和F值提升区间为[16.3%,32.5%]和[13.3%,41.9%],CTPN方法的召回率和F值提升区间为[4.1%,39.8%]和[2.1%,32.7%],DB方法的召回率和F值提升区间为[8.4%,56.5%]和[7.7%,58.7%]。In order to improve the poor visual effect affecting the detection or recognition of Tibetan text in ancient manuscripts,a super-resolution reconstruction architecture based on CNN is proposed in this paper.Meanwhile,a dataset named TAMSRD(Tibetan Ancient Manuscripts Super-resolution Dataset)is constructed.The experimental results on five datasets named ICDAR 2013/2015/2017,MSRA_TD500 and TAMSRD demonstrate the super-resolution architecture presented in this paper effectively enhances the visual quality of low-quality document images in terms of PSNR,SSIM and NIQE.And the reconstruction of low-quality document images using the proposed model significantly boosts the performance of text detection models across various scene images.

关 键 词:超分辨率 藏文古籍 文档图像 图像质量评价 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象