基于卷积神经网络的竖排版繁体中文图像文本化研究  被引量:1

Textualization of Traditional Chinese Images Based on Convolutional Neural Network

在线阅读下载全文

作  者:李华[1] 魏志浩 刘俊[1] 李万清[1] 张林达[1] 袁友伟[1] 何宏[1] LI Hua;WEI Zhihao;LIU Jun;LI Wanqing;ZHANG Linda;YUAN Youwei;HE Hong(Hangzhou Dianzi University,Hangzhou 310018,China)

机构地区:[1]杭州电子科技大学,浙江杭州310018

出  处:《智能物联技术》2021年第5期24-30,共7页Technology of Io T& AI

基  金:浙江省基础公益研究计划项目资助(No.LGG18F020014);浙江省高等教育学会研究课题(项目编号KT2020393)。

摘  要:竖排版繁体中文图像文本化问题可以看作是古籍图像中文字的定位和识别问题,但目前主流的OCR技术对古籍文献中竖排版繁体中文的识别精度不高。为了解决此问题,本文将深度学习应用于文字识别和定位中。首先基于SSD模型,运用目标检测算法从古籍文献图像中定位文字;然后构建了Inception-Resnet卷积神经网络进行文字识别。测试表明,在同样数据集的条件下,针对不同版式、大小和字体的古籍文献图像,与其他经典神经网络模型相比,本文模型的性能和综合适用性更好。The problem of textualization of vertical layout traditional Chinese images can be regarded as a problem of positioning and recognition of characters in images of ancient books,but the current mainstream OCR technology does not have high recognition accuracy forit. To solve this problem,this paper applied deep learning to text recognition and localization. Firstly,based on the SSD model,the target detection algorithm was used to locate the text from the ancient book document images;then the Inception-Resnet convolutional neural network was constructed for text recognition. The test showed that,under the same data set,the performance and comprehensive applicability of the model in this paper were better than other classical neural network models for ancient book images of different layouts,sizes and fonts.

关 键 词:卷积神经网络 文字识别 文字定位 图像处理 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象