基于迁移学习的敦煌藏文古籍整页识别  

Full-Page Text Recognition for Tibetan Dunhuang Documents Based on Transfer Learning

在线阅读下载全文

作  者:杨晓龙 高红梅 高定国 达措 YANG Xiaolong;GAO Hongmei;GAO Dingguo;DACUO(School of Information Science and Technology,Tibet University,Lhasa,Tibet 850000,China)

机构地区:[1]西藏大学信息科学技术学院,西藏拉萨850000

出  处:《中文信息学报》2023年第11期29-37,共9页Journal of Chinese Information Processing

基  金:国家自然科学基金(62166038);2021年度西藏自治区一流课程建设项目;西藏大学2022年20级硕士研究生高水平人才培养项目重点课题(2020-GSP-S182)。

摘  要:为了解决复杂背景下,文字风格多样导致整页文本识别模型识别精度低和网络难以收敛的问题,该文对基于迁移学习的整页识别算法(垂直注意力网络)进行改进。首先对《法国国家图书馆藏敦煌藏文文献》第一册的319张数据进行了构建和标注,通过印刷体合成等方式对数据集进行扩充,使实验数据达到2 367张图片;其次,为了增强行特征提取能力和加快网络收敛速度,使用自适应平均值池化对行特征提取模块和使用门循环单元对解码器进行了改进;最后将行训练模型迁移到改进的整页文本识别任务中实现对敦煌藏文文字的识别。实验结果表明,在拥有行级的标注情况下,使用迁移学习相比主流的整页识别模型降低了0.73%的字符错误率,验证了该模型在数据稀缺情况下对整页文本识别的有效性。In order to improve the whole page text recognition model in the complex background,this paper proposed a method based on migration learning(vertical attention network).In this study,319 pieces of data in the first volume of Dunhuang Tibetan Documents in the National Library of France are collected and annotated,which is expanded up to 2367 pictures by means of print synthesis as the experimental dataset.Then the adaptive average pooling is used to improve the line feature extraction module and the gate loop unit is used to improve the decoder.This line training model is transferred to the improved full-page text recognition task to realize the recognition of Dunhuang Tibetan characters.The experimental results show that the proposed method reduces the character error rate by 0.73%compared with the mainstream full-page text recognition model.

关 键 词:文本识别 迁移学习 端到端整页识别 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象