检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:侯闫 高定国 高红梅 HOU Yan;GAO Ding-guo;GAO Hong-mei(School of Information Science and Technology,Tibet University,Lhasa 850000,China)
机构地区:[1]西藏大学信息科学技术学院,西藏拉萨850000
出 处:《计算机工程与设计》2023年第4期1058-1065,共8页Computer Engineering and Design
基 金:国家自然科学基金项目(62166038);西藏大学研究生高水平人才培养计划基金项目(2020-GSP-S177)。
摘 要:为解决乌金印刷多字体藏文的文本识别以字丁识别为主、识别字体类别单一或较少、无法实现端到端的藏文文本行识别等问题,根据藏文文字的书写特点,在基于分割的文本检测方法DBNet上,对比在MobileNetV3和ResNet34两种骨干网络下CRNN、Rosetta和RARE这3种端到端的文本识别算法;提出一种将常用74个藏文字符作为端到端文字识别的转录字典策略,提出一个针对藏文文本识别的评价指标。实验结果表明,以ResNet34为骨干网络的CRNN文本识别方法在测试集上的综合表现最佳。To solve the text recognition of multi-font Tibetan texts in Wujin is mainly based on Tibetan-Ding and single or few font types,and it is unable to achieve the end-to-end Tibetan text line recognition,according to the writing characteristics of Tibetan text and a segmentation-based text detection method DBNet,three end-to-end text recognition algorithms CRNN,Rosetta and RARE under the two backbone networks of MobileNetV3 and ResNet34 were compared.A transcription dictionary strategy using commonly 74 Tibetan characters as end-to-end text recognition and an evaluation index for Tibetan text recognition were proposed.Experimental results show that the CRNN text recognition method with ResNet34 as the backbone network has the best comprehensive performance on the test set.
关 键 词:藏文 乌金字体 多种字体 深度学习 文本检测 文本识别 端到端
分 类 号:TP183[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.13