基于Tesseract-ocr的藏文脱机识别  被引量:2

在线阅读下载全文

作  者:翟娟秀 普布旦增[1] 周欢欢[2] 王程新[1] 解颐 

机构地区:[1]西藏大学藏文信息技术研究中心 [2]西藏大学工学院,西藏拉萨850000

出  处:《科技创业月刊》2016年第21期130-131,共2页Journal of Entrepreneurship in Science & Technology

基  金:西藏大学自治区级大学生创新性实验训练计划项目"基于tesseract-ocr的藏文自动识别翻译的设计与实现"(项目编号:2015QCX084)

摘  要:主要介绍了基于Tesseract-ocr的藏文脱机识别训练的方法,从box文件生成、文字校正、文字特征文件生成、定义字体特征、聚集字体特征、生成训练字库特征库文件这六个方面详细介绍了具体的训练方法,然后通过训练之后的字库特征文件成功识别了图片上的藏文,实现了藏文的脱机识别。

关 键 词:Tesseract-ocr 藏文脱机识别 训练方法 字体特征 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象