Tesseract-OCR的文档扫描识别系统  被引量:4

在线阅读下载全文

作  者:杨思怡 付相祥 吴晓华 夏清[1] 

机构地区:[1]深圳技师学院

出  处:《电子世界》2021年第20期98-100,共3页Electronics World

基  金:深圳技师学院校级创客基金项目《基于物联网NB-iot的共享停车系统》。

摘  要:在高速信息化的时代,针对海量文档数据处理效率低下的问题,提出了一种基于OCR技术的识别系统,首先利用OpenCV对文档数据进行预处理滤波,边缘计算,灰度化等一系列预处理,然后使用Canny算子找到图片边缘信息后应用一个透视的转换去获取一个文档的自顶向下的正图,最后完成了一个基于Tesseract-OCR的文档扫描识别项目,该实验表明此方法具有准确的识别率,提供多种语言开发调用,以及具备高可用性;可以有效提升数据录入的效率,大大减轻人工的消耗。

关 键 词:CANNY算子 数据处理效率 OCR技术 数据录入 文档数据 高可用性 识别系统 边缘信息 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象