基于OCR识别的英语翻译系统设计  被引量:1

Design of English translation system based on OCR recognition

在线阅读下载全文

作  者:叶佩[1] 王征风[1] YE Pei;WANG Zhengfeng(Xi’an Si Yuan University,Xi’an 710038,China)

机构地区:[1]西安思源学院,西安710038

出  处:《自动化与仪器仪表》2023年第2期258-262,共5页Automation & Instrumentation

基  金:陕西省教育科学规划课题《幼儿园混龄教育的现状与效果研究》(SGH17H448)。

摘  要:为了提高英语智能翻译的图像识别效率,基于OCR设计出一套英文翻译系统。其中利用OTSU算法对图像进行二值化处理,结合中值滤波技术与高斯滤波技术进行图像降噪;利用Tessreact-OCR引擎和Python语言封装的Pytesseract模块实现英文字符的识别操作。最后进行系统效果验证,通过图像预处理及Pytesseract模块处理的图像,传入Tesseract-OCR中,系统识别效果良好,所得英文字符图像的识别结果较为准确。In order to improve the efficiency of image recognition in English intelligent translation, an English translation system based on OCR is designed. OTSU algorithm is used to optimize the image binarization. Median filter and Gaussian filter are combined to reduce image noise. Using Tessreact-OCR engine and Python language encapsulated Pytesseract module to realize English character recognition operation. Finally, the system effect is verified. Through image preprocessing and Pytesseract module, the image is passed into TesseracT-OCR, and the system recognition effect is good, and the recognition result of the English character image is more accurate.

关 键 词:OCR 字符识别 翻译系统 Tesseract引擎 

分 类 号:TP29[自动化与计算机技术—检测技术与自动化装置] TN249[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象