非均匀光照文档图像快速二值化方法  被引量:9

FAST BINARISATION METHOD FOR UNEVEN ILLUMINATION DOCUMENT IMAGES

在线阅读下载全文

作  者:曾凡锋[1] 王战东 郭正东[1] 

机构地区:[1]北方工业大学信息工程学院,北京100144

出  处:《计算机应用与软件》2015年第11期185-188,196,共5页Computer Applications and Software

基  金:国家自然科学基金资助项目(61371142);十一五国家科技支撑平台重点基金项目(2009BA171B02);北京市自然科学基金资助项目(4132026);北京市属高等学校人才强教计划资助项目(PHR201007121)

摘  要:拍照方式获取的文档图像在OCR识别中,可能因光照不均而导致识别率低下。针对此问题,提出一种基于分块的自适应文档图像快速二值化方法。根据文档区域亮度特征划分光照均匀区域、阴影区域及亮光区域,对不同区域自适应地选取最有效的二值化算法。为解决传统White算法自适应能力的不足,对其进行改进,有效减少了伪影和断笔的产生。实验结果表明,该方法能明显提高光照不均文档图像的OCR识别率,且校正速度快、鲁棒性好。The OCR recognition rate of camera-based document images may be low due to uneven illumination. To solve this problem, the paper puts forward a blocking-based fast adaptive binarisation method for document image. The method distinguishes the uniform illumination area, shaded area and strong light area according to regional lightness feature of the document, and selects the most effective binarisation algo- rithm adaptively for different areas. Traditional White algorithm has been improved to solve its shortage in adaptive ability, which effectively reduces the ghost artifacts and the phenomenon of missing strokes. Experimental results show that the method can significantly improve the OCR recognition rate of uneven illumination document images with fast correction speed and good robustness.

关 键 词:光照不均 图像块 二值化 区域亮度 区域Otsu算法 White算法 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象