文档图像二值化算法VFCM  被引量:7

VFCM:binarization algorithm for document image

在线阅读下载全文

作  者:童立靖[1] 陈侃[1] 付晓玲[1] 段建勇[1] 

机构地区:[1]北方工业大学多媒体技术研究室,北京100144

出  处:《计算机工程与设计》2009年第13期3216-3218,3243,共4页Computer Engineering and Design

基  金:北京市教委科技发展面上基金项目(KM200710009005);北方工业大学重点研究基金项目(NCUT20090106);北方工业大学科研基金项目;北方工业大学科研平台及团队建设基金项目

摘  要:为了提高基于拍摄方式的文档图像的二值化效果,降低光学字符识别(optical character recognition,OCR)系统的文字识别错误率,提出了一种全局阈值与局部阈值相结合的二值化算法——VFCM。该算法使用最大方差比方法产生全局阈值,使用FCM(FuzzyC-Means)聚类方法产生局部阈值。这两种方法的结合能够较好地保留字符的笔画细节,并能有效地消除伪影。实验结果表明,该算法可以取得比较好的二值化效果,并能带来OCR系统识别率的有效提高。To improve the binarization effects of camera-based document images, and reduce error rate of the optical character recognition (OCR) system, a binarization algorithm VFCM is proposed based on the combination of the global threshold and the local threshold. The global threshold is computed by maximal variance ratio algorithm and the local threshold is computed by Fuzzy C-Means (FCM) algorithm. The VFCM algorithm can well reserve character strokes.and eliminate ghost artifacts. Experiments show that the proposed algorithm could yield better visual quality and OCR performance.

关 键 词:二值化 文档图像 阈值 最大方差比 模糊C均值算法 

分 类 号:TP391.43[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象