文档图像二值化算法VFCM 被引量：7

VFCM:binarization algorithm for document image

出　　处：《计算机工程与设计》2009年第13期3216-3218,3243,共4页Computer Engineering and Design

基　　金：北京市教委科技发展面上基金项目(KM200710009005);北方工业大学重点研究基金项目(NCUT20090106);北方工业大学科研基金项目;北方工业大学科研平台及团队建设基金项目

摘　　要：为了提高基于拍摄方式的文档图像的二值化效果,降低光学字符识别(optical character recognition,OCR)系统的文字识别错误率,提出了一种全局阈值与局部阈值相结合的二值化算法——VFCM。该算法使用最大方差比方法产生全局阈值,使用FCM(FuzzyC-Means)聚类方法产生局部阈值。这两种方法的结合能够较好地保留字符的笔画细节,并能有效地消除伪影。实验结果表明,该算法可以取得比较好的二值化效果,并能带来OCR系统识别率的有效提高。To improve the binarization effects of camera-based document images, and reduce error rate of the optical character recognition （OCR） system, a binarization algorithm VFCM is proposed based on the combination of the global threshold and the local threshold. The global threshold is computed by maximal variance ratio algorithm and the local threshold is computed by Fuzzy C-Means （FCM） algorithm. The VFCM algorithm can well reserve character strokes.and eliminate ghost artifacts. Experiments show that the proposed algorithm could yield better visual quality and OCR performance.

关键词：二值化文档图像阈值最大方差比模糊C均值算法

分类号：TP391.43[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

文档图像二值化算法VFCM 被引量：7

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

文档图像二值化算法VFCM 被引量：7

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索