检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:童立靖[1] 陈侃[1] 付晓玲[1] 段建勇[1]
机构地区:[1]北方工业大学多媒体技术研究室,北京100144
出 处:《计算机工程与设计》2009年第13期3216-3218,3243,共4页Computer Engineering and Design
基 金:北京市教委科技发展面上基金项目(KM200710009005);北方工业大学重点研究基金项目(NCUT20090106);北方工业大学科研基金项目;北方工业大学科研平台及团队建设基金项目
摘 要:为了提高基于拍摄方式的文档图像的二值化效果,降低光学字符识别(optical character recognition,OCR)系统的文字识别错误率,提出了一种全局阈值与局部阈值相结合的二值化算法——VFCM。该算法使用最大方差比方法产生全局阈值,使用FCM(FuzzyC-Means)聚类方法产生局部阈值。这两种方法的结合能够较好地保留字符的笔画细节,并能有效地消除伪影。实验结果表明,该算法可以取得比较好的二值化效果,并能带来OCR系统识别率的有效提高。To improve the binarization effects of camera-based document images, and reduce error rate of the optical character recognition (OCR) system, a binarization algorithm VFCM is proposed based on the combination of the global threshold and the local threshold. The global threshold is computed by maximal variance ratio algorithm and the local threshold is computed by Fuzzy C-Means (FCM) algorithm. The VFCM algorithm can well reserve character strokes.and eliminate ghost artifacts. Experiments show that the proposed algorithm could yield better visual quality and OCR performance.
关 键 词:二值化 文档图像 阈值 最大方差比 模糊C均值算法
分 类 号:TP391.43[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30