基于多尺度条件随机场的文本图像二值化  

Binarization of Document Image Based on Multi-scale Conditional Random Fields

在线阅读下载全文

作  者:刘坤[1,2] 吕学强[1,2] 王涛[1,2] 施水才[1,2] 

机构地区:[1]北京信息科技大学中文信息处理研究中心,北京100101 [2]北京拓尔思信息技术股份有限公司,北京100101

出  处:《现代图书情报技术》2009年第4期79-81,共3页New Technology of Library and Information Service

基  金:863计划重点项目"跨媒体搜索关键技术研究及服务产品开发"(项目编号:2006AA010105);北京市属高等学校人才强教计划项目"创新团队-智能搜索引擎和文本挖掘"(项目编号:PXM2007_014224_044677);国家自然科学基金项目"基于语义分析和统计的自动主题标引研究"(项目编号:60872133)的研究成果之一

摘  要:提出一种基于多尺度条件随机场(简称mCRF)的图像二值化算法。该算法将对图像的二值化看作一个标注过程,利用mCRF模型对图像中每个像素点进行标记,从而实现对整幅图像的二值化。mCRF模型属于判别式模型,可以容纳任意的非独立特征,从而充分利用图像本身信息。实验结果表明,本算法比常用的阈值法效果有很大提高。This paper proposes a new algorithm based on multi - scale conditional random fields. This algorithm treats the binarization as a tagging process, using mCRF to label every pixel in the image, so as to realize the binarization of the full image. MCRF of discriminate model can accommodate any of the non - independent features, which makes full use of information in the image. From the result can see this algorithm is better than common threshold method in effect.

关 键 词:文本图像 二值化 多尺度条件随机场 特征函数 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象