基于混合二值化的表格手写数字串的完整提取  

Integrated Extraction of Handwritten Numeral Strings in Form Document Based on Hybrid Binarization

在线阅读下载全文

作  者:郑天翔[1,2] 谢亮[1] 杨力华[1] 

机构地区:[1]中山大学科学计算与计算机应用系,广州510275 [2]暨南大学深圳旅游学院,深圳518053

出  处:《模式识别与人工智能》2008年第3期369-375,共7页Pattern Recognition and Artificial Intelligence

基  金:国家自然科学基金资助项目(No.60475042,10631080)

摘  要:对表格手写数字串的提取问题进行研究,提出一种基于混合二值化的单元格字符准确定位和完整提取方法,其核心是感兴趣单元格的定位与提取和断裂笔划的修复.该方法可克服书写时带来的各种常规影响,把表格中的手写数字完整提取出来.实验结果表明本文方法的有效性.The handwritten numeral string extraction in form document is studied. A method is proposed to effectively discern and capture the characters from overlapping borders based on hybrid binarization. Two key problems are investigated in detail including the location and the extraction on the cell of interest (COI) with broken strokes mended. The extracted handwritten characters remain integrated even for characters in different writing styles. Experimental results demonstrate that the proposed method is efficient.

关 键 词:表格手写数字串 二值化 字符提取 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象