检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:向世明[1] 赵国英[1] 陈睿[1] 贾富仓[1] 李华[1]
机构地区:[1]中国科学院计算技术研究所智能信息处理重点实验室
出 处:《计算机辅助设计与图形学学报》2005年第1期42-48,共7页Journal of Computer-Aided Design & Computer Graphics
基 金:国家"八六三"高技术研究发展计划(2001AA231031);国家科技攻关计划课题奥运科技专项(2001BA904B08);国家重点基础研究发展规划(G1998030608);中国科学院计算技术研究所青年创新基金(200261804)
摘 要:扫描已装订的积厚文档时 ,由于页面不能紧贴于扫描平面 ,会产生两个问题 :(1)扫描图像中离装订线较近的一侧出现黑色的阴影区域 ;(2 )阴影区域中的文本产生扭曲 基于图像信息和几何变形信息 ,提出一种去除阴影和校正文本的算法 首先采用分块自动阈值算法去除阴影 ;然后通过垂直投影函数、有效包围盒和标记点提取文本行中心线 ,中心线被用于全局几何参数的估计 ;最后 ,扭曲的文本通过估计的几何参数和分片四边形映射进行校正While scanning thick bound documents, the pages are not flat on the document glass of the scanner. The physical deformation of the scanned page can results in two kinds of degradation for the scanned image. One is the shadow incurred near the spine of the book; and another is the text being bended. In this paper, we propose a method to combine the information both from the scanned image and from the geometric distortion to remove the shadow as well as restore the warped words to the right positions. First, the shadow is removed by patch-based auto-threshold binarization. Then the central lines of text are directly extracted from the binarization image. This goal is achieved by using vertical projection function, valid bounding boxes, and markers. Finally, the bended lines and the warped words are restored by the geometric parameters evaluated from the central lines and the piecewise quadrilateral map. Experiments show that the proposed algorithm gives satisfactory results.
关 键 词:积厚文档 文本行中心线 垂直投影函数 有效包围盒 标记点 几何参数
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.76