检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北方工业大学信息工程学院,北京100144 [2]华南理工大学自动化科学与工程学院,广东广州510641
出 处:《计算机工程与设计》2012年第9期3512-3516,共5页Computer Engineering and Design
基 金:十一五国家科技支撑平台重点基金项目(2009BA171B02);北京市属高等学校人才强教计划基金项目(PHR201007121)
摘 要:针对图像处理(如OCR技术)对图像方向要求十分严格,文本图像方向具有不确定性的问题,提出了中文文本图像倒置快速检测算法。利用投影技术定位出文本字符,结合中文字符及标点符号结构特征,筛选出文本图像中的标点符号,根据标点符号像素分布特点判断出类型,结合标点符号的使用习惯,采用统计的方法判断中文文本图像是否倒置。实验结果表明,投影方法可以不用基于内容达到高效快速的要求,利用统计方法可以保证判别率,该方法可用于OCR预处理过程。Given the facts that the image processing technology(such as OCR) is strict with image direction and text image direction is uncertain,this paper put forward a rapid inversion detection algorithm for Chinese text image.Firstly,locate the text characters by using the projection technique.Select the punctuation marks in the text image considering Chinese characters and punctuation structure features.Then,judge the type of punctuation marks according to their pixel distribution characteristics and using habits.Finally,decide inversion of Chinese text image by using statistical method.The experimental results show that the projection technique can achieve fast and efficient requirements without content-based processing,and the statistical method can guarantee the discrimination rate for inversion detection.This method can be used in OCR preprocessing.
关 键 词:文本图像 字符结构 投影算法 文本定位 图像倒置
分 类 号:TP301[自动化与计算机技术—计算机系统结构] TP39[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30