检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院计算技术研究所 [2]中国科学院研究生院,北京100039
出 处:《中文信息学报》2004年第4期44-49,共6页Journal of Chinese Information Processing
基 金:8 6 3计划资助项目 (2 0 0 3AA1Z2 2 30 ) ;科技部中小企业创新基金资助项目 (0 1C2 6 2 1 4 4 2 0 2 0 7) ;计算所领域前沿青年基金资助项目 (2 0 0 2 6 1 80 - 1 9)
摘 要:字符切分目前已经成为限制OCR技术发展的瓶颈 ,对于图像质量较差、中英文混排和背景色变化的文本图像 ,传统切分方法造成的切分错误使得文字识别率大大降低。针对这些问题 ,本文提出了新型文字切分方法。该方法先将灰度图像的灰度值进行分级处理 ,再根据分级连通域的概念把整个图像构造成树状结构 ,然后确定主层次级别 ,根据一定的规则在部分节点上进行合并、分割等进一步处理 ,最后得到最优的切分结果。实验结果表明 。In order to overcome the weakness of conventional segmentation algorithm in OCR, this paper presents a new segmentation method for gray document image. Important features of the new method include grading of the grayscale of pixels in image and construction of a tree structures for the whole document image. By dividing this trees branches and leaves, characters, pictures and forms can be correctly segmented. The experiment results showed that this method is very effective for document with both Chinese and English characters or document with different backgrounds.
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.135.64.200