检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:姑丽祖热.吐尔逊 尤努斯.艾沙 吐尔根.依布拉音 库尔班.吾布力
机构地区:[1]新疆大学信息科学工程学院,新疆乌鲁木齐830046
出 处:《计算机工程与设计》2016年第7期1892-1897,共6页Computer Engineering and Design
基 金:新疆维吾尔自治区少数民族科技人才特殊培养计划科研基金项目(201323121);新疆维吾尔自治区高校科研计划重点基金项目(XJEDU2013I11);模式识别国家重点实验室2014年度开放课题基金项目(201306321)
摘 要:为提高文档图像字符的可读性和切分与识别的准确率,对印刷体维吾尔文文档图像进行研究,尤其是对连通段切分和字符切分等难点问题提出分割方法。使用跑长码的连通区域算法,结合重叠度计算方法,进行连通段切分;基于维吾尔文字符在基线上相接的特点,在基线位置估计的基础上,找出字符的切点。切分结果表明,该算法比其它算法切分结果效果更好。To improve the accuracy of Uighur character recognition,a study was carried out on the Uighur printed document image,especially for the connected component segmentation and character segmentation which have now become the most difficult problems,an efficient segmentation method was proposed.Long run code connected regions algorithm and overlapping calculation methods were combined to segment the words on the document image.Uighur characters were connected in the base-line.Based on this characteristic,the baseline of the each word was estimated,and the segmentation positions of characters were found out.The results indicate better segmentation results than the algorithm proposed earlier.
关 键 词:文档图像处理 跑长码连通区域算法 重叠度算法 单词切分 字符切分
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.219.24.193