检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]解放军信息工程大学信息系统工程学院,郑州450002 [2]盐城工学院信息工程学院,盐城224000
出 处:《数据采集与处理》2014年第5期713-719,共7页Journal of Data Acquisition and Processing
基 金:国家自然科学基金(60970142;61105057)资助项目;盐城工学院人才引进专项基金(XKR2011019)资助项目
摘 要:提出了一种基于高斯衍生滤波器组的文种识别算法;分析了文本图像的纹理特性,相对于传统的小波变换,本文算法可以在更多方向上提取文字的边缘和脊特征。采用支持向量机(Support vector machine,SVM)对所提特征进行训练和分类,实现文字种类识别;在实验中选用中、英、俄、日、韩、阿拉伯等10种不同语言文字文本图像,测试了滤波器的不同参数对算法性能的影响,并与其他3种基于纹理的文种识别算法进行了比较,实验结果表明本文算法运算速度较快,且得到较好的识别率。A script identification method is proposed based on Gaussian derivative filter bank. The texture characteristic of document images is analyzed. Compared with traditional wavelet transform, the proposed algorithm can extract edge and ridge features with more orientations. The support vector machine (SVM) is applied for training and classifying the extracted features to identify scripts in different languages. Experiments are performed upon document images with ten kinds of languages (including Chinese, Russian, English, Japanese, Korean, Arabic, etc). The effects of different Gaussian derivative filter parameters on the identification performance are tested, and other three script identification methods based on texture are selected for comparing. Experimental results show that the proposed algorithm can improve the speed and the correct rate of script identification.
关 键 词:文本图像 文种识别 高斯衍生滤波器组 支持向量机
分 类 号:TN391.1[电子电信—物理电子学]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222