基于高斯衍生滤波器组的文种识别算法  被引量:5

Script Identification Based on Gaussian Derivative Filter Bank

在线阅读下载全文

作  者:童莉[1] 周林[1] 平西建[1] 徐森[2] 

机构地区:[1]解放军信息工程大学信息系统工程学院,郑州450002 [2]盐城工学院信息工程学院,盐城224000

出  处:《数据采集与处理》2014年第5期713-719,共7页Journal of Data Acquisition and Processing

基  金:国家自然科学基金(60970142;61105057)资助项目;盐城工学院人才引进专项基金(XKR2011019)资助项目

摘  要:提出了一种基于高斯衍生滤波器组的文种识别算法;分析了文本图像的纹理特性,相对于传统的小波变换,本文算法可以在更多方向上提取文字的边缘和脊特征。采用支持向量机(Support vector machine,SVM)对所提特征进行训练和分类,实现文字种类识别;在实验中选用中、英、俄、日、韩、阿拉伯等10种不同语言文字文本图像,测试了滤波器的不同参数对算法性能的影响,并与其他3种基于纹理的文种识别算法进行了比较,实验结果表明本文算法运算速度较快,且得到较好的识别率。A script identification method is proposed based on Gaussian derivative filter bank. The texture characteristic of document images is analyzed. Compared with traditional wavelet transform, the proposed algorithm can extract edge and ridge features with more orientations. The support vector machine (SVM) is applied for training and classifying the extracted features to identify scripts in different languages. Experiments are performed upon document images with ten kinds of languages (including Chinese, Russian, English, Japanese, Korean, Arabic, etc). The effects of different Gaussian derivative filter parameters on the identification performance are tested, and other three script identification methods based on texture are selected for comparing. Experimental results show that the proposed algorithm can improve the speed and the correct rate of script identification.

关 键 词:文本图像 文种识别 高斯衍生滤波器组 支持向量机 

分 类 号:TN391.1[电子电信—物理电子学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象