基于多特征融合的东亚文种识别  被引量:5

East Asian Script Identification Based on Multi-feature

在线阅读下载全文

作  者:王刚[1] 靳彦青[2] 刘立柱[1] 储瑞来[3] 

机构地区:[1]解放军信息工程大学,郑州450002 [2]国家数字交换系统工程技术研究中心,郑州450002 [3]南京理工大学,南京210094

出  处:《计算机科学》2013年第1期273-276,共4页Computer Science

基  金:国家"863"计划基金项目(2009AA011202)资助

摘  要:针对目前基于统计特征和符号匹配的识别方法对字体较敏感的问题,提出一种基于多特征融合的东亚文种识别算法。该算法首先分析并提取高频形状特征、排版特征以及字符复杂度特征,然后采用模糊集贴近度准则进行识别。实验结果表明,该算法具有较高的识别准确率,并对不同字体具有较强的鲁棒性。Script identification has important applications in the field of document image information retrieval.An east asiatic script identification approach was proposed based on multi-feature.Compared to traditional identification method based on statistical characteristics and symbols matching,the algorithm first analyzes and extracts the token shape matching features,layout features and character complexity features,and then uses closeness degree of fuzzy sets to identify.The experimental results show that the algorithm has higher recognition accuracy and strong robustness to different fonts.

关 键 词:文种识别 多特征 字符复杂度特征 贴近度 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象