藏文识别的预处理  被引量:20

A Preprocessing Algorithm for Tibetan Character Recognition

在线阅读下载全文

作  者:王浩军[1] 赵南元[1] 邓钢轶[1] 

机构地区:[1]清华大学自动化系,北京100084

出  处:《计算机工程》2001年第9期93-96,共4页Computer Engineering

摘  要:预处理是整个文字识别系统的重要组成部分,预处理性能的优劣将直接影响整个识别系统的性能。根据藏文在字形和书写方式上的特点,实现了一种适用于藏文识别的预处理技术,整个预处理过程包括二值化、版面分析、倾斜校正、字符切分和归一化。在预处理过程中还提取了一些有关字丁的基本特征,这些特征充分反映了藏文的特点,具有良好的稳定性,可以用于识别系统的粗分类和后处理。The preprocessing is an important part of the character recognition system. Its performance will seriously affect the capacity of the system. In this paper, we present a preprocessing algorithm for Tibetan character based on the topology structures and writing habits of Tibetan characters. The entire preprocessing procedure includes binary, page analysis, skew correction, character segmentation and normalization. In addition, some basic features of Tibetan characters are extracted. These features can be used for recognition and postprocessing.

关 键 词:藏文识别 预处理 字符切分 文字识别系统 计算机 

分 类 号:TP391.43[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象