藏文字自动生成技术研究  被引量:1

Study on the technology of automatic generation of Tibetan characters

在线阅读下载全文

作  者:才智杰[1] 孙茂松[2] 才让卓玛[1] 

机构地区:[1]青海师范大学计算机学院藏文信息处理教育部重点实验室,青海西宁810008 [2]清华大学计算机科学与技术系清华信息科学与技术国家实验室,北京100084

出  处:《高原科学研究》2017年第1期98-103,共6页Plateau Science Research

基  金:国家自然科学基金项目(61163018;61262051;61662061);国家哲学社会科学基金项目(13BYY141;16BYY167);教育部"春晖计划"合作科研项目(Z2012093;Z2016077);青海省基础研究项目(2017-ZJ-767;2015-SF-520);"长江学者和创新团队发展计划"创新团队资助项目(IRT1068);青海省重点实验室项目(2013-Z-Y17;2014-Z-Y32;2015-Z-Y03);藏文信息处理与机器翻译重点实验室(2013-Y-17)

摘  要:字是语言文字的基本组成单位,文字自动生成是自然语言处理的基础,为自然语言处理中字属性分析、输入法设计、排序、语音处理和藏文字符信息熵研究等提供理论数据。文章在分析藏文字结构的基础上归纳了藏文构字规则,并以藏文字的核心字符基字的竖直方向上所含成分将藏文字分成了8个大类,对不同类型藏文字分析了其生成模型及生成算法,经测试可自动生成符合现代藏文文法的所有现代藏文字。Character is the basic unit of tion is the foundation of natural language Language as well as text. The technology of automatic character- genera- processing, which provides theoretical data for word characteristics analysis, input method design, sorting, speech processing and information entropy research of Tibetan characters in natural language processing. In this article we summarized the rules of Tibetan characters based on the analysis of the structure of Tibetan characters and classified Tibetan characters into 8 categories based on elements containing on the vertical direction of the words we studied. Furthermore, we analyzed generation model and algorithm of different types of Tibetan characters, and the test proved that our model can automatically generate all modem Tibetan characters which follow the rule of modem Tibetan grammar.

关 键 词:中文信息处理 藏文字 自动生成 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象