基于语料库的藏文字属性分析系统设计  被引量:10

Design of Tibetan Character Property Analysis System Based on Corpora

在线阅读下载全文

作  者:才智杰[1] 才让卓玛[1] 

机构地区:[1]青海师范大学藏文信息处理省部共建教育部重点实验室,西宁810008

出  处:《计算机工程》2011年第22期270-272,共3页Computer Engineering

基  金:国家自然科学基金资助项目(61163018);国家"973"计划前期研究专项基金资助项目(2010CB334708);国家社会科学基金资助项目(09XYY024);青海省科技厅应用基础研究计划基金资助项目(2011-Z-755);青海师范大学科研创新计划基金资助项目;青海师范大学中青年科研基金资助项目

摘  要:通过对藏语语料库的统计和现代藏文字结构的分析,研究现代藏文字属性分析系统的模型,设计基本构件字表库、组合构件字表库、粗粒度结构字表库及细粒度结构字表库,并阐述各字表库的结构特征,介绍藏文字属性分析算法。运用该算法及藏文字属性分析系统模型,解析现代藏文字的使用频度、结构、字长、构件分解、各构件的位置及频度等属性,从而为藏文键盘布局、藏文输入法研究、藏文搜索引擎、机器翻译和网络信息安全等提供理论依据。According to the statistical analysis of Tibetan corpus and the research of the Tibetan grammar,this paper gives an analysis system model of Tibetan character property,meanwhile designs basic components character database,combination component character data base,coarse-grained structure character database,fine-grained structure character database,and the analysis algorithm of character property for the system.This system enables to conduct deep research on properties for modern Tibetan characters,and provides theoretical foundation for the Tibetan keyboard layout,the Tibetan input method,the Tibetan search engine,the Tibetan-related machine translation,and the network security.This system promotes the further development of Tibetan information processing.

关 键 词:中文信息处理 属性 构件 字结构 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象