藏文字符的向量模型及构件特征分析  被引量:6

Vector Space Models and Component Features Analysis of Tibetan Characters

在线阅读下载全文

作  者:才智杰[1] 才让卓玛[1,2] 

机构地区:[1]青海师范大学,藏文信息处理省部共建教育部重点实验室,青海西宁810008 [2]陕西师范大学计算机科学学院,陕西西安710062

出  处:《中文信息学报》2016年第2期202-206,共5页Journal of Chinese Information Processing

基  金:国家自然科学基金(61163018,61262051,61363055);教育部“春晖计划”合作科研项目(Z2012093);国家社科基金(13BYY141);“长江学者和创新团队发展计划”创新团队资助项目(IRT1068);青海省科技厅应用基础研究计划基金(2011-Z-755,2011-Z-754);青海师范大学科研创新计划基金

摘  要:藏文字属性分析是藏文信息处理的一项基础性工作,对藏文信息处理的研究和藏语文教学具有重要的参考价值及指导意义。藏文字是一种特殊的拼音文字,由1~7个基本构件横向和纵向拼接而成。因而藏文字符的属性包括其组成的构件及其构件的位置特征,以及藏文字的使用频度、结构、字长等属性特征。该文通过分析藏文字的结构,分别建立了藏文字及藏文字符串的向量模型VMTT、VMTS和藏文字符串的稀疏域模型SLM,并在向量模型和稀疏域模型上研究了藏文字符的构件特征。Tibetan characters property is essential for Tibetan information processing,and it is substantial significance in education and scientific research.Because Tibetan characters writing is directed by both horizontal and vertical 1-7Tibetan characters,the properties of Tibetan characters include the structure,length,frequency of Tibetan characters and the locality features of each characters.This paper establishes vector model(VMTT)of Tibetan characters,vector model(VMTS)and sparse-land model(SLM)of Tibetan character string,and conducts the component feature analysis of Tibetan characters based on these models.

关 键 词:中文信息处理 向量模型 稀疏域模型 构件 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象