小字符集现代藏文排序技术的研究  被引量:3

Research about Tibetan-sort based on ISO/IEC 10646(Tibetan)

在线阅读下载全文

作  者:完么扎西[1] 尼玛扎西[2] 

机构地区:[1]西藏大学工学院计科系,拉萨850000 [2]西藏大学现代教育技术中心,拉萨850000

出  处:《计算机工程与应用》2013年第8期146-150,共5页Computer Engineering and Applications

基  金:科技部973计划前期研究专项项目课题(No.2009CB326201);"长江学者与创新团队发展计划"藏文信息技术创新团队计划(No.IRT0975);"西藏大学211工程"三期项目

摘  要:构成藏文音节的字母具有一定的顺序,ISO/IEC10646(Tibetan)中每个藏文字符规定了排序码,但是藏文音节的构造复杂性使得藏文不能直接按构成藏文音节的字母顺序来排序,也不能直接应用这些排序码,提出了基于ISO/IEC10646(Tibetan)的藏文排序算法,主要思想是:从文本中读入藏文音节,并把它转化为一维的字母串;识别基字及调整构成藏文音节的字母(构件)顺序,并且在缺构件位置上添加相应的空格符;用快速排序法对藏文音节串进行排序;构成藏文音节的字母(构件)顺序调回到原来的顺序,去除空格符,并输出。The component letters of Tibetan syllables have certain ordering, each Tibetan character has stipulated the sorting code in the ISO/IEC 10646 (Tibetan), but the structural complexity of Tibetan syllables cause that Tibetan cannot be sorted according to the order of letters which form Tibetan syllables and cannot use their sorting codes directly, this paper proposes the Tibetan-sort algorithm based on the ISO/IEC 10646 (Tibetan), the main idea is: it reads in Tibetan syllables from the text, and transforms them into the one-dimensional letters string; it recognizes the base characters and adjusts the order of letters which form Tibetan syllables and add corresponding blank characters in the positions of lacking letters which form Tibetan syllables; it sorts Tibetan syllable string with the quick-sort method; it adjusts the ordering of component letters of Tibetan syllables back to the original ordering, removes the blank characters, and outputs as well.

关 键 词:藏文音节 现代藏文字 词典排序规则 ISO IEC 10646(Tibetan) 藏文排序 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象