一种符合ISO14651语义的藏文排序实现方法  被引量:19

A Method for Ordering Tibetan Text in Arccord with ISO 14651

在线阅读下载全文

作  者:林河水[1] 程伟[1] 曹晖[1] 李文波[1] 吴健[1] 孙玉芳[1] 

机构地区:[1]中国科学院软件所开放系统与中心信息处理中心,中国科学院研究生院北京100080

出  处:《中文信息学报》2004年第5期36-41,共6页Journal of Chinese Information Processing

基  金:国家"8 6 3计划"资助项目 (2 0 0 3AA1Z2 110 );中国科学院知识创新资助项目 (KGCX2 -SW - 5 0 4 )

摘  要:本文介绍了一种实现藏文字典序排序的方法 ,它针对藏文“大字丁字符集”编码方案。通过引入有(无 )前加基字符的概念 ,它把待排序的藏字预处理为有 (无 )前加基字符、前加字符、基字 (基字符或者字丁 )、后加字符、再后加字符串后 ,再行比较 ,从而避免拆分字丁。本实现方法符合ISO/IEC14 6 5This thesis discusses the machine ordering of Tibetan words on the basis of linear characters, which means any pre-composed forms or vertical stack can be processed as a single Tibetan character. Our method is to divide Tibetan words into two types: with or without pre-consonant character. And by defining base characters without pre-consonants and base characters with pre-consonants, we convert the Tibetan words into all kinds of strings like base characters without pre-consonants, base characters with pre-consonants, pre-consonant characters, base characters, post-consonant characters, ppost-consonant characters. Then compare all the defined units with their weight and acquire results. The method is according with the semantic of ISO/IEC 14651.

关 键 词:计算机应用 中文信息处理 藏文 字典序 机器排序 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象