一种符合ISO14651语义的藏文排序实现方法被引量：19

A Method for Ordering Tibetan Text in Arccord with ISO 14651

作　　者：林河水[1] 程伟[1] 曹晖[1] 李文波[1] 吴健[1] 孙玉芳[1]

机构地区：[1]中国科学院软件所开放系统与中心信息处理中心,中国科学院研究生院北京100080

出　　处：《中文信息学报》2004年第5期36-41,共6页Journal of Chinese Information Processing

基　　金：国家"8 6 3计划"资助项目 (2 0 0 3AA1Z2 110 );中国科学院知识创新资助项目 (KGCX2 -SW - 5 0 4 )

摘　　要：本文介绍了一种实现藏文字典序排序的方法 ,它针对藏文“大字丁字符集”编码方案。通过引入有(无 )前加基字符的概念 ,它把待排序的藏字预处理为有 (无 )前加基字符、前加字符、基字 (基字符或者字丁 )、后加字符、再后加字符串后 ,再行比较 ,从而避免拆分字丁。本实现方法符合ISO/IEC14 6 5This thesis discusses the machine ordering of Tibetan words on the basis of linear characters, which means any pre-composed forms or vertical stack can be processed as a single Tibetan character. Our method is to divide Tibetan words into two types: with or without pre-consonant character. And by defining base characters without pre-consonants and base characters with pre-consonants, we convert the Tibetan words into all kinds of strings like base characters without pre-consonants, base characters with pre-consonants, pre-consonant characters, base characters, post-consonant characters, ppost-consonant characters. Then compare all the defined units with their weight and acquire results. The method is according with the semantic of ISO/IEC 14651.

关键词：计算机应用中文信息处理藏文字典序机器排序

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种符合ISO14651语义的藏文排序实现方法被引量：19

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种符合ISO14651语义的藏文排序实现方法 被引量：19

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

一种符合ISO14651语义的藏文排序实现方法被引量：19