检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:林河水[1] 程伟[1] 曹晖[1] 李文波[1] 吴健[1] 孙玉芳[1]
机构地区:[1]中国科学院软件所开放系统与中心信息处理中心,中国科学院研究生院北京100080
出 处:《中文信息学报》2004年第5期36-41,共6页Journal of Chinese Information Processing
基 金:国家"8 6 3计划"资助项目 (2 0 0 3AA1Z2 110 );中国科学院知识创新资助项目 (KGCX2 -SW - 5 0 4 )
摘 要:本文介绍了一种实现藏文字典序排序的方法 ,它针对藏文“大字丁字符集”编码方案。通过引入有(无 )前加基字符的概念 ,它把待排序的藏字预处理为有 (无 )前加基字符、前加字符、基字 (基字符或者字丁 )、后加字符、再后加字符串后 ,再行比较 ,从而避免拆分字丁。本实现方法符合ISO/IEC14 6 5This thesis discusses the machine ordering of Tibetan words on the basis of linear characters, which means any pre-composed forms or vertical stack can be processed as a single Tibetan character. Our method is to divide Tibetan words into two types: with or without pre-consonant character. And by defining base characters without pre-consonants and base characters with pre-consonants, we convert the Tibetan words into all kinds of strings like base characters without pre-consonants, base characters with pre-consonants, pre-consonant characters, base characters, post-consonant characters, ppost-consonant characters. Then compare all the defined units with their weight and acquire results. The method is according with the semantic of ISO/IEC 14651.
关 键 词:计算机应用 中文信息处理 藏文 字典序 机器排序
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.126