检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]青海师范大学计算机系,青海西宁810008 [2]青海师范大学物理系,青海西宁810008 [3]武汉大学计算机学院,湖北武汉430072
出 处:《中文信息学报》2009年第4期118-123,共6页Journal of Chinese Information Processing
基 金:青海省重点科技攻关项目(2006-N-176)
摘 要:目前,国内少数民族地区的书报印刷行业大多使用北大方正、华光藏文排版系统。这些软件的编码各异,致使有限的藏文资源无法实现交换和共享,造成这种现象的原因是各种软件编码体系不一致。解决这个问题的根本途径是将各种不同体系的藏文编码转换为符合国际标准的编码。该文以华光Windows藏文字符编码为例,首先对每个藏文字符进行构字分析,然后采用分表分组技术构造出每个字符符合ISO/IEC 10646标准的编码序列,最后采用hash技术优化查询算法,实现非标准的藏文字符编码向标准编码序列转换。At present, many publishing systems, such as Bei Da Fang Zheng and Hua Guang are widely applied in the printing industry for issuing Tibetan publications in the domestic minority areas. Due to the different coding system in these systems, the valuable electronic resources for Tibetan languages cannot be exchanged and shared. This paper proposes a solution to convert Tibetan code of different system into the international standard. It further realizes such conversion system for Hua Guang windows encoding of Tibetan into the ISO/IEC 10646 encoding, with a designed sub-table&group strategy in hash.
关 键 词:计算机应用 中文信息处理 藏文 字符集标准 编码转换 分表分组技术
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.185