检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李苗苗 高定国 普次仁 扎西仓觉 LI Miao-miao, GAO Ding-guo, PU Tsering, TRASHI CangJue (Tibetan Information Technology Engineering Research Center, Tibetan University, Lhasa 850000, China)
机构地区:西藏大学藏文信息技术研究中心,西藏拉萨850000
出 处:《电脑知识与技术》2016年第2期179-181,共3页Computer Knowledge and Technology
基 金:国家自然科学基金资助项目(61331013,61540060); 西藏自治区2015年度高等学校人文社会科学研究项目(sk2015-06)
摘 要:藏字的频度统计是藏文信息处理技术领域的一项基础研究,对藏文拼写检查、字典建立等应用有着重要的意义。该文根据藏文音节的特性,结合Unicode藏文基本集的编码特征,提出了计算机统计藏文字频的方法,设计实现了藏文字频统计软件,并在藏文样本语料中进行测试,证明了方法的正确性。Word frequency statistics,which has important significance to the Tibetan spell checking, Tibetan dictionary building and other suchlike applications, is a basic research in the field of Tibetan information processing technology. According to the characteristics of Tibetan syllables, combined with the features of encoding of Unicode Tibetan basic set, we proposed a method to statistic Tibetan word with computer ,and implemented the software ,which has been tested in a sample corpus, and achieved satisfactory result.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.46