藏文字频统计软件的设计与实现  被引量:1

The Design and Implementation of Tibetan Word Frequency Statistics Software

在线阅读下载全文

作  者:李苗苗 高定国 普次仁 扎西仓觉 LI Miao-miao, GAO Ding-guo, PU Tsering, TRASHI CangJue (Tibetan Information Technology Engineering Research Center, Tibetan University, Lhasa 850000, China)

机构地区:西藏大学藏文信息技术研究中心,西藏拉萨850000

出  处:《电脑知识与技术》2016年第2期179-181,共3页Computer Knowledge and Technology

基  金:国家自然科学基金资助项目(61331013,61540060); 西藏自治区2015年度高等学校人文社会科学研究项目(sk2015-06)

摘  要:藏字的频度统计是藏文信息处理技术领域的一项基础研究,对藏文拼写检查、字典建立等应用有着重要的意义。该文根据藏文音节的特性,结合Unicode藏文基本集的编码特征,提出了计算机统计藏文字频的方法,设计实现了藏文字频统计软件,并在藏文样本语料中进行测试,证明了方法的正确性。Word frequency statistics,which has important significance to the Tibetan spell checking, Tibetan dictionary building and other suchlike applications, is a basic research in the field of Tibetan information processing technology. According to the characteristics of Tibetan syllables, combined with the features of encoding of Unicode Tibetan basic set, we proposed a method to statistic Tibetan word with computer ,and implemented the software ,which has been tested in a sample corpus, and achieved satisfactory result.

关 键 词:藏文 字频 统计 

分 类 号:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象