检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]青海师范大学计算机学院藏文信息处理教育部重点实验室,青海西宁810008 [2]清华大学计算机科学与技术系清华信息科学与技术国家实验室,北京100084
出 处:《高原科学研究》2017年第1期98-103,共6页Plateau Science Research
基 金:国家自然科学基金项目(61163018;61262051;61662061);国家哲学社会科学基金项目(13BYY141;16BYY167);教育部"春晖计划"合作科研项目(Z2012093;Z2016077);青海省基础研究项目(2017-ZJ-767;2015-SF-520);"长江学者和创新团队发展计划"创新团队资助项目(IRT1068);青海省重点实验室项目(2013-Z-Y17;2014-Z-Y32;2015-Z-Y03);藏文信息处理与机器翻译重点实验室(2013-Y-17)
摘 要:字是语言文字的基本组成单位,文字自动生成是自然语言处理的基础,为自然语言处理中字属性分析、输入法设计、排序、语音处理和藏文字符信息熵研究等提供理论数据。文章在分析藏文字结构的基础上归纳了藏文构字规则,并以藏文字的核心字符基字的竖直方向上所含成分将藏文字分成了8个大类,对不同类型藏文字分析了其生成模型及生成算法,经测试可自动生成符合现代藏文文法的所有现代藏文字。Character is the basic unit of tion is the foundation of natural language Language as well as text. The technology of automatic character- genera- processing, which provides theoretical data for word characteristics analysis, input method design, sorting, speech processing and information entropy research of Tibetan characters in natural language processing. In this article we summarized the rules of Tibetan characters based on the analysis of the structure of Tibetan characters and classified Tibetan characters into 8 categories based on elements containing on the vertical direction of the words we studied. Furthermore, we analyzed generation model and algorithm of different types of Tibetan characters, and the test proved that our model can automatically generate all modem Tibetan characters which follow the rule of modem Tibetan grammar.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3