完么扎西

作品数:12被引量:30H指数:3
导出分析报告
供职机构:青海师范大学民族师范学院更多>>
发文主题:藏语信息熵自动分词机器翻译藏文更多>>
发文领域:自动化与计算机技术语言文字更多>>
发文期刊:《西藏大学学报(社会科学版)》《北京大学学报(自然科学版)》《高原科学研究》《计算机工程与应用》更多>>
所获基金:国家社会科学基金长江学者和创新团队发展计划国家重点基础研究发展计划国家自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
融合依存句法的深度学习藏语句子分割研究
《中文信息学报》2022年第10期73-80,共8页头旦才让 仁青东主 尼玛扎西 完么扎西 才藏太 
国家社会科学基金(19XYY021);青海省科技厅项目(2020-ZJ-704);藏语智能信息处理及应用国家重点实验室自主课题项目(2022-SKL-017)。
藏语句子分割是藏语自然语言处理中的一项重要且基础性的研究工作。该文根据藏语句子结构特征,在分析藏语句子分割规则与难点的基础上,提出一种融合依存句法的藏语句子分割模型。该模型首先通过词嵌入和藏语依存句法信息嵌入将输入序列...
关键词:藏语 依存句法 双向LSTM+CRF 句子分割 
基于规则与统计相结合的藏文文本自动查错方法研究被引量:2
《中文信息学报》2022年第2期69-75,共7页完么扎西 尼玛扎西 
国家社会科学基金(19XYY021)。
针对目前藏文文本自动查错方法的不足,该文提出了一种基于规则和统计相结合的自动查错方法。首先以藏文拼写文法为基础,结合形式语言与自动机理论,构造37种确定型有限自动机识别现代藏文字;然后利用查找字典的方法识别梵音藏文字;最后...
关键词:藏文文本自动查错 非字错误 真字词错误 
现代藏语数量短语的句法语义规则研究被引量:1
《高原科学研究》2021年第3期78-83,共6页完么扎西 
国家社科基金项目(19XYY021).
数量短语作为表达“量”范畴的基本语法手段,是人们认识世界、表达世界的概念之一。文章通过对藏语语料的统计和分析,归纳了藏语数量短语的两种语法结构,并采用基于特征结构和合一运算的短语结构语法对两种结构的整体性质和内部组合情...
关键词:藏语数量短语 语法结构 句法功能 
现代藏语信息熵的估算及语言模型的复杂度
《电子技术与软件工程》2020年第17期213-215,共3页完么扎西 
国家社科基金项目(19XYY021)资助
本文将信息论的方法引入藏文信息处理技术研究领域,采用一种基于统计语言模型的信息熵估计方法,在300多万(音节)字的藏语单语语料规模上,对不同藏语语言模型估算了信息熵及其复杂度。
关键词:统计语言模型 信息熵 复杂度 
基于统计的汉藏机器翻译系统关键技术研究与实现被引量:5
《高原科学研究》2018年第2期97-104,共8页群诺 尼玛扎西 完么扎西 嘎玛扎西 
国家重点研发计划项目(2017YFB1402200);西藏自治区科技计划重大科技专项(ZDZX2017000136);西藏自治区科技计划重点项目(2015XZ01G25)
随着统计机器学习方法的迅速普及,机器翻译技术有了突飞猛进的进展,但是目前基于汉藏两种语言的机器翻译系统研究还处于启蒙阶段。文章主要研究和扩充了已有的统计翻译模型,对藏文文法的特殊性进行了适当的处理,包括藏文动词的时态处理...
关键词:汉藏机器翻译 调序算法 树到串翻译模型 自动分词与标注 
现代藏文信息熵及其属性被引量:2
《西藏大学学报(社会科学版)》2017年第2期51-57,共7页完么扎西 尼玛扎西 
文章将信息论的方法引入藏文信息处理技术研究领域,利用统计的方法研究了以字符为单位和以音节字为单位的藏文信息熵。通过对275万多音节字的大规模藏语单语语料进行统计,给出了以字符为统计单位和以音节字为统计单位的现代藏文的熵,其...
关键词:藏文字符 藏文(音节)字 藏文信息熵 
藏文的信息熵与输入法键盘设计被引量:3
《北京大学学报(自然科学版)》2017年第3期405-411,共7页完么扎西 尼玛扎西 
西藏大学研究生高水平人才培养项目(XZDX-2015BS)资助
在研究和分析藏文拼写文法的基础上,对计算机藏文快速输入法键盘键位布局进行形式化描述,推导计算机藏文键盘键位布局规则及方法。综合考虑藏文字符的字频统计结果、计算机藏文键盘键位布局规则、德沃拉克键盘键位击键方便指数以及为了...
关键词:藏文输入法 键盘键位布局 无重码 藏文信息熵 
藏语自动分词中的数词识别方法研究被引量:1
《西藏大学学报(社会科学版)》2015年第5期96-104,110,共10页完么扎西 尼玛扎西 
藏语自动分词技术是藏语自然语言处理的基础。文章通过分析藏语真实文本中的数词分类、数词词形以及数词结构等,提出了一种基于规则的识别方法。文章中的藏语数词识别思想为:在自动分词过程中,通过判断待切分的词(w)i和已切分的词(wi-1...
关键词:藏语自动分词 藏语数词 藏语数词结构 
藏语词语兼类情况及识别规则库
《西藏大学学报(社会科学版)》2014年第5期87-94,共8页完么扎西 
同其他语言一样藏语词性的兼类现象普遍存在,这给词性标注工作带来了巨大困难,对兼类词的处理是藏语词性标注的关键所在。文章利用传统和现代藏语语法理论,在分析藏语真实文本的基础上,归纳了藏语兼类词的种类,提出了兼类词的标注原则...
关键词:藏文信息处理 兼类词 标注原则 识别规则库 
藏语自动分词中的几个关键问题的研究被引量:7
《中文信息学报》2014年第4期132-139,共8页完么扎西 尼玛扎西 
科技部973计划前期研究专项项目课题"藏语语音识别技术研究"(2009CB326201)资助;"长江学者与创新团队发展计划"藏文信息技术创新团队(IRT0975)计划资助;"西藏大学211工程"三期项目资助
在分析现有的藏语自动分词方法基础上,该文通过分析藏文构词规则、句法结构、词的前后词性关系、后加字的添接法和格助词的用法等来重点研究了未登录词、紧缩词和交集型歧义的识别及处理方法,并提出了"重组法","排除—还原法"和"词性规...
关键词:未登录词 紧缩词 交集型歧义 
检索报告 对象比较 聚类工具 使用帮助 返回顶部