国家自然科学基金(61063033)

作品数:11被引量:59H指数:5
导出分析报告
相关作者:才让加周毛先孙茂松刘群赵海兴更多>>
相关机构:青海师范大学清华大学陕西师范大学中国科学院更多>>
相关期刊:《北京大学学报(自然科学版)》《青海师范大学学报(自然科学版)》《中文信息学报》《计算机仿真》更多>>
相关主题:藏文机器翻译自然语言处理藏语神经网络更多>>
相关领域:自动化与计算机技术语言文字更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于组块分割的无监督藏文句法分析方法研究
《计算机仿真》2022年第5期278-282,328,共6页卓玛扎西 才让加 色差甲 班玛宝 
国家自然科学基金资助项目(61662061,61063033);青海省藏文信息处理与机器翻译重点实验室(2020-ZJ-Y05)。
由于藏文句法树库的构建在藏语自然语言处理中是一项专业性强及费时费力的工作,目前还没有公开的藏文句法树库,这一现状导致有监督方法在藏文句法分析任务中的运用存在较大困难。鉴于此,提出了一种基于组块分割的无监督藏文句法分析方法...
关键词:自然语言处理 组块分割 无监督 藏文句法分析 
融合双通道音节特征的藏文La格例句自动分类模型被引量:5
《北京大学学报(自然科学版)》2022年第1期91-98,共8页班玛宝 才让加 张瑞 色差甲 卓玛扎西 
国家自然科学基金(61662061,61063033,61966031);国家重点研发计划(2017YFB1402200);青海省藏文信息处理与机器翻译重点实验室项目(2020-ZJ-Y05);青海省科技厅项目(2019-SF-129);青海省重点实验室项目(2013-Z-Y17,2014-Z-Y32,2015-Z-Y03)资助。
基于藏文La格(■)例句的自动分类在藏语自然语言处理领域的重要性,根据藏文La格的用法和添接规则,在对藏文La格例句进行分类并定义分类概念的基础上,提出一种融合双通道音节特征的藏文La格例句自动分类模型。该模型首先使用word2vec和Gl...
关键词:自然语言处理 双通道音节特征 藏文La格例句 自动分类 
面向汉藏机器翻译后处理的藏文虚词纠错模型被引量:8
《计算机仿真》2021年第12期391-396,共6页华果才让 班玛宝 桑杰端珠 才让加 
国家自然科学基金项目(61662061,61063033);国家重点研发计划(2017YFB1402200);青海省藏文信息处理与机器翻译重点实验室(2020-ZJ-Y05)。
机器翻译是自然语言处理的主要分支之一,在促进政治、经济、文化交流等方面起着重要作用。目前汉藏机器翻译质量还有待提高,汉文到藏文的译文中容易出现语法错误,尤其普遍存在藏文虚词的翻译错误。分析汉藏机器翻译译文中的藏文虚词错...
关键词:机器翻译 掩码语言模型 预训练 微调 藏文虚词纠错 
基于神经网络的藏文正字检错法被引量:3
《中文信息学报》2020年第12期48-53,64,共7页色差甲 慈祯嘉措 才让加 华果才让 
国家重点研发计划项目(2017YFB1402200);国家自然科学基金(61063033,61662061);国家社会科学基金(14BYY132);青海省科技厅项目(2020-ZJ-704,2019-SF-129)。
在缺乏标注数据的条件下,该文将藏文正字检错任务视为一个分类问题:首先从语言学知识中构建音节混淆子集并给每个原句加噪,然后建立深层双向表征的BERT作为分类模型,最后为了证明该方法的有效性,构建两个基线模型和三种不同领域的测试集...
关键词:藏文正字检错 加噪算法 BERT模型 
基于迭代式回译策略的藏汉机器翻译方法研究被引量:8
《中文信息学报》2020年第11期67-73,83,共8页慈祯嘉措 桑杰端珠 孙茂松 周毛先 色差甲 
国家自然科学基金(61063033,61662061);国家重点研发计划(2017YFB1402200)。
该文通过稀缺语言资源条件下机器翻译方法的研究以提高藏汉机器翻译质量,同时希望对语言资源匮乏的其他少数民族语言机器翻译研究提供借鉴。首先该文使用164.1万句对藏汉平行语言资源数据在Transformer神经网络翻译模型上训练一个基线系...
关键词:藏汉 回译 稀缺资源 自动筛选 神经网络 
融合单语语言模型的藏汉机器翻译方法研究被引量:5
《中文信息学报》2019年第12期61-66,共6页慈祯嘉措 桑杰端珠 孙茂松 色差甲 周毛先 
国家自然科学基金(61063033,61662061);国家重点研发计划(2017YFB1402200)
由于藏汉平行语料匮乏,导致藏汉神经网络机器翻译效果欠佳,该文提出了一种将藏语单语语言模型融合到藏汉神经网络机器翻译的方法,首先利用神经网络实现藏语单语语言模型,然后使用Transformer实现藏汉神经网络机器翻译模型,最后将藏语单...
关键词:藏语 语言模型 机器翻译 融合 神经网络 
基于Naive Bayes的藏文人名性别自动识别被引量:2
《青海师范大学学报(自然科学版)》2017年第4期11-15,共5页贡保才让 色差甲 慈祯嘉措 桑杰端珠 才让加 
国家自然科学基金(61063033,61662061);教育部重点实验室项目(教技函[2010]52号);教育部“创新团队发展计划”滚动支持计划(IRT_15R40);青海省重点实验室项目(2013-Z-Y17、2014-Z-Y32、2015-Z-Y03);青海省科技厅项目(2015-SF-520);青海省科技计划项目(2017-GX-146)
藏文指代消解是藏文信息处理的重要内容也是难点之一.本文利用Naive Bayes模型实现了藏文人名性别的自动识别,从而达到人称代词消解的目的.本方法根据人名的结构和用字(syllable)信息,利用Naive Bayes模型进行机器学习,对3463个藏族人...
关键词:藏族人名 机器学习 NAIVE BAYES 自动识别 
基于词对依存分类的藏语树库半自动构建研究被引量:8
《中文信息学报》2013年第5期166-172,共7页华却才让 姜文斌 赵海兴 刘群 
国家自然科学基金资助项目(61063033,61163018,61363055);教育部“春晖计划”合作科研资助项目(Z2012102)
依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,...
关键词:藏语依存句法 词对依存分类 藏语树库 藏语依存标注工具 
面向自然语言处理的大规模汉藏(藏汉)双语语料库构建技术研究被引量:18
《中文信息学报》2011年第6期157-161,共5页才让加 
国家自然科学基金资助项目(61063033);973前期研究专项资助项目(2010CB334708);教育部“长江学者和创新团队发展计划”资助项目(IRT1068)
双语语料库建设及其自动对齐研究对计算语言学的发展具有重要的意义。目前国内外已建立了各类汉英双语语料库以及服务于汉英机器翻译的双语对齐语料库和短语库。为了少数民族语言的机器翻译的研究从一开始就从较高起点起步,需要对汉藏...
关键词:汉藏机器翻译 汉藏双语语料库 编码 对齐技术 
基于WAMP的藏汉英互译在线词典的设计与实现被引量:2
《中文信息学报》2011年第4期63-65,共3页周毛先 头旦才让 才让加 
国家自然科学基金资助项目(61063033);973计划前期研究专项(2010CB334708)
根据目前在线藏汉英词典使用的实际需求,青海师范大学藏文信息处理省部共建教育部重点实验室设计实现了一种基于WAMP平台的藏汉英互译在线词典,并给出了词典数据库和查询页面的具体设计方法和关键代码。经测试,该在线词典根据用户的需要...
关键词:藏文 在线词典 WAMP B/S结构 数据库 
检索报告 对象比较 聚类工具 使用帮助 返回顶部