藏语语料库

作品数:11被引量:58H指数:5
导出分析报告
相关领域:自动化与计算机技术语言文字更多>>
相关作者:才让加吉太加才藏太才智杰头旦才让更多>>
相关机构:青海师范大学西北民族大学西藏大学青海省藏文信息研究中心更多>>
相关期刊:《计算机应用研究》《西北民族大学学报(自然科学版)》《计算机工程与应用》《青海师范大学学报(自然科学版)》更多>>
相关基金:国家社会科学基金国家重点基础研究发展计划国家自然科学基金国家语委科研项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
藏语语料库语言学的研究内容与应用
《青海师范大学学报(藏文版)》2019年第2期49-57,共9页索南才让 
国家社会科学基金项目:“基于语料库的《八大藏戏》词汇研究”(项目编号:17XYY030);教育部“春晖计划”合作科研项目“现代藏语虚词知识库的构建研究”(项目编号:Z20170532018Z002)阶段性成果。
藏语语料库是一门与应用语言学、自然语言处理及计算机科学直接相关的新型交叉学科。它的目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。文章通过对其语料库的概念、分类、发展历...
关键词:语料库语言学 发展历程 藏语言 
面向语音合成的藏语单音素与三音素自动切分算法研究被引量:5
《计算机应用研究》2013年第11期3272-3275,共4页张金溪 李永宏 单广荣 李照耀 江静 
国家自然科学基金资助项目(61262052);西北民族大学中央高校基本科研业务费专项项目(ycx12024)
在构建藏语语料库时要对语音进行音素切分,采用了两种方法,即基于单音素HMM模型的自动切分方法和基于三音素HMM模型的自动切分方法。通过实验分析了这两种HMM模型的自动切分结果的准确率程度,其中单音素、三音素总的平均切分准确度分别...
关键词:语音合成 藏语语料库 单音素 三音素 自动切分 
藏语语料库管理系统中读写数据粒度问题的研究
《青海师范大学学报(自然科学版)》2012年第2期26-29,共4页力毛措 
973计划前期研究专项(2010CB334708);国家自然科学基金项目;项目批准号:61063033
应用体系的执行效率、访问速度、服务器的负荷、数据处理的安全性、读写数据的粒度是影响系统性能的主要因素.本文在分析藏语语料库应用体系的基础上对藏语语料库管理系统中读写数据的粒度问题进行了探讨,并采用值对象解决了用户通过大...
关键词:数据粒度 值对象 藏语语料库(TLDBMS) 
藏语语料库TEI标记规范探讨被引量:4
《中文信息学报》2011年第4期66-70,81,共6页扎西加 高定国 
国家自然科学基金资助项目(61063015);教育部人文社科基金青年项目(10YJCZH033)
在语言信息处理过程中,大规模真实文本处理已成为一个研究热点。藏语语料库的标记在汉藏英机器翻译、信息检索、文本数据挖掘、词典编纂的研究工作中占很重要的地位。为了便于数据交换和共享,该文基于TEI编码的藏语语料,对藏语语料库中...
关键词:藏语 语料库 TEI标记 
藏语语料库加工方法研究被引量:13
《计算机工程与应用》2011年第6期138-139,146,共3页才让加 
国家语委基金(No.MZ115-018);国家社会科学基金(No.07BYY035);国家社会科学重点基金(No.05AYY001);973计划前期研究专项(No.2010CB334708)
为了使藏语语料库具有规范性、统一性和实用性,提高加工的整体水平,在藏语语料库的加工过程中首先要对五花八门的藏语语料库进行整理和统一,得到高质量的原始语料库,其次确定藏语原料库加工的切分单位,针对藏语的语法特征提出藏语语料...
关键词:藏语语料库 规范 词类 标记集 词典 分词标注 
藏语语料库词类描述方法研究被引量:7
《计算机工程与应用》2011年第4期146-148,共3页才让加 
国家社会科学基金(No.07BYY035);国家社会科学重点基金(No.05AYY001);国家语委项目(No.MZ115-018);国家973计划前期研究专项(No.2010CB334708)
藏语词类的基本属性描述是藏语语料库多级加工的基础,根据藏语语料库多级加工的实际需要,通过对藏语词类的语法、语义信息的描述和藏语词语后添加方式的分析,可以为计算机对藏文的词语搭配结构、语法信息、语义信息和词类标记进行自动...
关键词:自然语言 藏文 词类标记 语法信息 
班智达藏文标注词典设计被引量:15
《中文信息学报》2010年第5期46-49,共4页才智杰 才让卓玛 
国家语委资助项目(MZ05-118);国家社会科学基金资助项目(07BYY035;09XYY024)
语料库加工是一项庞大的语言工程,其中分词标注是最基础性的工作,而分词标注词典是标注系统的重要组成,词典设计的优劣直接关系着分词标注的速度和效率。在设计国家语委项目《班智达藏文自动标注系统》的基础上,给出了分词标注词典库的...
关键词:藏语语料库 分词 标注 词典 索引 
藏语语料库词语分类体系及标记集研究被引量:18
《中文信息学报》2009年第4期107-112,共6页才让加 
国家语委资助项目(MZ115-018);国家社会科学基金(07BYY035);国家社会科学重点基金(05AYY001)
青海师范大学藏文信息处理与机器翻译省级重点实验室已完成1 000万字的藏语语料库的加工实验,加工的主要目的是使计算机能够对藏语语料库中的藏语词语进行自动切分和自动标注。该文在对大规模藏语语料库进行自动切分和人工分析的基础上...
关键词:计算机应用 中文信息处理 语料库 藏语词语 分类体系 标记集 
基于HMM的藏语语料库词性自动标注研究被引量:6
《西北民族大学学报(自然科学版)》2009年第1期42-45,共4页苏俊峰 祁坤钰 本太 
<现代藏语语法信息词典>建设研究;甘肃省社科规划项目;项目编号2007-04
针对藏语区别于英语和汉语,分析藏语的构形特征,得到词性标注集.从人工标注的语料中统计词和词性频率以及训练得到二元语法的HMM模型参数,运用Viterbi算法完成基于统计方法的词性标注.
关键词:藏语词性标注 词性标注集 HMM 
藏语语料库的词性分类方法研究被引量:5
《青海师范大学学报(哲学社会科学版)》2005年第4期112-114,共3页才让加 吉太加 
国家语委资助项目<藏语语料库切分规范及辅助工具研究>(MZ115-018)
本文根据藏语语料库建设的实际需求,提出了一个基于语料库的藏语词类标注和分类方法,以其为藏语语料库建设提供一个可供参考的标准和方法。
关键词:藏语 语料库 词类 语法信息 标注 
检索报告 对象比较 聚类工具 使用帮助 返回顶部