高定国

作品数:41被引量:139H指数:7
导出分析报告
供职机构:西藏大学更多>>
发文主题:藏文藏语OPENTYPE计算机应用中文信息处理更多>>
发文领域:自动化与计算机技术语言文字文化科学电子电信更多>>
发文期刊:《中国科技博览》《计算机时代》《中文信息学报》《重庆理工大学学报(自然科学)》更多>>
所获基金:国家自然科学基金教育部人文社会科学研究基金国家语委科研项目国家级教学团队建设项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
藏语语声识别声学模型建模单元研究
《应用声学》2025年第2期405-412,共8页王嘉文 高定国 索朗曲珍 
国家自然科学基金项目(62166038);四川省科技计划项目(2023YFQ0044);西藏大学研究生“高水平人才培养计划”项目(2021-GSP-S126)。
语声识别建模单元的选择是藏语语声识别任务中的关键问题,决定了语声识别声学模型的训练质量和识别准确性。针对藏语语声识别研究中多种建模单元在不同数据集上进行的实验,导致难以探寻合适建模单元进行藏语语声识别,使得相关科研成果...
关键词:藏语 语声识别 声学模型 建模单元 
基于数据增强的藏语拉萨方言语音识别研究
《电脑知识与技术》2024年第35期1-5,共5页巴果 高定国 尼琼 
拉萨市科技计划项目(项目编号:LSKJ202405)。
藏语属于低资源语言,其语音识别模型的训练面临数据稀缺的挑战。为了解决这一问题,文章研究了数据增强技术在藏语拉萨方言语音识别中的应用。首先,文章比较了DeepSpeech2、Conformer和Squeezeformer等3种主流语音识别模型在藏语拉萨方...
关键词:藏语拉萨方言 语音识别 数据增强 端到端模型 SpecAugment 
基于FastText的藏文新闻文本分类的研究
《电脑知识与技术》2024年第33期26-28,共3页明玛卓玛 高定国 胡心龙 旦增 
国家级大学生创新训练项目(202410694030)。
藏文新闻文本分类在新闻推荐和舆情监测等领域具有显著的重要性。文章探讨了FastText模型在藏文新闻文本分类中的性能表现。在介绍FastText模型工作原理的基础上,通过实验对比评估了DPCNN、FastText、TextCNN、Tex-tRCNN、TextRNN及Text...
关键词:深度学习 藏文新闻 文本分类 FastText 性能比较 
基于特征提示的跨语种语音识别模型
《科学技术与工程》2024年第24期10348-10355,共8页王嘉文 高定国 索朗曲珍 尼琼 
国家自然科学基金(62166038);四川省科技计划基金(2023YFQ0044);西藏大学高水平人才培养计划项目(2021-GSP-S126)。
跨语种语音识别是一种利用多种源语言的数据来训练一个能够识别目标语言的语音识别系统,它可以促进不同语言和文化之间的交流和理解。为解决跨语种语音识别存在着如何利用多语种数据来提高低资源语言的识别性能,源语言和目标语言之间的...
关键词:特征提示 跨语种 语音识别 CONFORMER Contextnet 
低质古籍文献图像预处理方法研究
《高原科学研究》2024年第1期112-120,共9页高定国 李婧怡 索朗曲珍 
国家自然科学基金项目(62166038);四川省科技计划项目(2023YFQ0044)。
敦煌藏文文献是研究唐代吐蕃社会历史的珍贵文献。目前在敦煌藏文文献数字化研究方面,由于文献年代久远、书写载体低劣、保存条件差等各方面的原因使得文档图像背景杂乱、文字模糊并残缺不全,严重影响了文本识别系统的准确性和鲁棒性。...
关键词:古籍 敦煌文献 低质文档 预处理 
基于VITS模型的藏语康巴方言语音合成研究
《电脑知识与技术》2024年第4期8-10,15,共4页王嘉文 高定国 尼琼 巴果 
国家自然科学基金项目“敦煌藏文文献文本识别方法的研究”(62166038);四川省科技计划项目“涉藏网络舆情的洞察及正向引导关键技术研究”(2023YFQ0044);西藏大学研究生“高水平人才培养计划”项目“藏语三大方言语音合成系统的研究与实现”(2021-GSP-S126)。
藏语康巴方言是一种分布在中国西南部的少数民族语言,数据量低且具有丰富的声调和声母变化,给语音合成带来了很大的挑战。目前,现有的藏语语音合成模型大多基于传统的声码器或神经网络架构,需要大量的标注数据和复杂的训练过程,而且合...
关键词:VITS 藏语 康巴方言 语音合成 
视频中藏文文本的检测方法研究
《电脑知识与技术》2023年第35期1-5,共5页索朗曲珍 高定国 李婧怡 白玛旺久 
国家自然科学基金:敦煌藏文文献文本识别方法的研究(62166038);西藏大学人才创新团队与实验室平台建设“计算机及藏文信息技术创新团队”;四川省科技计划“涉藏网络舆情的洞察及正向引导关键技术研究”(2023YFQ0044)。
随着各种视频的增多,对于大量视频中文字的提取与监测等方面提出了更高的要求,研究视频中文字的文本检测和识别对语音文本的收集、视频监测等有重要的意义。目前视频中藏文文本的检测、识别研究还处于起步阶段,该文采用DBNet、DBNet++、...
关键词:视频 藏文文本 检测 
基于个性倾向分析的宿舍智能分配系统的设计与实现被引量:1
《电脑知识与技术》2023年第20期76-79,共4页宋卓颖 高定国 
大学生创新创业大赛项目:西藏大学本科生宿舍智能分配系统(项目编号:2022XCX081)。
随着高等教育的普及,高校学生越来越多,宿舍中人际矛盾也日益凸显,为减少宿舍学生间的矛盾,按照每个学生的个性倾向分配一个合适的宿舍就显得尤为重要。文章在分析现有宿舍分配系统的基础上,通过调研了解学生的需求,把个性倾向量化为数...
关键词:宿舍 智能 分配 
少数民族语言分词技术评测数据集MLWS2021被引量:2
《中国科学数据(中英文网络版)》2022年第2期2-10,共9页赵小兵 高璐 高定国 包乌格徳勒 米尔阿迪力江·麦麦提 刘洋 才智杰 孙媛 
国家语委科研重点项目(ZDI135-118)
依据蒙古文、藏文和维吾尔文词汇的构词规律和特点,制定适合计算机信息处理的蒙古文、藏文和维吾尔文分词评测标准,构建蒙古文、藏文和维吾尔文的分词标注语料,形成标准评测数据集(MLWS2021),为解决自动分词、词性标注、信息检索、语料...
关键词:少数民族语言 分词标注 评测数据集 分词标准规范 
藏语迪庆方言的音变类型研究
《四川民族学院学报》2022年第2期84-91,共8页取次 高定国 
2020年青海省藏文信息处理与机器翻译重点实验项目/藏文信息处理教育部重点实验室开放课题“自然场景下乌金体藏文的检测与识别”(2020Z001)。
藏语迪庆方言属于藏语康方言的南路次方言。在藏语方言的不断演变中,各路方言的音韵与书面语的发音产生了很大差别。本文以藏语迪庆方言常用词汇为研究对象,运用语音学及藏文字性组织法等语言学理论知识,分析迪庆方言与藏语书面语的发...
关键词:藏语 迪庆方言 音变 
检索报告 对象比较 聚类工具 使用帮助 返回顶部