藏文音节

作品数:47被引量:118H指数:10
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄鹤鸣珠杰关白吴健祁坤钰更多>>
相关机构:西藏大学青海师范大学西北民族大学青海民族大学更多>>
相关期刊:《西北师范大学学报(自然科学版)》《中国科技博览》《软件导刊》《北京大学学报(自然科学版)》更多>>
相关基金:国家自然科学基金国家社会科学基金长江学者和创新团队发展计划教育部人文社会科学研究基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于藏文音节特征的WM多模式匹配算法
《科技创新与应用》2025年第8期1-5,共5页杨媛婷 彭展 
西藏自治区自然科学基金项目(XZ202101ZR0089G)。
近年来,随着互联网特别是移动互联网在西藏的普及和发展,对涉藏网络舆情的治理也变得越发重要,其中最基本的方式便是敏感词检测。而多模式(字符串)匹配算法正是进行敏感词检测的核心技术手段。作为一种高效的多模式匹配算法,WM(Wu-Manb...
关键词:多模式匹配 WM算法 藏文处理 藏文音节 音节结构特性 
基于规则的藏文音节纠正算法
《中文信息学报》2025年第1期28-36,共9页普尺 吕慧 李妍 多拉 周庆国 
国家重点研究与发展计划(2020YFC0832500);国家自然科学基金(61402210,62266037)。
藏文语料库的质量是影响藏文信息处理的重要因素。通过分析藏文音节拼写规则,该文构建了针对藏文规则音节和非规则音节拼写检查的音节规则库和非规则音节字典(包括未登录词音译、本体藏文和梵音转写),并基于此提出基于规则的藏文音节纠...
关键词:语料库 藏文音节 拼写检查 音节纠正 
基于区域特征的Transformer混合结构图像藏文描述模型
《中文信息学报》2025年第1期37-46,55,共11页周子琦 黄鹤鸣 才让当知 夏吾吉 达飞鹏 
国家自然科学基金(62066039);青海省自然科学基金(2022-ZJ-925)。
端到端的Transformer模型在中、英文图像描述数据集上取得了良好的效果,但其巨大的训练数据需求使其在规模较小的藏文数据集上效果并不理想。针对此问题,该文基于编码器—解码器架构的基线模型,引入目标检测网络和自注意力机制以替换CNN...
关键词:图像藏文描述 藏文音节 Faster-RCNN TRANSFORMER 
藏文音节查错纠错模型研究
《中文信息学报》2024年第12期116-126,共11页珠杰 郑任公 拉巴顿珠 德庆卓玛 顿珠次仁 
国家自然科学基金(62406256);新一代人工智能国家科技重大专项(2022ZD0116100);西藏自治区哲学社会科学专项(23YBE25)。
针对藏文文本自动校对研究中缺乏高质量标注语料、鲜有纠错任务研究等问题,该文以藏文音节为单元的等长文本为研究内容,通过分析藏文文本错误类型,开展了藏文查错、纠错模型研究,该文主要贡献如下:(1)针对缺乏标注语料问题,一是提出了...
关键词:藏文音节 查错模型 纠错模型 预训练 软掩码 
藏文音节自动处理系统的设计与实现
《现代计算机》2024年第24期199-204,共6页顿珠次仁 珠杰 蔡国翔 达娃拉姆 
西藏大学大学生创新创业项目(2024XCX048)。
藏语智能化是一个重要的研究领域,是藏族优秀传统文化继承和发展的必要途径。针对藏文音节自动处理技术不够完善的问题,对藏文编码统计、音节统计、构件识别与统计、自动拼写藏文音节和拼写检查进行了研究,并设计了藏文音节自动处理系...
关键词:藏文编码 藏文音节 音节构件 自动拼写 拼写检查 
基于藏文音节的图像标题自动生成方法研究
《高原科学研究》2024年第3期102-109,共8页华却才让 白颖 周子琦 才让当知 完么措 
国家自然科学基金项目(62166034);藏语智能信息处理及应用国家重点实验室项目(2020-ZJ-Y05);青海省基础研究计划项目(2020-0301-ZJC-0042);青海省应用基础研究计划项目(2021-ZJ-727).
图像标题生成在人机交互、多媒体搜索以及图像自动标注等领域具有广泛的应用前景。文章提出基于藏文音节的图像标题生成方法。首先,Encoder将输入的图像数据通过多层残差卷积层提取图像特征;其次,通过Attention机制来准确获取Encoder中...
关键词:图像 标题 藏文音节 注意力机制 
基于藏文音节结合BiLSTM-CRF的藏语语义组块分类标注被引量:1
《高原科学研究》2024年第2期118-125,共8页旦正吉 华却才让 完么措 白颖 
国家自然科学基金项目(62166034);藏语智能信息处理及应用国家重点实验室项目(2020-ZJ-Y05);青海省基础研究计划项目(2020-0301-ZJC-0042);青海省应用基础研究计划项目(2021-ZJ-727).
针对藏语句子语义分析中语义种类繁多且广泛存在歧义的难点,提出了基于藏文音节向量和BiL-STM-CRF混合模型相结合的藏语语义组块识别方法。首先制定了13种语义组块标注规范,其次构建了13211句语义组块标注语料库,在此基础上采用TS-BiLST...
关键词:藏语 语义组块识别 TS-BiLSTM-CRF模型 标注规范 
基于语料库的藏文音节计量研究
《青海民族大学学报(藏文版)》2024年第1期47-60,共14页冷本扎西 完么 
国家社科冷门绝学研究专项“基于语料库的《藏文大字典》(藏汉对照)编纂研究”(项目编号:21VJXT013);教育部人文社科青年项目“面向领域知识图谱构建的藏医药本体建模研究”(项目编号:22YJCZH072);青海省省级哲学社会科学项目“面向智能语言理解的藏医药领域本体研究”(项目编号:22ZCQ074)阶段性成果。
语言特征计量是现代语言学研究新范式,是基于真实语言样本统计的科学研究方法。在计量方法引入语言研究之前,藏文音节只有依据语法规则的可生成理论音节数量,即理论上根据藏文拼接规则可生成且符合藏文音节构成规律的组合体。然而,关于...
关键词:语料库 音节 出现次数 计量研究 
面向藏文临床病历的医学实体识别研究
《计算机仿真》2023年第9期208-212,共5页卓玛措 桑杰端珠 才让加 羊毛卓么 
国家自然科学基金项目(61662061,61063033);青海省藏文信息处理与机器翻译重点实验室(2020-ZJ-Y05);2020年校级自然科学中青年科研基金项目(2020QZR017)。
由于标注数据集的缺乏,针对藏族传统医学领域的藏文临床病历的医学实体识别任务仍然是一个未涉足的研究领域。针对上述问题,首先手动构建了一个标记的数据集,然后根据藏文临床病历文本独有的子语言特征,设计了一个音节级的Lattice-LSTM-...
关键词:藏文 临床病历 藏文音节 医学实体识别 
融合音节和词条特征的藏文文本情感分类研究被引量:3
《中文信息学报》2023年第2期80-86,共7页孟祥和 于洪志 
西北民族大学2021年度中央高校基本科研业务费项目(31920210087);西北民族大学2020年度中央高校基本科研业务费项目(31920200116)。
将深度神经网络模型应用于藏文文本情感分类中,虽然取得不错的分类效果,但仍然存在因藏文评论文本长度较短引起的特征稀疏的问题,使得深度学习模型不能够提取到更为全面的藏文文本语义特征。该文提出一种以藏文音节和藏文词条同时作为...
关键词:藏文文本 情感分类 藏文音节 深度神经网络 
检索报告 对象比较 聚类工具 使用帮助 返回顶部