藏文分词

作品数:46被引量:197H指数:10
导出分析报告
相关领域:自动化与计算机技术语言文字更多>>
相关作者:才智杰于洪志安见才让李亚超加羊吉更多>>
相关机构:西藏大学青海师范大学西北民族大学青海民族大学更多>>
相关期刊:《计算机光盘软件与应用》《西北民族大学学报(自然科学版)》《计算机工程与设计》《语言文字应用》更多>>
相关基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于改进隐马尔可夫模型的藏文分词研究
《信息技术与信息化》2025年第3期64-67,共4页贡保加 安见才让 
青海民族大学2023年度校级本硕博(学生)项目“基于深度学习的脱机手写藏文识别研究”(09M2023004)。
藏文分词是藏语信息处理领域的基础课题,分词是将原始文本数据切分成词的一种技术。分词技术可以应用到自然语言处理领域的许多下游任务中,诸如机器翻译、语义标注、文本分类、自然语言推理等,分词是自然语言处理中极为关键的环节。文...
关键词:藏文分词 隐马尔可夫模型 分词算法 未登录词 
一种基于八词位标签的BiLSTM_CRF藏文分词方法被引量:1
《中文信息学报》2024年第10期64-70,79,共8页常芳玉 才智杰 
国家自然科学基金(61966031,61866032);青海省科技厅资助项目(2019-SF-129,2021-ZJ-727);青海省藏文信息处理与机器翻译重点实验室(2020-ZJ-Y05);藏文信息处理教育部重点实验室(2013-Z-Y17,2014-Z-Y32,2015-Z-Y03)。
藏文分词是藏语自然语言处理的一项基础性任务,其性能影响藏文自动摘要、自动分类以及搜索引擎等多个方面。基于词位标注的藏文分词方法通常使用四词位标签集,为了更全面地提取特征信息和更深层次的语义信息,该文提出了一种八词位标签集...
关键词:自然语言处理 藏文分词 BiLSTM_CRF 八词位标签 
Bi⁃LSTM和CRF结合的藏文分词方法研究被引量:2
《中央民族大学学报(自然科学版)》2024年第3期40-46,共7页格桑加措 阿卜杜热西提·热合曼 尼玛扎西 面加 肖桐 朱靖波 
新一代人工智能国家科技重大专项(2022ZD0116101);国家自然科学基金(62276056);辽宁省自然科学基金(2022-KF-16-01);云南省科技厅科技计划项目(202103AA080015);中央高校基本科研业务费项目(N2216016、N2216001、N2216002);111引智基地(B16009)。
本研究旨在探索基于双向长短时记忆网络(Bi⁃LSTM)和条件随机场(CRF)的藏语分词方法。研究评估了Bi⁃LSTM和Bi⁃LSTM结合CRF模型在藏文分词任务中的性能,针对未登录音节词进行了模型优化。研究还将分词系统应用到CCMT2023藏汉机器翻译任务...
关键词:藏语分词 LSTM CRF 未登录音节字 
一种基于预训练模型的藏文分词方法
《中文信息学报》2023年第12期70-75,共6页色差甲 桑杰端珠 才让加 慈祯嘉措 
青海省重点研发与转化计划项目(2022-GX-104);藏文智能信息处理及应用国家重点实验室自主课题(2024-SKL-006)。
藏文分词是藏语信息处理的基础与关键。虽然藏文分词技术得到了长足的进步,但在实际应用过程中仍面临着语料领域受限及未登录词问题。该文针对以上问题提出一种基于预训练语言模型的藏文分词方法,先在含有46.55亿字符的纯文本语料上进...
关键词:藏文分词 藏文文本语料 预训练模型 
基于长短时记忆和条件随机场藏文分词模型被引量:3
《情报工程》2023年第2期108-116,共9页于永斌 陆瑞军 尼玛扎西 群诺 王昊 唐倩 彭辰辉 项秀才让 
科技创新2030-“新一代人工智能”重大项目-藏语言文字自动识别技术研发和应用(项目编号:2022ZD0116100)。
[目的/意义]本文提出基于长短时记忆(Long short-term memory,LSTM)神经网络和条件随机场(Conditional Random Field,CRF)的藏文分词模型。[方法/过程]引入注意力机制,获取更多特征信息,提升模型关注上下文信息与当前音节之间联系;提出...
关键词:藏文分词 长短时记忆网络 条件随机场 注意力机制 
藏文自动分词技术研究被引量:3
《中央民族大学学报(自然科学版)》2022年第2期63-66,共4页刘晓彤 赵小兵 
国家语委中心项目“多民族语言文本敏感信息监测与预警技术研究”(ZDI135-98)。
分词是自然语言处理的基础任务,本文针对藏文分词中的特殊问题及其研究成果进行了梳理,为今后学者开展该领域的相关研究提供参考和借鉴。重点阐述和分析了藏文自身语法带来的分词难点和藏文分词时的歧义和未登录词问题,并分析了目前藏...
关键词:藏文分词 语法 未登录词 歧义 
MLWS2021藏文分词评测报告被引量:2
《高原科学研究》2022年第1期82-89,共8页高定国 杨晓龙 杨宇帆 取次 高红梅 
国家自然科学基金项目(6266038);国家语委科研重点项目(ZDI135-118);2021年度自治区一流课程建设项目。
藏文分词是藏文信息处理中关键的基础性工作,是机器翻译、智能检索、自然语言理解等智能信息处理的前提。藏文作为“少数民族语言分词技术评测MLWS2021”的一种评测语种,在MLWS2017的基础上,语料从新闻类单一语料扩展为新闻、法律、经...
关键词:MLWS2021 藏文分词 评测 
基于词性约束的藏文分词策略与算法被引量:8
《中文信息学报》2020年第2期33-37,共5页才让卓玛 才智杰 
国家自然科学基金(61966031,61866032,61262051);国家社会科学基金(16BYY167);教育部“春晖计划”(Z2016077,Z2012093);青海省科技项目(2019-SF-129,2017-ZJ-767);青海省重点实验室项目(2013-Z-Y17,2014-Z-Y32,2015-Z-Y03);教育部藏文信息处理与机器翻译重点实验室(2013-Y-17)。
自动分词作为自然语言处理基础性的研究课题,一直被学术界所关注,随着藏语自然语言处理技术研究的不断深入,藏文分词也面临越来越多的挑战。该文通过分析藏文自动分词研究现状,提出基于词性约束的藏文分词策略与算法。相对于传统方法,...
关键词:分词 词性 未登录词 歧义 
藏文分词的前向匹配算法研究被引量:1
《电脑知识与技术》2019年第9X期195-197,207,共4页王福钊 周雁 
西藏自治区自然基金项目(XZ2017ZR G-10)
藏文分词是进行藏文文本信息化处理的基础,是一切工作的核心步骤。文中对最大前向匹配算法的藏文分词进行了研究,并对该算法进行了改进。文中详细叙述了改进的前向最大匹配算法思想,同时以同一藏文文本语料使用改进前后的前向最大匹配...
关键词:藏文 分词 前向最大匹配 算法改进 
神经网络藏文分词方法研究被引量:8
《青海科技》2018年第6期15-21,共7页桑杰端珠 才让加 
国家自然科学基金(61662061;61063033);国家重点研发计划(2017YFB1402200);青海省科技厅项目(2015-SF-520)
藏文分词是各类藏文自然语言处理的首要任务,藏文分词的性能直接影响下游的其他自然语言处理任务的性能。传统上多数研究者使用线性统计方法进行藏文分词的研究,但是此类方法需要大量人工设计的语言学特征。研究提出了一种藏文分词的神...
关键词:藏文分词 神经网络 BiLSTM CNN CRF 
检索报告 对象比较 聚类工具 使用帮助 返回顶部