检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:贡保加 安见才让[1] GONG Baojia;AN Jiancairang
机构地区:[1]青海民族大学智能科学与工程学院,青海西宁810007
出 处:《信息技术与信息化》2025年第3期64-67,共4页Information Technology and Informatization
基 金:青海民族大学2023年度校级本硕博(学生)项目“基于深度学习的脱机手写藏文识别研究”(09M2023004)。
摘 要:藏文分词是藏语信息处理领域的基础课题,分词是将原始文本数据切分成词的一种技术。分词技术可以应用到自然语言处理领域的许多下游任务中,诸如机器翻译、语义标注、文本分类、自然语言推理等,分词是自然语言处理中极为关键的环节。文章基于隐马尔可夫模型对藏文分词进行研究,首先通过语料库训练模型,获取相应的位置信息和概率,其次在传统隐马尔可夫模型的基础上采集了音节与音节之间的特征信息,结合已有的词的位置信息进行测试。测试结果表明,最终准确率在86.05%,相较于传统的隐马尔可夫模型提高了2.3%。
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7