基于深度学习的藏文文本自动分类研究  被引量:1

Research on Automatic Classification of Tibetan Texts Based on Deep Learning

在线阅读下载全文

作  者:索南多杰 官却多杰 拉玛杰 公保加羊 Suonan Duojie;Guanque Duojie;La Majie;Gongbao Jiayang(Hainan Prefecture Tibetan Information Technology Research Center,Gonghe 813099,Qinghai,China)

机构地区:[1]青海省海南州藏文信息技术研究中心,共和813099

出  处:《青海科技》2023年第3期192-196,共5页Qinghai Science and Technology

基  金:青海省重点研发与转化计划—科技成果转化专项项目“‘云藏’高效爬虫及检索系统优化与集成”(2020-GX-164)。

摘  要:在藏文信息处理中,文本分类技术可以将藏文文档自动分类为某种提前设定的类别,因此藏文文本分类在信息检索、新闻推荐等应用中具有重要的应用价值。传统的文本分类方法需要复杂的特征工程处理,分类效果不是非常理想。随着深度学习的快速发展,基于深度学习的藏文文本分类方法成为主要研究趋势。文章提出基于双向LSTM的文本分类方法,在藏文文本分类数据集上进行实验,本文算法的精准率、召回率、F1分数分别提升2.56%、1.87%和1.75%。In Tibetan information processing,text classification technology can automatically classify Tibetan documents into certain pre-set categories.Therefore,Tibetan text classification has important application value in applications such as information retrieval and news recommendation.Traditional text classification methods require complex feature engineering processing,and the classification effect is not very ideal.With the rapid development of deep learning,Tibetan text classification methods based on deep learning have become the main research trend.This paper proposes Bi-LSTM,a text classification method based on bidirectional LSTM.Experiments were carried out on the Tibetan text classification dataset.The algorithm in this paper improved the precision rate,recall rate,and F1 score by 2.56%,1.87%and 1.75%respectively.

关 键 词:藏文信息处理 文本分类 深度学习 Bi-LSTM 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象