基于特征融合结合注意力机制的藏文文本分类模型  

在线阅读下载全文

作  者:冯宇舒 艾金勇[1] 李爽 

机构地区:[1]西藏民族大学,陕西咸阳712082

出  处:《科技创新与应用》2025年第10期61-65,共5页Technology Innovation and Application

摘  要:由于藏语与汉语、英语在语法结构和词汇特点上的差异,传统的文本分类方法在藏文上的应用面临挑战。为此,该文提出一种基于多特征融合与注意力机制的藏文文本分类模型,该模型结合CINO、TextCNN和BiLSTM模型的优势。实验结果表明,该文提出的模型在公开数据集TNCC上的F1值为73.09%,在自建数据集TiTCD上的F1值为80.97%。因此,该模型能够较好地捕捉到藏文文本语义,在藏文文本分类任务上性能有所提升。Due to the differences in grammatical structure and lexical characteristics between Tibetan,Chinese and English,the application of traditional text classification methods in Tibetan faces challenges.To this end,this paper proposes a Tibetan text classification model based on multi-feature fusion and attention mechanism,which combines the advantages of CINO,TextCNN and BiLSTM models.Experimental results show that the F1 value of the proposed model on the public dataset TNCC is 73.09%,and the F1 value on the self-built dataset TiTCD is 80.97%.Therefore,this model can better capture Tibetan text semantics and improve performance on Tibetan text classification tasks.

关 键 词:藏文文本分类 预训练语言模型 多特征融合 注意力机制 文本分类方法 

分 类 号:H214[语言文字—少数民族语言]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象