检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]西藏民族大学,陕西咸阳712082
出 处:《科技创新与应用》2025年第10期61-65,共5页Technology Innovation and Application
摘 要:由于藏语与汉语、英语在语法结构和词汇特点上的差异,传统的文本分类方法在藏文上的应用面临挑战。为此,该文提出一种基于多特征融合与注意力机制的藏文文本分类模型,该模型结合CINO、TextCNN和BiLSTM模型的优势。实验结果表明,该文提出的模型在公开数据集TNCC上的F1值为73.09%,在自建数据集TiTCD上的F1值为80.97%。因此,该模型能够较好地捕捉到藏文文本语义,在藏文文本分类任务上性能有所提升。Due to the differences in grammatical structure and lexical characteristics between Tibetan,Chinese and English,the application of traditional text classification methods in Tibetan faces challenges.To this end,this paper proposes a Tibetan text classification model based on multi-feature fusion and attention mechanism,which combines the advantages of CINO,TextCNN and BiLSTM models.Experimental results show that the F1 value of the proposed model on the public dataset TNCC is 73.09%,and the F1 value on the self-built dataset TiTCD is 80.97%.Therefore,this model can better capture Tibetan text semantics and improve performance on Tibetan text classification tasks.
关 键 词:藏文文本分类 预训练语言模型 多特征融合 注意力机制 文本分类方法
分 类 号:H214[语言文字—少数民族语言]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7