检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:朱宇雷 德吉卡卓 群诺 尼玛扎西 ZHU Yulei;DEJI Kazhuo;QUN Nuo;NYIMA Tashi(School of Information Science and Technology,Tibet University,Lhasa,Tibet 850000,China;Cooperative Innovational Center for Tibet informatization,Lhasa,Tibet 850000,China;Engineering Research Center of Tibetan Information Technology,Ministry of Education,Lhasa,Tibet 850000,China)
机构地区:[1]西藏大学信息科学技术学院,西藏拉萨850000 [2]西藏信息化省部共建协同创新中心,西藏拉萨850000 [3]藏文信息技术教育部工程研究中心,西藏拉萨850000
出 处:《中文信息学报》2023年第2期71-79,共9页Journal of Chinese Information Processing
基 金:国家自然科学基金(62162057);西藏大学珠峰学科建设计划项目(zf22002001);西藏大学研究生高水平人才培养项目(2020-GSP-S180);2021年武汉理工大学-西藏大学“西藏经济社会发展与高原科学研究共建创新基金”专项项目(lzt2021008)。
摘 要:针对藏文情感分析研究中,由于藏文构字规则以及数据集不统一导致深度学习模型效果欠佳的问题,该文提出了一种结合图神经网络以及预训练模型的藏文情感分析模型,应用于藏文短文本。首先,采用Albert预训练模型对藏文文本进行词向量构建;其次,为对应句中标注出的藏文情感词构建表征,并且通过构建后的词向量与情感词表征进行融合;最后,将融合后的表征进行图数据构建并输入到图神经网络模型中,得到最终的分类效果。实验结果表明,该文提出的藏文情感分类模型准确率达到98.60%,优于其他基线模型。数据集公开网址为:https://github.com/TU-NLP/TU_SA/。To further improve the deep learning methods for Tibetan sentiment analysis,this paper proposes a Tibetan sentiment analysis model combining graph neural network and pre-training model for Tibetan short texts.Firstly,the word vector is constructed using the Albert pre-training model for Tibetan text.Then,the Tibetan sentiment words annotated in the corresponding sentences are converted into word vectors,which are fused with the sentiment word features.Finally,the fused features are constructed as graph data and fed to the graph neural network model for classification.The experimental results show that the proposed model reaches 98.60%accuracy,which is better than other baseline models.The dataset for this article is publicly available at:https://github.com/TU-NLP/TU_SA.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222