检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]西北民族大学中国民族信息技术研究院,兰州730030
出 处:《计算机应用研究》2016年第3期682-685,共4页Application Research of Computers
基 金:国家自然科学基金资助项目(61262054);甘肃省科技重大专项资助项目(1203FKDA033);西北民族大学中央专项资金资助研究生项目(Yxm2014001);国家科技支撑计划资助项目(2014BAK10B03)
摘 要:藏文微博具有独特的语法特点,传统方法对藏文文本进行情感分类很难取得较好效果。结合藏文句法结构和语义特征向量构建语义特征空间,提出了一种基于语义空间的藏文微博情感分析方法。首先使用句法树生成句法结构并结合语义特征向量构建特征空间,运用K-means方法聚类形成语义簇质心,将基于簇的TF-IDF值作为最终的微博情感特征值。实验结果表明,该方法的情感分类效果均优于SVM+TF-IDF和naive Bayes+最大熵的方法。Tibetan micro-blog has unique grammatical features,traditional classification method can achieve good results but for Tibetan classification efficiency is not better. This paper presented an emotional classification method of Tibetan micro-blog that based on the semantic space with Tibetan syntactic structure. Firstly,the method generated the syntactic structure using the syntax tree. Then it combined syntactic structure and semantic feature vector to construct the semantic feature space. In the feature space,it formed semantic cluster centroid by K-means clustering method. Finally,it calculated the emotional values of micro-blog by TF-IDF based on the clusters. Experimental results show that this method can more accurately classify on Tibetan micro-blog emotion,compared with SVM + TFI-DF and naive Bayes + maximum entropy.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.188.224.69