基于语义空间的藏文微博情感分析方法  被引量:11

Emotional classification method of Tibetan micro-blog based on semantic space

在线阅读下载全文

作  者:袁斌[1] 江涛[1] 于洪志[1] 

机构地区:[1]西北民族大学中国民族信息技术研究院,兰州730030

出  处:《计算机应用研究》2016年第3期682-685,共4页Application Research of Computers

基  金:国家自然科学基金资助项目(61262054);甘肃省科技重大专项资助项目(1203FKDA033);西北民族大学中央专项资金资助研究生项目(Yxm2014001);国家科技支撑计划资助项目(2014BAK10B03)

摘  要:藏文微博具有独特的语法特点,传统方法对藏文文本进行情感分类很难取得较好效果。结合藏文句法结构和语义特征向量构建语义特征空间,提出了一种基于语义空间的藏文微博情感分析方法。首先使用句法树生成句法结构并结合语义特征向量构建特征空间,运用K-means方法聚类形成语义簇质心,将基于簇的TF-IDF值作为最终的微博情感特征值。实验结果表明,该方法的情感分类效果均优于SVM+TF-IDF和naive Bayes+最大熵的方法。Tibetan micro-blog has unique grammatical features,traditional classification method can achieve good results but for Tibetan classification efficiency is not better. This paper presented an emotional classification method of Tibetan micro-blog that based on the semantic space with Tibetan syntactic structure. Firstly,the method generated the syntactic structure using the syntax tree. Then it combined syntactic structure and semantic feature vector to construct the semantic feature space. In the feature space,it formed semantic cluster centroid by K-means clustering method. Finally,it calculated the emotional values of micro-blog by TF-IDF based on the clusters. Experimental results show that this method can more accurately classify on Tibetan micro-blog emotion,compared with SVM + TFI-DF and naive Bayes + maximum entropy.

关 键 词:藏语微博 情感分类 语义空间 文本聚类 语义簇 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象