基于TSCM模型的网络短文本情感挖掘  被引量:12

Mining Sentiment for Web Short Texts Based on TSCM Model

在线阅读下载全文

作  者:黄发良[1] 李超雄[1] 元昌安[2] 汪焱[1] 姚志强[1] 

机构地区:[1]福建师范大学软件学院,福建福州350007 [2]广西师范学院计信学院,广西南宁530023

出  处:《电子学报》2016年第8期1887-1891,共5页Acta Electronica Sinica

基  金:国家自然科学基金(No.61370078;No.61363037);教育部人文社会科学研究青年基金项目(No.12YJCZH074);福建省教育厅科技项目(No.JA13077)

摘  要:针对网络短文本情感挖掘问题,提出一种新的基于LDA和互联网短评行为理论的主题情感混合模型TSCM,TSCM模型中的整篇评论中每个句子的主题分布是不同的,TSCM产生词的流程是先确定词的情感极性,再确定词的主题,TSCM考虑了词与词之间的联系.真实数据集Movie与Amazon上的大量实验表明,与代表性算法JST、SLDA、D-PLDA和SAS相比较,TSCM模型能对用户真实情感与讨论主题进行更加有效的分析建模.For sentiment analysis of web short texts,a topic sentiment combining model (TSCM)is proposed based on LDA and web review behavioral theory,which is founded on the assumption that topic distribution of each sentence in a review is unique and different from that of other sentences.Generative process of TSCM is to first determine sentiment orien-tation of each word and then topic of each sentence in a review while taking word relation into consideration.Extensive ex-periments on real-world datasets (Movie and Amazon)show that TSCM significantly outperforms JST,S-LDA,D-PLDA and SAS in terms of the accuracy of sentiment classification and topic detection.

关 键 词:情感分析 主题情感混合模型 LDA 

分 类 号:TP273[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象