情感词发现与极性权重自动计算算法研究  被引量:8

Research on Automatic Emotional Word Detection and Polarity Weighting Algorithm

在线阅读下载全文

作  者:张华平[1,2] 李恒训[3] 李清敏[4] 

机构地区:[1]北京理工大学计算机学院,北京100081 [2]北京市海量语言信息处理与云计算应用工程研究中心,北京100081 [3]公安部第一研究所信安部,北京100048 [4]工业和信息化部电子科学技术情报研究所,北京100040

出  处:《中文信息学报》2017年第3期48-54,共7页Journal of Chinese Information Processing

基  金:国家重点基础研究发展计划(973计划)(2013CB329601)

摘  要:随着互联网电子商务和各种社交网络应用的快速发展,产生了大量的用户评价信息。为满足快速整理这些评价信息的需求,情感倾向性分析应运而生。情感词典是各类情感倾向性识别算法的基础,收集一部全面且权重合理的情感词典,往往可以简单快速而有效地解决情感分析问题。但情感词典规模有限,而网络上新的情感词层出不穷,语言使用不规范,人工整理耗时耗力。已有的情感词收集方法较复杂,且领域性强,收集的情感词可扩展性差。本文提出一种自动挖掘潜在情感词并计算其极性权重的算法,该算法与应用领域无关,具有良好的扩展性。该方法利用共现特性,基于朴素贝叶斯公式能检测出未知的情感词,并根据其情感权重值的大小判断其情感极性,可有效地扩展情感词典,将已有的情感词典进一步量化。在理论研究的基础上,本文分别针对京东、豆瓣及大众点评网三组评论语料做了实验,其结果的准确率都基本在90%以上,验证了该方法的有效性和实用性,为情感倾向性分析提供了知识库基础。Rapid development of Internet commerce and various social networking applications leads to a large number of user comment information. To meet the requirement of fast processing these information, sentiment and its polarity analysis arises at the moment. Emotion dictionary is the basis for all kinds of recognition algorithms of emotional polarity. To build a comprehensive emotional dictionary with rational weight, this paper proposes an automatic emotion weight (AEW) algorithm to mine the potential emotional words and estimate the emotion weight, with the advantage of domain independence and good scalability. The method uses special type of co-occurrence, which is based on Bayesian theory, to recognize unknown emotion words, judge the sentiment polarity according to the value of its emotion weight. We verify the theoretical research by three empirical analysis of data form JD. com, douban. com and dianping, com, achieving a precision about 90%.

关 键 词:情感词 情感权重 情感程度判别 情感词典 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象