领域同义特征词的统计规律及其在情感分析上的应用研究  被引量:2

Statistical law of domain synonymous feature-words and its application research on sentiment analysis

在线阅读下载全文

作  者:苗祥[1] 刘业政[1,2] 孙春华[1,2] 

机构地区:[1]合肥工业大学管理学院,合肥230009 [2]过程优化与智能决策教育部重点实验室,合肥230009

出  处:《计算机应用研究》2014年第11期3333-3336,共4页Application Research of Computers

基  金:国家"973"计划资助项目(2013CB329600);国家自然科学基金资助项目(71071047);国家教育部人文社会科学研究项目(12YJC630073);合肥工业大学博士专项科研基金资助项目(2012HGBZ0661)

摘  要:为了研究同义特征词的规律及其对情感分析的影响,基于大规模语料库的统计学习方法,发现如果将每一个特征词的所有同义特征词组成特征词组,词组中的同义特征词按照自身在语料库中出现的频率从大到小排列,那么同义特征词在词组中出现的频率与该词在词组中的名次存在幂函数关系:y=β0xβ1。将特征代表词的同义特征词所对应的情感词加入到该特征代表词的情感词集中,可以有效提高特征代表词的情感分析的准确性。In order to study the law of domain synonymous feature-words and its influence on sentiment analysis,this paper based on statistical learning method of the large-scale corpus and found that if all the synonymous feature-words of each feature-word formed phrases where the synonymous feature-words of each phrase rank according to their frequency in the corpus from high to low,there existed a power function among the frequencies of the synonymous feature-word and the ranking of the synon-ymous feature-word in the phrase:y=β0 x^β1 .Moreover,this paper show that adding the emotional words of the synonymous fea-ture-words of the rep feature-word to the emotional word-set of the rep feature-word can effectively improve the accuracy of the sentiment analysis of the rep feature-word.

关 键 词:产品评论 情感分析 同义特征词 幂率分布 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象