规则和统计相结合的情感分析研究  被引量:4

Sentiment Analysis Based on Rules and Statistics

在线阅读下载全文

作  者:昝红英[1] 左维松[1] 张坤丽[1] 吴云芳[2] 

机构地区:[1]郑州大学信息工程学院,河南郑州450052 [2]北京大学计算语言学研究所,北京100871

出  处:《计算机工程与科学》2011年第5期146-150,共5页Computer Engineering & Science

基  金:国家863计划资助项目(2007AA01Z198);国家自然科学基金资助项目(60970083);国家社会科学基金资助项目(08CYY016)

摘  要:基于递归分治策略基本思想,本文构建了一种新的情感分析模型并解释了模型的合理性。本文首先分析了资源和统计方法的优缺点。资源的情感倾向性分析优点在于情感词表准确,缺点是完备性较差;而统计的方法则恰恰相反。进而提出了规则和统计相结合的方法分析文本的情感倾向性,并将规则和统计相结合的情感分析方法应用于该模型,并验证了其有效性。实验表明,在数据不均衡的条件下,该方法的正确率达到了77.68%。In this paper,we propose a new model of sentiment analysis which is based on the recursive and divided function,and explain the rationality of the model.The paper analyzes the advantages and disadvantages of sentiment analysis.The advantages of the resource-based approach are that the emotional vocabulary is accurate.The shortcomings of this method is that the soundness is poor.But the statistical methods are opposite.Additionally,the paper provides a new way to analyse the sentiment of texts,and verifies the effectiveness.The method attains an accuracy of 77.68% on the test,although the data is imbalancing.

关 键 词:中文信息处理 情感分类 搭配规则 判定表 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象