基于文本特征的短文本倾向性分析研究  被引量:7

Short Text Attitude Analysis Based on Textual Characteristics

在线阅读下载全文

作  者:程南昌[1] 侯敏[2] 滕永林[2] 

机构地区:[1]中国科学院自动化研究所模式识别国家重点实验室,北京100190 [2]中国传媒大学国家语言资源监测与研究中心有声媒体语言中心,北京100024

出  处:《中文信息学报》2015年第2期163-169,共7页Journal of Chinese Information Processing

基  金:国家语委十二五规划重点项目(ZDI125-3)

摘  要:语篇倾向性分析是倾向性分析的较高层次领域。根据文本篇幅和结构可以将语篇分为短文本和长文本。该文以网络商品评论作为样本研究短文本倾向性分析的特点和策略。根据倾向极性在文中的决定性因素的不同表现,短文本可以分为含显性归总句、含隐性归总句、含特征词以及一般文本四类,针对不同类别文本采用不同的处理策略。在此基础上,运用词典、规则的方法构建了语篇倾向性分析系统CUCsas,该方法在第四届中文倾向性分析评测(COAE2012)中取得了较好成绩。This paper takes the online product reviews as samples to investigate the characteristics and strategies in the attitude analysis of short texts. According to different performances of decisive factors of attitude polarity, the online review texts can he divided into four categories., the text containing overt summery sentence, the texts contai- ning covert summary sentence, the texts containing characteristic words and the normal texts. Different strategies are established to deal with different types of texts, and a text attitude analysis system CUCsas is constructed based on dictionaries and rules. The system generates promising results in the Fourth Chinese Opinion Analysis Evaluation- COAE2012.

关 键 词:短文本 文本特征 归总句 倾向性分析 词典与规则 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象