基于CRFs和领域本体的中文微博评价对象抽取研究  被引量:12

Opinion Targets Extraction from Chinese Microblogs Based on Conditional Random Fields and Domain Ontology

在线阅读下载全文

作  者:丁晟春[1,2] 吴婧婵媛 李霄[1] DING Shengchun WU Jingchanyu LI Xiao(Department of Information and Management of Nanjing University of Science & Technology, Nanjing, Jiangsu 210094, China Jiangsu Collaborative Lnnovation Center of Social Safety Science and Technology, Nanjing Jiangsu 210094, China)

机构地区:[1]南京理工大学信息管理系,江苏南京210094 [2]江苏省社会公共安全科技协同创新中心,江苏南京210094

出  处:《中文信息学报》2016年第4期159-166,共8页Journal of Chinese Information Processing

基  金:国家自然科学基金(71303111;71103085;71403121);国家社会科学基金(15BTQ063;14AZD084);中央高校基本科研业计划(30916011330)

摘  要:微博情感分析是对微博内容进行细粒度的挖掘,有着重要的研究价值。微博评价对象的抽取是微博情感分析研究的关键问题之一。为了提高中文微博评价对象抽取的准确率,该文在中文微博特征分析和微博评论本体构建研究的基础上,尝试从词、词性、情感词以及本体四个方面进行特征选择,采用CRFs模型对评价对象进行抽取。该文将提出的方法运用到COAE2014测评的Task5评价对象抽取任务中,宏平均准确率达到61.20%,在所有测评队伍中居第一。实验结果表明,将本体特征引入到CRFs模型中,能够有效地提高评价对象抽取的准确率。Fine-grained sentiment analysis of Microblogs is very important.The extraction of opinion targets from opinion sentence is the key issue to sentiment analysis of Microblogs.To improve the performance of opinion targets extraction,this paper proposes to select features from words,parts of speech,emotional words and ontology,based on the characteristics of Chinese microblog and the construction of microblogging comment ontology,and then uses CRFs model to evaluate object extraction.At last,we apply the proposed method to Task5 of COAE2014.The accuracy of the evaluation object extraction is 61.20 percent,ranking first in all the evaluation team.The experiment results show that it is possible to effectively improve the accuracy of the evaluation opinion targets extraction to introduce the ontology into CRFs Model.

关 键 词:CRFs模型 本体 特征选择 评价对象抽取 信息抽取 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象