检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京理工大学计算机学院北京市海量语言信息处理与云计算应用工程技术研究中心,北京100081
出 处:《电子学报》2016年第10期2459-2465,共7页Acta Electronica Sinica
基 金:国家重点基础研究发展计划(973计划)资助项目(No.2013CB329605;No.2013CB329303);国家自然科学基金(No.61132009;No.61201351)
摘 要:随着社交媒体的发展及成熟,每天在互联网环境中都会产生大量的用户评论信息.抽取评价短语、评价对象和观点持有者等情感要素,已经成为了中文观点挖掘和情感分析的重要先决任务.针对中文情感要素抽取任务,本文提出了一个统计和规则相结合的级联模型,主要贡献包括:(1)针对汽车领域评论信息,构建情感要素标注语料库和相关词典;(2)对于以往研究较少关注的中文评价短语,本文详细分析阐述其定义和分类;(3)结合统计和规则,分别针对评价短语和情感要素提出级联抽取策略.实验结果充分证明了该级联模型的有效性,相比较于其它基于规则的情感要素抽取算法有效提升了召回率,同时为后续社交媒体情感分析任务提供了有力的支持.With the development of social media,massive reviews are generated by users every day. The extraction of evaluation elements,including evaluation phrase,comment target and opinion holder,is an important pre-task of Chinese opinion mining and sentiment analysis. This paper proposes an efficient method for extracting Chinese evaluation elements based on cascaded model and mainly makes three contributions:( i) to implement and evaluate the method,we construct an original annotated corpus for Chinese evaluation elements of automobile;( ii) we provide specific definition and classification of Chines evaluation phrase;( iii) combing statistic method and rule-based method,we present cascaded strategy for extraction of evaluation phrase and evaluation elements,respectively. According to the experiment results,the proposed method performs well,and effectively improve the recall compared with other rule-based algorithm. Meanwhile it contributes greatly to our subsequent tasks,such as sentiment analysis of social media.
关 键 词:信息抽取 情感要素 评价短语 评价对象 观点持有者
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30