基于多特征融合的中文微博评价对象抽取方法  被引量:3

Opinion target extraction method based on multi-features in Chinese micro blog

在线阅读下载全文

作  者:李景玉[1] 张仰森[1] 蒋玉茹[1] 

机构地区:[1]北京信息科技大学智能信息处理研究所,北京100192

出  处:《计算机应用研究》2016年第2期378-383,共6页Application Research of Computers

基  金:国家自然科学基金资助项目(61070119;61370139);北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519);北京市教委专项项目(PXM2013_014224_000042;PXM2014_014224_000067);北京市教委科研计划面上项目(KM201411232014);北京信息科技大学2014年研究生科技创新项目

摘  要:中文微博的评价对象抽取作为中文微博情感分析的基础任务,受到研究者的广泛关注,有着重要的研究价值。结合微博文本的特点,对微博文本进行预处理,利用句法分析构建包括名词、名词短语、微博话题在内的评价对象候选集,再分别利用SVM模型、加权模型实现多特征融合的筛选候选评价对象方法,所用特征包括语义角色信息、最小距离和词频。算法经实验证明有效,在对候选评价对象进行筛选后,采用SVM模型的F值达到0.357 3,加权模型的F值达到0.405 9。With a widespread name, Micro blog has been drawing more and more attention of researchers. Based on the char- acteristics of Chinese micro blog, this paper put forward a three-stepped strategy. It settled normalization of the corpus first. Followed by building of a opinion target candidate set including noun, noun phrase and micro blog topic. At last applied SVM and score rank to filter the candidate set, with respect to semantic role labeling, minimum distance and term frequency. The algorithm in this paper is confirmed effective by experimental results, the SVM model achieves 30.42% F-value, and the score rank achieves 40.59% F-value.

关 键 词:评价对象 评价对象候选集 句法分析 语义角色标注 支持向量机 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象