检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京信息科技大学智能信息处理研究所,北京100192
出 处:《计算机应用研究》2016年第2期378-383,共6页Application Research of Computers
基 金:国家自然科学基金资助项目(61070119;61370139);北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519);北京市教委专项项目(PXM2013_014224_000042;PXM2014_014224_000067);北京市教委科研计划面上项目(KM201411232014);北京信息科技大学2014年研究生科技创新项目
摘 要:中文微博的评价对象抽取作为中文微博情感分析的基础任务,受到研究者的广泛关注,有着重要的研究价值。结合微博文本的特点,对微博文本进行预处理,利用句法分析构建包括名词、名词短语、微博话题在内的评价对象候选集,再分别利用SVM模型、加权模型实现多特征融合的筛选候选评价对象方法,所用特征包括语义角色信息、最小距离和词频。算法经实验证明有效,在对候选评价对象进行筛选后,采用SVM模型的F值达到0.357 3,加权模型的F值达到0.405 9。With a widespread name, Micro blog has been drawing more and more attention of researchers. Based on the char- acteristics of Chinese micro blog, this paper put forward a three-stepped strategy. It settled normalization of the corpus first. Followed by building of a opinion target candidate set including noun, noun phrase and micro blog topic. At last applied SVM and score rank to filter the candidate set, with respect to semantic role labeling, minimum distance and term frequency. The algorithm in this paper is confirmed effective by experimental results, the SVM model achieves 30.42% F-value, and the score rank achieves 40.59% F-value.
关 键 词:评价对象 评价对象候选集 句法分析 语义角色标注 支持向量机
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.147