检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]安徽大学计算机科学与技术学院,合肥230601 [2]计算智能和信号处理教育部重点实验室,合肥230601
出 处:《计算机工程》2016年第2期184-189,194,共7页Computer Engineering
基 金:安徽省高校自然科学基金资助重点项目(KJ2013A020);安徽省自然科学基金资助项目(11040606M133)
摘 要:研究中文微博文本的情感分类问题,介绍一种基于类序列规则的微博情感分类方法。通过情感词典和机器学习的方法获得微博文本中每个句子的2个潜在的情感标签,将每条微博文本看作是一个数据序列,从数据集中挖掘出类序列规则,从挖掘出的规则中提取出的有效特征并结合文本其他特征来训练分类器。在COAE会议提供的微博数据集上的实验结果表明该方法的有效性。This paper studies the problem of emotion classification in Chinese microblog texts. It introduces a novel approach based on class sequential rules for emotion classification of microblog texts. This approach obtains two potential emotion labels for each sentence in a microblog text by using an emotion lexicon and a machine learning approach respectively,and regards each microblog text as a data sequence. It mines class sequential rules from the dataset. It derives new effective features from the mined rules for emotion classification of microblog texts and other text features to train classifier. Experimental results on a COAE dataset show its validity compared with the traditional methods.
关 键 词:情感分类 微博文本 类序列规则 情感词典 机器学习 文本特征
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229