基于SVM的中文微博情感识别与分类研究  

在线阅读下载全文

作  者:刘丹丹[1] 邱恒清[1] 赵应丁[1] 

机构地区:[1]江西农业大学计算机与信息工程学院

出  处:《中国新通信》2015年第21期48-51,共4页China New Telecommunications

摘  要:微博是当下社交网络中最流行的社交工具典型代表,微博信息具有及时性,流动速度快,内容情感色彩丰富,微博的分析是对社会学、信息学、计算机科学、统计学等多学科交叉领域的研究,成为了其新的热点研究方向。鉴于自主采用Java语言开发的新浪微博的情感识别与分类系统,对中文微博的情感进行识别与分类研究。系统使用爬虫技术,抓取微博的文本内容,然后利用支持Java开发语言的ICTCLAS分词工具进行分词,去停用词,文本规范等预处理操作,再抽取情感特征,对文本情感识别与分类,最终输出分类结果。实验中通过多种方法对比,选择实验效果较好的方法,最终实验结果表明:朴素贝叶斯的主客观句识别效果优于支持向量机分类方法,基于支持向量机一对一多步识别中文微博文本情感类别效果优于一对其余一次识别方法,且准确率达到63.76%,召回率达到74.4%,总体实验结果较传统粗粒度研究有明显进步。

关 键 词:微博 网络爬虫 情感识别 情感分类 支持向量机 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象