检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]江西农业大学计算机与信息工程学院
出 处:《中国新通信》2015年第21期48-51,共4页China New Telecommunications
摘 要:微博是当下社交网络中最流行的社交工具典型代表,微博信息具有及时性,流动速度快,内容情感色彩丰富,微博的分析是对社会学、信息学、计算机科学、统计学等多学科交叉领域的研究,成为了其新的热点研究方向。鉴于自主采用Java语言开发的新浪微博的情感识别与分类系统,对中文微博的情感进行识别与分类研究。系统使用爬虫技术,抓取微博的文本内容,然后利用支持Java开发语言的ICTCLAS分词工具进行分词,去停用词,文本规范等预处理操作,再抽取情感特征,对文本情感识别与分类,最终输出分类结果。实验中通过多种方法对比,选择实验效果较好的方法,最终实验结果表明:朴素贝叶斯的主客观句识别效果优于支持向量机分类方法,基于支持向量机一对一多步识别中文微博文本情感类别效果优于一对其余一次识别方法,且准确率达到63.76%,召回率达到74.4%,总体实验结果较传统粗粒度研究有明显进步。
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.207