基于关键词抽取的微博舆情事件内容聚合  被引量:17

Content Aggregation of Microblogging Public Opinion Events Based on Keyword Extraction

在线阅读下载全文

作  者:周鹏[1] 蔡淑琴[1] 石双元[1] 王伟[1] 

机构地区:[1]华中科技大学管理学院,武汉430074

出  处:《情报杂志》2014年第1期91-96,共6页Journal of Intelligence

基  金:国家自然科学基金项目"微内容生产加工模式及其支持平台的研究"(编号:71071066);国家自然科学基金项目"移动社会化媒体中基于价值共创的企业负面口碑处理资源的管理方法及系统研究";教育部人文社会科学基金项目"基于互联网信息的企业危机事件识别研究"(编号:11YJA630098)

摘  要:微博舆情事件会带来严重后果,而碎片化和无序化使得难以从海量的微博内容中全面地认知微博舆情事件的全貌。从微博舆情事件内容聚合出其主要内容具有重要实践价值和研究价值。基于关键词抽取技术KEA提出了一种微博舆情事件内容聚合方法。根据对微博内容篇幅、规范性和网络性的分析,增加中心度特征、词性特征和改进词位置特征,并以朴素贝叶斯分类器抽取关键词集作为聚合输出。最后通过现实微博平台上的内容聚合实验证明本研究所提方法相对基线方法在准确率和召回率上的优势。Microblogging public opinion events(MPOE) bring serious consequences, it's difficult to recognize the full view of MPOE from huge number of microblogging content for its fragmentation and disordering. Aggregating main point from MPOE is of important practical value and research value. Based on KEA, the keyword automatic extraction, the paper proposes a method to aggregate main point from MPOE. According to the length distribution, normative and network characteristic, the paper adds centrality feature, part-of-speech feature and modifies the position feature, then extracts the keywords as output of MPOE aggregation by Na?ve-Bayes classifier. Finally, advantage on precision and recall of method we proposed comparing with baseline method is proved by experiment of MPOE aggregation performed on real microblogging platform.

关 键 词:微博 舆情事件 文本挖掘 抽取 KEA算法 朴素贝叶斯模型 

分 类 号:C931.6[经济管理—管理学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象