基于聚类分析的网络舆情主题提取  被引量:7

Extracting topic of network public opinion with clustering analysis

在线阅读下载全文

作  者:程小刚[1] 安梦佳 郭韧[2] Cheng Xiaogang;An Mengjia;Guo Ren(College of Computer Sciences and Technology,Huaqiao University,Xiamen,Fujian 361021,China;College of Business Administration,Huaqiao University)

机构地区:[1]华侨大学计算机科学与技术学院,福建厦门361021 [2]华侨大学工商管理学院,福建厦门361021

出  处:《计算机时代》2020年第5期30-33,37,共5页Computer Era

基  金:福建省中国特色社会主义理论体系研究中心项目(2019ZTD24);泉州市社会科学规划项目(2019D03);华侨大学实验项目(Z17X0143)。

摘  要:网络舆情具有时效性强、传播迅速、涉及方面杂而广、意见指向性特征明显、泛娱化特征明显等特点。因此,提出对LDA输入数据采用TF-IDF算法加强特征词筛选的方法。选取"巴黎圣母院大火"事件,采集作为网络舆情重要来源的微博数据,进行LDA建模,引入TF-IDF算法进行特征词的筛选,能较准确地分析出该事件的主题分布。Network public opinion has the characteristics of strong timeliness, rapid dissemination, wide and miscellaneous involved aspect, obvious directional feature of opinion, and obvious characteristics of pan-entertainment. Therefore, TF-IDF algorithm is proposed to enhance the feature word filtering for LDA input data. Select "Notre Dame Fire in Paris" event, collect micro-blog data, which is an important source of public opinion on the network, model it with LDA, and introduce TF-IDF algorithm to select the feature words, it is found that the subject distribution of the event can be analyzed more accurately.

关 键 词:网络舆情 主题提取 LDA TF-IDF 

分 类 号:G203[文化科学—传播学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象