舆情事件向量预训练模型  

Pre-Training Model of Public Opinion Event Vector

在线阅读下载全文

作  者:王楠 谭舒孺 谢晓兰[2] 李海荣 WANG Nan;TAN Shuru;XIE Xiaolan;LI Hairong(College of Management Science and Information Engineering,Jilin University of Finance and Economics,Changchun 130117,China;School of Information Science and Engineering,Guilin University of Technology,Guilin,Guangxi 541006,China;School of Information Engineering,Xinjiang Institute of Technology,Aksu,Xinjiang 843100,China)

机构地区:[1]吉林财经大学管理科学与信息工程学院,长春130117 [2]桂林理工大学信息科学与工程学院,广西桂林541006 [3]新疆理工学院信息工程学院,新疆阿克苏843100

出  处:《计算机工程与应用》2024年第18期189-197,共9页Computer Engineering and Applications

基  金:国家社会科学基金(22BTQ048)。

摘  要:目前舆情预测研究中,事件表示具有一定的主观性和静态性,没有充分表达出事件演化的动态性和演化性,很多特征需要通过分析事件发展的完整过程得到,导致构建的预测模型并不能实现舆情现象发生前的预警目的。构建了事件预训练模型,实现基于评论数据的事件特征向量自动生成,并用于训练下游舆情反转预测模型。结合事件的主观评论与时序信息,通过构造评论词、事件词向量、事件词、事件句,将抽象的事件特征向量生成问题转换为自然语言预处理问题,基于Transformer结构提出了一种新的建模方式,实现事件特征向量自动生成及舆情反转预测。提出的模型用于舆情反转预测下游任务时,在测试集中对反转事件的预测率达到100%,实现了反转点之前预测出反转现象的目的。同时,该预测模型还可以较为准确地预测生成第二天的事件句,在对测试集的n折交叉验证中仅有11%的事件出现了预测误差,为研究舆情演化相关问题提供数据和方法基础。event feature vectors is transformed into a natural language preprocessing problem by constructing comment words,event word vectors,event words,and event sentences.Based on the Transformer structure,a new modeling method is proposed to achieve automatic generation of event feature vectors and prediction of public opinion reversal.When the model proposed in this paper is used for downstream tasks of predicting public opinion reversal,the prediction rate of reversal events in the test set reaches 100%,achieving the goal of predicting reversal phe-nomena before the reversal point.At the same time,the prediction model can also accurately predict the generation of event sentences for the next day.In the n-fold cross validation of the test set,only 11%of the events have showed prediction errors,providing data and methodological basis for studying issues related to public opinion evolution.

关 键 词:舆情反转预测 事件特征预训练 舆情演化 自然语言处理 TRANSFORMER 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象