基于预训练模型与记忆卷积网络的立场检测研究  

Study of Stance Detection Based on Pre-training Model and Memory Convolution Network

在线阅读下载全文

作  者:陈珂 周浩轩 王国权 CHEN Ke;ZHOU Hao-xuan;WANG Guo-quan(School of Computer Science and Technology,Guangdong University of Petrochemical Technology,Maoming 525000,China;Dongguan Great Wall Development Technology Co.,Ltd.,Dongguan 523000,China)

机构地区:[1]广东石油化工学院计算机学院,广东茂名525000 [2]东莞长城开发科技有限公司,广东东莞523000

出  处:《计算机技术与发展》2023年第8期180-185,共6页Computer Technology and Development

基  金:国家自然科学基金项目(61172145);广东省自然科学基金项目(2018A030307032);广东省普通高校重点科研平台和项目(2020ZDZX3038);广东石油化工学院人才引进项目(2019rc078)。

摘  要:立场检测研究旨在研究特定文本针对特定话题所表达的支持、中立或反对立场,在以往的中文文本立场分析研究方法中,未关注文本结构间的依赖关系,且评论文本所隐含的立场往往是隐晦和不敏感的。该文提出了基于双向Transformer的大规模预训练语言模型BERT(Bidirectional Encoder Representation from Transformers)和长短时记忆(LSTM)以及卷积神经网络(CNN)相结合的立场分析方法来解决这个问题,同时,为解决BERT模型针对不同数据样本输入向量维度不一所导致的误差,提出了一种最优字个数维度判定算法对BERT模型输入进行分析。模型搭建上创新地采用并行输入输出的方法,充分利用了LSTM的全局特征提取和CNN的局部特征提取的优势,并且所用BERT模型更能对隐晦特征及不敏感特征进行提取,利用这一方法可以有效地判定不同目标对某一特定话题所表达的支持、中立或者反对立场。经过对比传统模型以及现有立场分析方法表明,所提模型拥有较好的性能,其F1值达到0.883。The research of stance detection aims to study the support,neutrality or opposition expressed by specific texts on specific topics.In the previous research on the stance detection of Chinese texts,the dependence between text structures was not paid attention to,and the stance implied in the comment text was often obscure and insensitive.We propose a stance detection method combining Bidirectional Encoder Representation from Transformers,Long Short Time Memory(LSTM)and Convolutional Neural Network(CNN)to solve this problem.We propose an optimal word number dimension determination algorithm to analyze the input of BERT model.On the model construction,the parallel input and output method is used innovatively,making full use of the advantages of LSTM global feature extraction and CNN local feature extraction.The BERT model can extract more obscure features and insensitive features.This method can effectively determine the support,neutrality or opposition expressed by different targets for a specific topic.Compared with traditional models and existing stance detection methods,the proposed model has excellent performance,and its F1 value reaches 88.3%.

关 键 词:立场分析 最优字维度判定 BERT 长短时记忆 卷积神经网络 

分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象