检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈珂 周浩轩 王国权 CHEN Ke;ZHOU Hao-xuan;WANG Guo-quan(School of Computer Science and Technology,Guangdong University of Petrochemical Technology,Maoming 525000,China;Dongguan Great Wall Development Technology Co.,Ltd.,Dongguan 523000,China)
机构地区:[1]广东石油化工学院计算机学院,广东茂名525000 [2]东莞长城开发科技有限公司,广东东莞523000
出 处:《计算机技术与发展》2023年第8期180-185,共6页Computer Technology and Development
基 金:国家自然科学基金项目(61172145);广东省自然科学基金项目(2018A030307032);广东省普通高校重点科研平台和项目(2020ZDZX3038);广东石油化工学院人才引进项目(2019rc078)。
摘 要:立场检测研究旨在研究特定文本针对特定话题所表达的支持、中立或反对立场,在以往的中文文本立场分析研究方法中,未关注文本结构间的依赖关系,且评论文本所隐含的立场往往是隐晦和不敏感的。该文提出了基于双向Transformer的大规模预训练语言模型BERT(Bidirectional Encoder Representation from Transformers)和长短时记忆(LSTM)以及卷积神经网络(CNN)相结合的立场分析方法来解决这个问题,同时,为解决BERT模型针对不同数据样本输入向量维度不一所导致的误差,提出了一种最优字个数维度判定算法对BERT模型输入进行分析。模型搭建上创新地采用并行输入输出的方法,充分利用了LSTM的全局特征提取和CNN的局部特征提取的优势,并且所用BERT模型更能对隐晦特征及不敏感特征进行提取,利用这一方法可以有效地判定不同目标对某一特定话题所表达的支持、中立或者反对立场。经过对比传统模型以及现有立场分析方法表明,所提模型拥有较好的性能,其F1值达到0.883。The research of stance detection aims to study the support,neutrality or opposition expressed by specific texts on specific topics.In the previous research on the stance detection of Chinese texts,the dependence between text structures was not paid attention to,and the stance implied in the comment text was often obscure and insensitive.We propose a stance detection method combining Bidirectional Encoder Representation from Transformers,Long Short Time Memory(LSTM)and Convolutional Neural Network(CNN)to solve this problem.We propose an optimal word number dimension determination algorithm to analyze the input of BERT model.On the model construction,the parallel input and output method is used innovatively,making full use of the advantages of LSTM global feature extraction and CNN local feature extraction.The BERT model can extract more obscure features and insensitive features.This method can effectively determine the support,neutrality or opposition expressed by different targets for a specific topic.Compared with traditional models and existing stance detection methods,the proposed model has excellent performance,and its F1 value reaches 88.3%.
关 键 词:立场分析 最优字维度判定 BERT 长短时记忆 卷积神经网络
分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.119.13.56