检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:曾碧卿 陈鹏飞 姚勇涛 ZENG Biqing;CHEN Pengfei;YAO Yongtao(School of Software,South China Normal University,Foshan 528225,Guangdong,China)
出 处:《计算机工程》2024年第7期53-62,共10页Computer Engineering
基 金:广东省普通高校人工智能重点领域专项(2019KZDZX1033);广东省基础与应用基础研究基金(2021A1515011171);广州市基础研究计划基础与应用基础研究项目(202102080282)。
摘 要:方面情感三元组抽取(ASTE)任务是方面级情感分析的重要子任务之一,传统的监督学习方法在该任务上取得了SOTA或接近SOTA的效果。然而,随着深度神经网络的发展,生成式大型语言模型(LLM)为该任务带来了更多的可能性。目前大多数工作都是直接对LLM进行微调,但是忽略了LLM的幻觉现象,导致性能下降。提出一种融合思维链技术和LLM低秩自适应(Lo RA)微调LFC方法,实现生成式的ASTE新范式,以提升任务性能。在LFC中,首先基于思维链技术,通过人工构造少量推理样本,并利用LLM生成具有推理结构的增强数据集。将增强数据集用于微调Chat GLM3-6B模型的学习。在微调过程中,采用Lo RA微调技术提高在低资源环境下适配ASTE任务的效果。实验结果表明,LFC方法相比于最优的基线模型在Res14、Lap14、Res15和Res164个数据集上的F1值分别提升8.37、12.31、11.07和8.43个百分点,该方法不仅能够准确地识别三元组,而且在一定程度上优化了LLM的幻觉现象。The Aspect Sentiment Triplet Extraction(ASTE)task is an important subtask of aspect-level sentiment analysis.Conventional supervised learning methods achieve SOTA or near-SOTA results in this task.However,in developing deep neural networks,generative Large Language Models(LLM)offer additional possibilities for this task.Currently,most studies directly fine-tune the LLM but overlook its hallucinations,leading to performance degradation.To improve task performance,this paper proposes a LFC method for implementing a new generative ASTE paradigm.This method combines the Chain-Of-Thought(COT)technique and a fine-tuning approach based on LLM Low-Rank Adaption(LoRA).In LFC,based on COT technology,a few inference samples are manually constructed,and an enhanced dataset with an inference structure is generated using LLM.It uses an enhanced dataset to fine-tune the learning of the ChatGLM3-6B model.During the fine-tuning process,LoRA fine-tuning technology improves the effectiveness of adapting to ASTE tasks in low-resource environments.Experimental results show that compared with the optimal baseline model,the LFC method improves the F1 values by 8.37,12.31,11.07,and 8.43 percentage points on the Res14,Lap14,Res15,and Res16 datasets,respectively.This method accurately identifies triples and optimizes the hallucinations of the LLM to a certain extent.
关 键 词:方面情感三元组抽取 大型语言模型 低秩自适应微调 思维链 提示学习
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.144.178.2