基于大型语言模型指令微调的心理健康领域联合信息抽取被引量：2

Instruction Tuning of LLM for Unified Information Extraction in Mental Health Domain

作　　者：蔡子杰方荟[3,4] 刘建华徐戈龙云飞[5] CAI Zijie;FANG Hui;LIU Jianhua;XU Ge;LONG Yunfei(School of Computer Science and Mathematics,Fujian University of Technology,Fuzhou,Fujian 350118,China;Fujian Provincial Key Laboratory of Big Data Mining and Applications,Fuzhou,Fujian 350118,China;College of Computer and Control Engineering,Minjiang University,Fuzhou,Fujian 350108,China;Fujian Mental Health Human-Computer Interaction Technology Research Center,Fuzhou,Fujian 350108,China;School of Computer Science and Electronic Engineering,University of Essex,Colchester CO43SQ,UK)

机构地区：[1]福建理工大学计算机科学与数学学院,福建福州350118 [2]福建省大数据挖掘与应用技术重点实验室,福建福州350118 [3]闽江学院计算机与大数据学院,福建福州350108 [4]福建省心理健康人机交互技术研究中心,福建福州350108 [5]埃塞克斯大学计算机与电子工程学院,英国科尔切斯特CO43SQ

出　　处：《中文信息学报》2024年第8期112-127,共16页Journal of Chinese Information Processing

基　　金：科技创新2030-“新一代人工智能”重大项目(2022ZD0116308);福建省自然科学基金(2023J01349);福建省创新资金项目(2022C0022);闽江学院引进人才科技预研项目(MJY23033);闽江学院引进人才科技预研项目(MJY21032)。

摘　　要：信息抽取目的在于从文本中提取关键的信息。心理健康领域的信息抽取能力反映了语言模型对人类心理健康相关信息的自然语言理解能力。提高语言模型的领域信息抽取能力,还能为AI心理健康服务提供重要的知识来源。但目前心理健康信息抽取的中文指令数据集十分匮乏,这限制了相关研究和应用的发展。针对以上问题,该文在心理学专家的指导下提示ChatGPT生成样本实例,并通过设计生成指令以及数据增强,构建了5641条包含命名实体识别、关系抽取和事件抽取三项基本抽取任务的心理健康领域联合信息抽取指令数据集,旨在填补心理健康领域信息抽取中文指令数据集的不足。随后使用该指令数据集对大型语言模型进行参数高效微调。与基线模型的性能对比以及人工评估的实验结果表明,大型语言模型经过有效的指令微调后可以完成心理健康领域信息抽取的联合任务。Information extraction is to extract essential information from text.The information extraction ability in the mental health domain reflects the large language model(LLM)'s understanding of human mental health related information.To improve the LLM's ability in mental health domain,however,is currently blocked by the severe shortage of Chinese instruction datasets.This paper,under the guidance of psychologists,makes ChatGPT generate sample instances,and finally created 5641 unified instruction datasets for information extraction in the field of mental health through the designed instruction generation and data augmentation.This dataset covers three basic extraction tasks:name entity recognition,relation extraction,and event extraction,with the aim of filling the gap in mental health information extraction Chinese instruction datasets.Applied parameter-efficient tuning with this instruction dataset,LLM is shown to be capable of performing unified information extraction tasks in the mental health field according to the comparison against the baseline models and the results of human evaluations.

关键词：信息抽取心理健康大型语言模型指令微调

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于大型语言模型指令微调的心理健康领域联合信息抽取被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于大型语言模型指令微调的心理健康领域联合信息抽取 被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于大型语言模型指令微调的心理健康领域联合信息抽取被引量：2