检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:蔡子杰 方荟[3,4] 刘建华 徐戈 龙云飞[5] CAI Zijie;FANG Hui;LIU Jianhua;XU Ge;LONG Yunfei(School of Computer Science and Mathematics,Fujian University of Technology,Fuzhou,Fujian 350118,China;Fujian Provincial Key Laboratory of Big Data Mining and Applications,Fuzhou,Fujian 350118,China;College of Computer and Control Engineering,Minjiang University,Fuzhou,Fujian 350108,China;Fujian Mental Health Human-Computer Interaction Technology Research Center,Fuzhou,Fujian 350108,China;School of Computer Science and Electronic Engineering,University of Essex,Colchester CO43SQ,UK)
机构地区:[1]福建理工大学计算机科学与数学学院,福建福州350118 [2]福建省大数据挖掘与应用技术重点实验室,福建福州350118 [3]闽江学院计算机与大数据学院,福建福州350108 [4]福建省心理健康人机交互技术研究中心,福建福州350108 [5]埃塞克斯大学计算机与电子工程学院,英国科尔切斯特CO43SQ
出 处:《中文信息学报》2024年第8期112-127,共16页Journal of Chinese Information Processing
基 金:科技创新2030-“新一代人工智能”重大项目(2022ZD0116308);福建省自然科学基金(2023J01349);福建省创新资金项目(2022C0022);闽江学院引进人才科技预研项目(MJY23033);闽江学院引进人才科技预研项目(MJY21032)。
摘 要:信息抽取目的在于从文本中提取关键的信息。心理健康领域的信息抽取能力反映了语言模型对人类心理健康相关信息的自然语言理解能力。提高语言模型的领域信息抽取能力,还能为AI心理健康服务提供重要的知识来源。但目前心理健康信息抽取的中文指令数据集十分匮乏,这限制了相关研究和应用的发展。针对以上问题,该文在心理学专家的指导下提示ChatGPT生成样本实例,并通过设计生成指令以及数据增强,构建了5641条包含命名实体识别、关系抽取和事件抽取三项基本抽取任务的心理健康领域联合信息抽取指令数据集,旨在填补心理健康领域信息抽取中文指令数据集的不足。随后使用该指令数据集对大型语言模型进行参数高效微调。与基线模型的性能对比以及人工评估的实验结果表明,大型语言模型经过有效的指令微调后可以完成心理健康领域信息抽取的联合任务。Information extraction is to extract essential information from text.The information extraction ability in the mental health domain reflects the large language model(LLM)'s understanding of human mental health related information.To improve the LLM's ability in mental health domain,however,is currently blocked by the severe shortage of Chinese instruction datasets.This paper,under the guidance of psychologists,makes ChatGPT generate sample instances,and finally created 5641 unified instruction datasets for information extraction in the field of mental health through the designed instruction generation and data augmentation.This dataset covers three basic extraction tasks:name entity recognition,relation extraction,and event extraction,with the aim of filling the gap in mental health information extraction Chinese instruction datasets.Applied parameter-efficient tuning with this instruction dataset,LLM is shown to be capable of performing unified information extraction tasks in the mental health field according to the comparison against the baseline models and the results of human evaluations.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3