检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘江峰 张冉[1,2] 张君冬 裴雷 Liu Jiangfeng;Zhang Ran;Zhang Jundong;Pei Lei(Data Intelligence and Cross Innovation Laboratory,Nanjing University;School of Information Management,Nanjing University)
机构地区:[1]南京大学数据智能与交叉创新实验室,江苏南京210023 [2]南京大学信息管理学院,江苏南京210023
出 处:《图书馆杂志》2025年第3期113-127,共15页Library Journal
基 金:江苏省研究生科研与实践创新计划项目“以生成式人工智能变革文献知识组织与评价研究”(项目编号:KYCX24_0111)的研究成果之一。
摘 要:大语言模型改变了自然语言处理研究的模式。通过生成式自然语言处理,为史料计算化处理提供高效途径。以百川大模型作为基准模型,使用《中国思想家评传》系列丛书文本作为数据源,采用领域继续预训练、有监督微调、直接偏好优化的方法构建了思想家模型,并进行了性能评估。经过评估,思想家模型在中国思想史领域文本的表现优于通用模型,具有可用性。思想家模型降低了知识交流的专业壁垒,可以破解自然语言理解式计算人文研究带来的解读困境。The large language model has changed the natural language processing and is enhancing the computational analysis of historical texts.Taking the Baichuan Large Language Model as the benchmark model and using the text of the book series Biographies of Chinese Thinkers as the data source,the Thinkers Model was constructed by using domain-specific pre-training,supervised fine-tuning,and direct preference optimization,whereas the performance was evaluated.Evaluation results show that the Thinkers Model outperforms general models in this specialized domain,demonstrating its potential in computational humanities research.The Thinker Model reduces the professional barriers to knowledge exchange and can address challenges in natural language interpretation within computational humanities research.
关 键 词:计算史学 人工智能生成内容(AIGC) 思想家 大语言模型 《中国思想家评传》 计算人文
分 类 号:B215[哲学宗教—中国哲学] TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.13