以生成式人工智能赋能思想史计算研究:模型构建与应用探索  

Empowering Computational Research in the History of Ideas with Generative Artificial Intelligence:Model Construction and Applications

在线阅读下载全文

作  者:刘江峰 张冉[1,2] 张君冬 裴雷 Liu Jiangfeng;Zhang Ran;Zhang Jundong;Pei Lei(Data Intelligence and Cross Innovation Laboratory,Nanjing University;School of Information Management,Nanjing University)

机构地区:[1]南京大学数据智能与交叉创新实验室,江苏南京210023 [2]南京大学信息管理学院,江苏南京210023

出  处:《图书馆杂志》2025年第3期113-127,共15页Library Journal

基  金:江苏省研究生科研与实践创新计划项目“以生成式人工智能变革文献知识组织与评价研究”(项目编号:KYCX24_0111)的研究成果之一。

摘  要:大语言模型改变了自然语言处理研究的模式。通过生成式自然语言处理,为史料计算化处理提供高效途径。以百川大模型作为基准模型,使用《中国思想家评传》系列丛书文本作为数据源,采用领域继续预训练、有监督微调、直接偏好优化的方法构建了思想家模型,并进行了性能评估。经过评估,思想家模型在中国思想史领域文本的表现优于通用模型,具有可用性。思想家模型降低了知识交流的专业壁垒,可以破解自然语言理解式计算人文研究带来的解读困境。The large language model has changed the natural language processing and is enhancing the computational analysis of historical texts.Taking the Baichuan Large Language Model as the benchmark model and using the text of the book series Biographies of Chinese Thinkers as the data source,the Thinkers Model was constructed by using domain-specific pre-training,supervised fine-tuning,and direct preference optimization,whereas the performance was evaluated.Evaluation results show that the Thinkers Model outperforms general models in this specialized domain,demonstrating its potential in computational humanities research.The Thinker Model reduces the professional barriers to knowledge exchange and can address challenges in natural language interpretation within computational humanities research.

关 键 词:计算史学 人工智能生成内容(AIGC) 思想家 大语言模型 《中国思想家评传》 计算人文 

分 类 号:B215[哲学宗教—中国哲学] TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象