大语言模型对图书馆数字人文工作的挑战及应对思考  被引量:18

Challenges and Reflections on the Practical Application of Large Language Model in Digital Humanities Work at Libraries

在线阅读下载全文

作  者:张宏玲 沈立力[1] 韩春磊[1] 付雅明 Zhang Hongling;Shen Lili;Han Chunlei;Fu Yaming(Shanghai Library;School of Cultural Heritage and Information Management,Shanghai University)

机构地区:[1]上海图书馆 [2]上海大学文化遗产与信息管理学院

出  处:《图书馆杂志》2023年第11期31-39,61,共10页Library Journal

基  金:国家社会科学基金重大项目“文化遗产智慧数据资源建设与服务研究”(项目编号:21&ZD334);中国索引学会规划重点课题“历史文献资源中的实体知识组织标准规范研究”(项目编号:CSI22A05)的研究成果之一。

摘  要:大语言模型是人工智能在大规模预训练语料语言模型领域突破性的应用,给传统的知识理解、处理与服务带来了极大的挑战。文章通过文献调研和专家访谈,运用扎根理论从ChatGPT的数字人文工具价值、大语言模型中的汉语语料库、图书馆的汉语语料库建设工作、大语言模型带来的数据伦理4个方面对专家访谈资料进行内容分析,探讨大语言模型带给图书馆数字人文工作的挑战;基于文献、场景应用及专家见解,文章从数据确权及版权保护、语言文化的差异及偏见、技术应用边界、标准规范4个方面详述了图书馆数字人文工作实践的深层应对思考。The large language model has posed significant challenges to traditional knowledge comprehension,processing,and services.The article employs literature review and expert interviews,utilizing grounded theory,to conduct content analysis of expert interview data from four aspects:the value of ChatGPT's digital humanities tools,the Chinese language corpus within large language models,the construction of Chinese language corpora in libraries.These analyses delve into the challenges that large language model introduce to library digital humanities work.Based on literature,practical scenarios,and expert insights,the article elaborates on the in-depth considerations for the practice of digital humanities work in libraries,including data ownership and copyright protection,language and cultural differences,biases,technological application boundaries,as well as standards and regulations.

关 键 词:大语言模型 ChatGPT 数字人文 数据伦理 语料库建设 

分 类 号:G250.7[文化科学—图书馆学] TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象