图书馆杂志

图书馆杂志 ›› 2023, Vol. 42 ›› Issue (391): 31-39.

• 特别策划 • 上一篇    下一篇

大语言模型对图书馆数字人文工作的挑战及应对思考

张宏玲1 沈立力1 韩春磊1 付雅明2
(1 上海图书馆 2 上海大学文化遗产与信息管理学院)
  

  • 出版日期:2023-11-15 发布日期:2023-12-04
  • 作者简介:张宏玲 上海图书馆(上海科学技术情报研究所),信息处理中心元数据制作部主任,副研究馆员。研究方向:元数据、数字资源建设、数字人文。作者贡献:确定选题、设计研究框架、论文撰写与修改、数据收集与分析。E-mail:hlzhang@libnet.sh.cn 上海200031 沈立力 上海图书馆(上海科学技术情报研究所),副研究馆员。研究方向:元数据组织与应用、数字人文。作者贡献:研究思路讨论、论文撰写与修改、数据收集与分析、图表制作。 上海 200031 韩春磊 上海图书馆(上海科学技术情报研究所),信息处理中心主任,副研究馆员。研究方向:文献资源数字化、数字人文、数字资源平台建设。作者贡献:选题指导、数据收集、论文修改。 上海 200031 付雅明 上海大学文化遗传与信息管理学院,博士,助理研究员。研究方向:数字人文、数字图书馆。作者贡献:专家访谈方法讨论、论文修改。 上海200444

Challenges and Reflections on the Practical Applicationof Large Language Model in Digital Humanities Work atLibraries

Zhang Hongling1, Shen Lili1, Han Chunlei1, Fu Yaming2  (1 Shanghai Library; 2 School of Cultural Heritage and Information Management, Shanghai University)   

  • Online:2023-11-15 Published:2023-12-04
  • About author:Zhang Hongling1, Shen Lili1, Han Chunlei1, Fu Yaming2 (1 Shanghai Library; 2 School of Cultural Heritage and Information Management, Shanghai University)

摘要:

大语言模型是人工智能在大规模预训练语料语言模型领域突破性的应用,给传统的知识理解、处理与服务带来了极大的挑战。文章通过文献调研和专家访谈,运用扎根理论从ChatGPT的数字人文工具价值、大语言模型中的汉语语料库、图书馆的汉语语料库建设工作、大语言模型带来的数据伦理4 个方面对专家访谈资料进行内容分析,探讨大语言模型带给图书馆数字人文工作的挑战;基于文献、场景应用及专家见解,文章从数据确权及版权保护、语言文化的差异及偏见、技术应用边界、标准规范4 个方面详述了图书馆数字人文工作实践的深层应对思考。

Abstract:

The large language model has posed significant challenges to traditional knowledgecomprehension, processing, and services. The article employs literature review, expert interviews, andgrounded theory to conduct content analysis of expert interview data from four aspects: the value ofChatGPT’s digital humanities tools, the Chinese language corpus within large language models, theconstruction of Chinese language corpora in libraries, and the relevant ethical challenge. These analysesdelve into the challenges that large language model introduces to library digital humanities work. Basedon literature, practical scenarios, and expert insights, the article elaborates on the in-depth considerationsfor the practice of digital humanities work in libraries, including data ownership and copyright protection,language and cultural differences, biases, technological application boundaries, as well as standards andregulations.