图书馆杂志

图书馆杂志 ›› 2026, Vol. 45 ›› Issue (4): 82-97.

• 数字人文 • 上一篇    下一篇

ChatKG:一种基于大语言模型和提示工程的非遗知识图谱构建框架

周正达,王昊,汪琳,李晓敏,周抒,姚天辰   

  • 出版日期:2026-04-15 发布日期:2026-04-29
  • 作者简介:周正达  南京大学信息管理学院;数据工程与知识服务省高校重点实验室(南京大学),硕士研究生。研究方向:自然语言处理。作者贡献:实验分析、论文主体撰写。E-mail:zhengdazhou@smail.nju.edu.cn  江苏南京 210023
    王昊 南京大学信息管理学院;数据工程与知识服务省高校重点实验室(南京大学),教授,博士,博士生导师。研究方向:自然语言处理。作者贡献:设计研究方案、论文修改与最终版本修订。 江苏南京  210023
    汪琳  科大讯飞股份有限公司。研究方向:自然语言处理。作者贡献:设计研究方案、知识图谱构建。  安徽合肥230088
    李晓敏 南京大学信息管理学院;数据工程与知识服务省高校重点实验室(南京大学),博士研究生。研究方向:自然语言处理。作者贡献:设计研究方案、提供修改意见。 江苏南京 210023
    周抒  南京大学信息管理学院;数据工程与知识服务省高校重点实验室(南京大学),博士研究生。研究方向:自然语言处理。作者贡献:设计研究方案、提供修改意见。 江苏南京  210023
    姚天辰  新南威尔士大学工程学部,硕士研究生。研究方向:自然语言处理。作者贡献:设计研究方案、提供修改意见。澳大利亚悉尼

ChatKG: A Framework for Constructing Intangible Cultural Heritage Knowledge Graphs Based on Large Language Model and Prompt Engineering

Zhou Zhengda, Wang Hao, Wang Lin, Li Xiaomin, Zhou Shu, Yao Tianchen   

  • Online:2026-04-15 Published:2026-04-29
  • About author:Zhou Zhengda, Wang Hao, Wang Lin, Li Xiaomin, Zhou Shu, Yao Tianchen

摘要: 本文旨在解决当前非遗知识图谱构建中存在的人工成本高、准确率不足的问题,提出利用大规模预训练模型ChatGPT开展非遗知识图谱构建的新思路。具体提出一种基于大语言模型和提示工程的非遗知识图谱构建框架ChatKG(Chat Knowledge Graph),选择复用CIDOC CRM本体模型,结合人工梳理与ChatGPT辅助,实现了非遗本体构建,并提出一种基于思维链(CoT)的提示优化方法实现准确的非遗知识抽取,为缺少可直接复用本体概念模型以及高质量标注数据的非遗领域,提供了一种快速、高效、低成本构建领域本体概念模型和进行知识抽取的方法。本文以中国非遗陶瓷制作工艺为例,引导大语言模型成功识别出了419个工艺实体及763条实体间关系,最终构建了非遗陶瓷工艺知识图谱并进行了应用场景探索,验证了本文方法的有效性。

关键词: 大语言模型, 知识图谱, 提示工程, 本体构建, 知识抽取

Abstract: This paper aims to address the high manual costs and insufficient accuracy associated with the current construction of intangible cultural heritage(ICH) knowledge graphs by proposing a new approach using the large-scale pre-trained model ChatGPT. Specifically, we propose a domain knowledge graph construction framework, ChatKG(Chat Knowledge Graph), based on large language model and prompt engineering. By reusing the CIDOC CRM ontology model and combining manual curation with ChatGPT-assisted knowledge extraction, the framework enables the construction of ontologies for intangible cultural heritage. Additionally, we propose a Chain of Thought(CoT) prompt optimization method for accurate knowledge extraction. This provides a rapid, efficient, and low-cost solution for building domain ontology models and extracting knowledge in the ICH field, which originally lacks reusable ontology concept models and high-quality annotated data. Taking the Chinese intangible cultural heritage ceramic craft as an example, the model successfully identified 419 craft entities and 763 relationships between entities, ultimately constructing a knowledge graph and exploring application scenarios, thereby validating the effectiveness of our method.

Key words: Large language model, Knowledge graph, Prompt engineering, , Ontology construction, Knowledge extraction ,