图书馆杂志

图书馆杂志 ›› 2026, Vol. 45 ›› Issue (5): 15-26.

• 理论探索 • 上一篇    下一篇

面向AI4Science的科学论文图像语义描述框架体系构建研究

张逸勤,邓三鸿,巩洪村,杨杰,刘浏   

  • 出版日期:2026-05-15 发布日期:2026-05-27
  • 作者简介:张逸勤  南京大学信息管理学院,博士研究生。研究方向:数字人文与文本挖掘。作者贡献:设计研究方法、论文起草。E-mail: yiqin.zhang@smail.nju.edu.cn  江苏南京 210023
    邓三鸿  南京大学信息管理学院,教授,博士生导师。研究方向:信息检索、知识管理。作者贡献:提出研究框架、论文修订。江苏南京  210023
    巩洪村  南京大学信息管理学院,博士研究生。研究方向:数据挖掘、自然语言处理。作者贡献:数据标注与处理、模型构建。江苏南京  210023
    杨杰  南京大学信息管理学院,博士研究生。研究方向:科学计量与评价。作者贡献:数据分析、模型校验。江苏南京  210023
    刘浏  南京农业大学信息管理学院,副教授。研究方向:数据挖掘、自然语言处理。作者贡献: 论文修订。江苏南京  210000

 Research on the Construction of a Semantic Description Framework for Scientific Document Images Oriented toward AI4Science

Zhang Yiqin, Deng Sanhong, Gong Hongcun, Yang Jie, Liu Liu   

  • Online:2026-05-15 Published:2026-05-27
  • About author:Zhang Yiqin, Deng Sanhong, Gong Hongcun, Yang Jie, Liu Liu

摘要: 科学论文图像的语义描述与标注是提升文献知识挖掘和智能信息管理能力的关键。本文基于学术图像的元数据结构和信息需求,提出了一个多层次的科学论文图像语义描述框架(SDFSLI),旨在实现 AI4Science 背景下科学文献图像内容的精确语义解析。该框架通过基础标识层、内容层、语义层及关系层4个相互关联的层级,分别从图像的基本信息、视觉内容、语义内涵和层次关联4个维度解析科学论文图像内容。本文同时构建了全面的本体模型,系统地映射了不同框架层之间的语义关系,利用多模态大型语言模型,在图书情报领域论文进行了实证案例验证,证明了该框架的实用性与有效性。本文讨论了科学论文图像语义描述的关键挑战与未来机遇,为科学知识管理的智能化发展提供了参考。

关键词: 科学论文图像, 语义描述框架, 本体模型, 知识服务

Abstract: The semantic description and annotation of scientific document images are essential for enhancing knowledge mining and intelligent information management of academic literature. Based on metadata structures and information requirements of academic images, this paper proposes a multi-level semantic description framework for scientific paper images (SDF-SLI), aimed at achieving precise semantic parsing of scientific document image content in the context of AI4Science. The framework analyzes scientific document images through four interconnected layers—basic identification layer, content layer, semantic layer, and relationship layer—which examine basic information, visual content, semantic connotation, and hierarchical relationships. This research also establishes a comprehensive ontology model that systematically maps semantic relationships between these framework layers, utilizing multimodal large language models for implementation. Through empirical case studies in library and information science literature, the framework demonstrates its practicality and effectiveness. The paper further discusses key challenges and future opportunities in semantic description of scientific paper images, offering insights into the intelligent development of scientific knowledge management.