图书馆杂志 ›› 2022, Vol. 41 ›› Issue (5): 102-108.
摘要: 为了能更好地组织南海证据性数据,提高南海疆智库的检索性能,便于科研人员对南海 问题展开深入研究,本文融合了中国图书馆分类法的族性检索和分面分类法的特性检索,构建了 南海文献分类法,应用 BERT 预训练模型实现细粒度的多标签南海证据性数据的自动分类,并通 过数据库技术将南海证据性数据分为 12 个面进行组配检索。通过以上方法赋予每一条南海证据性 数据唯一的分类号和类名,形式化表示为南海证据性数据的数据分类 = 证据来源分类 + 证据的数 据体系分类 + 证据的数据分面分类。从更细粒度的视角,实现数据分类,与粗放式文献载体的分 类相比,数据分类更有利于展开数据挖掘,找到数据间潜在的关联关系,发现新的研究视角,是 科学研究创新的基础和保障。