图书馆杂志

图书馆杂志 ›› 2025, Vol. 44 ›› Issue (405): 61-73.

• 工作研究 • 上一篇    下一篇

高校技术转移预测模型构建及归因分析——以区块链技术为例

张更平1 2 陈红艺2 3 慎金花1 1 同济大学图书馆 2 同济大学经济与管理学院 3 同济大学科研管理部)   

  • 出版日期:2025-01-15 发布日期:2025-01-24
  • 作者简介:张更平 同济大学图书馆,馆员。研究方向:知识产权 信息服务。作者贡献:研究方法设计、实验数据采集与 处理、论文撰写与修改。E-mail: gpzhang@tongji.edu.cn 上海 200091 王 薇 同济大学经济与管理学院,硕士研究生。研究方向:情报分析。作者贡献:实验数据分析与论文修订。上海 200092 陈红艺 同济大学经济与管理学院,硕士研究生。研究 方向:情报分析。作者贡献:实验验证与核实。 上海 200092 卢 珊 同济大学科研管理部。研究方向:技术转移转化。作者贡献:论文修订。 上海 200092 慎金花 同济大学图书馆,研究馆员。研究方向: 情报分析、知识产权信息服务。作者贡献:研究课题指导、研究思路确定、论文成稿与修订。 上海 200092

The Prediction Model of University Technology Transfer and Attribution Analysis: Empirical Research in Blockchain Technology

Zhang Gengping1, Wang Wei2, Chen Hongyi2, Lu Shan3, Shen Jinhua1 (1 Tongji University Library; 2 School of Economics and Management, Tongji University; 3 Office of Research Administration, Tongji University)   

  • Online:2025-01-15 Published:2025-01-24
  • About author:Zhang Gengping1, Wang Wei2, Chen Hongyi2, Lu Shan3, Shen Jinhua1 (1 Tongji University Library; 2 School of Economics and Management, Tongji University; 3 Office of Research Administration, Tongji University)

摘要:

文章构建了高校专利转移预测模型,探索了影响预测效果的特征变量,以提升我国高校专利转化率,实现无形资产的产业价值。在清洗及标准化相关字段后,分别运用LDA、SBERT、SBERT- LDA 模型提取专利技术主题,对比了不同主题提取模型的预测结果,以准确率、精确度、召回率及F1 值评估了6 种常用分类算法的效果,并以区块链技术领域所涉专利数据开展实证分析。实验结果表明,在区块链技术领域,采用SBERT-LDA 方法提取专利技术主题后的随机森林算法展现出更优的预测性能。在此基础上,进一步运用SHAP 解释框架分析了影响模型预测的特征变量,并解读了其作用机理。研究发现,特征变量对预测效果的作用可分为二分类、正相关、负相关以及随机波动型4 类。

关键词: 高校 专利转移 预测模型 机器学习 随机森林算法 SHAP

Abstract:

The study constructs a prediction model for university patent transfers and explores the characteristic variables that affect the predictive accuracy to improve the patent conversion rate of Chinese universities. After cleaning and standardizing the patent fields, the study uses LDA, SBERT, and SBERT-LDA to extract the patent technology topics. The impact of these topic extraction models on the prediction performance is compared. Additionally, six commonly used classification algorithms are evaluated on accuracy, precision, recall, and F1 score. The experimental results show that in the field of blockchain technology, the random forest algorithm combined with the SBERT-LDA topic extraction method achieves the best prediction performance. Furthermore, the SHAP framework is employed to analyze the characteristic variables affecting model performance. These characteristic variables can be divided into four types: dichotomy, positive correlation, negative correlation, and random fluctuation.

Key words:

University, Patent tranfer, Predictive model, Machine learning, Random forest algorithm, SHAP