图书馆杂志

图书馆杂志 ›› 2020, Vol. 39 ›› Issue (6): 118-120.

• 数据论文 • 上一篇    下一篇

中文学术论文关键词聚类分析数据集

刘 翔 黄 晨   

  • 出版日期:2020-06-15 发布日期:2020-06-16
  • 作者简介:刘? 翔 浙江理工大学图书馆,副研究馆员。研 究方向:数字图书馆及科学计量大数据。作者贡 献:数据处理、分析和数据论文撰写。E-mail: solarislx@163.com 浙江杭州 310018 黄? 晨 浙江大学图书馆,研究馆员。研究方向:数 字图书馆与大数据应用。作者贡献:研究策划和数据 结果分析。 浙江杭州 310058

Database of Chinese Academic Papers Keyword Clustering Analysis

Liu Xiang, Huang Chen   

  • Online:2020-06-15 Published:2020-06-16

摘要: 中国工程科技专家库经过四年多的建设,汇聚了总共约1.2亿条学术资源,在对这些海量
的资源进行数据分析的过程中,对78??292??409篇中文论文的关键词数据进行了系统提取及分析。本
次公开的数据集为2014-2018年18??789??626篇中文学术论文中提取的18??912??786关键词对,可以用
于学术热点分析、共词分析及跨学科研究趋势探测。

关键词: 中文论文 , 关键词 , 中国工程科技专家库

Abstract: After more than four years of development, China Engineering Expert Tank(CEET) has
collected about 120 million pieces of academic resources. During the data analysis of these resources, the
keywords of 78 292 409 Chinese papers are extracted and analyzed systematically. The published database
consists of keywords extracted from 18 789 626 Chinese academic papers from 2014 to 2018. It can be
used in academic hotspot analysis, co-word analysis and academic emerging trend detection.

Key words: Keywords Chinese papers, Keyword, China Engineering Expert Tank (CEET)