图书馆杂志

图书馆杂志 ›› 2020, Vol. 39 ›› Issue (12): 20-28.

• 理论探索 • 上一篇    下一篇

DIKW概念链上数据科学的理论与技术基础简论

王宜鸿 叶 鹰   

  • 出版日期:2020-12-30 发布日期:2020-12-30
  • 作者简介:王宜鸿 南京大学信息管理学院,硕士研究生。研 究方向:定量信息分析。作者贡献:收集资料、写 作初稿。E-mail:yhong_wang@outlook.com 江苏南 京 210023 叶  鹰 南京大学信息管理学院,教授,博士生导 师。研究方向:图书情报学理论、定量信息分析、数 据分析与科学计量。作者贡献:提出命题、修改定 稿。江苏南京 210023

A Concise Discussion on the Theoretical and Technical Foundations of Data Science from the View of Information Science

Howell Y. Wang, Fred Y. Ye   

  • Online:2020-12-30 Published:2020-12-30

摘要: 从DIKW概念链看,数据科学的理论基础源于统计学、机器学习以及知识论三大学术领 域,形成算法-计算-知识核心“三位一体”的面向大数据知识发现的理论架构,同时,大数据 架构Hadoop、算法语言Python以及深度学习框架Tensorflow为数据科学的研究开发提供了技术基 础。这一理论与技术基础框架正支持着数据科学在信息科技与知识发现里开拓创新。

Abstract: From the view of DIKW chain, the theoretical foundations of data science are statistics, machine learning, and epistemology, leading to the trinity of algorithm, computing, knowledge as the theoretical framework for knowledge discovery in big data age. In the same time, the big data architecture Hadoop, algorithm language Python, and deep learning framework Tensorflow provide technical foundations for the R&D activities of data science. The theoretical and technical foundations are supporting the creation and innovation of data science in the fields of information and knowledge studies.