pk10计划软件

 首页 >> 图书情报学
科学大数据:范式重塑与价值实现
2018年06月13日 10:25 来源:《图书与情报》 作者:孙建军 李阳 字号
关键词:科学大数据;数据科学;范式;价值链
本文来源:http://www.czygb.com/a/www.iefans.net/

pk10计划软件 www.czygb.com,回望历史,中国特色社会主义创造了人类社会发展史上惊天动地的发展奇迹,让中国人民大踏步赶上了时代的步伐。北京市代市长蔡奇出席座谈会现场回应了公众关心的热点问题。

内容摘要:大数据时代,科学研究与实践的各个领域与环节发生了根本性变革,科学大数据成为科技创新与应用的新引领,是新一轮科技革命的“引爆点”。

关键词:科学大数据;数据科学;范式;价值链

作者简介:

  作者简介:孙建军(1962- ),男,南京大学信息管理学院教授,博士生导师,研究方向:网络信息资源管理,大数据分析;李阳(1989- ),男,南京大学信息管理学院博士后,研究方向:信息资源管理,竞争情报。南京 210023

  内容提要:大数据时代,科学研究与实践的各个领域与环节发生了根本性变革,科学大数据成为科技创新与应用的新引领,是新一轮科技革命的“引爆点”。文章立足数据科学与图书情报科学前沿,提出了一个兼具“技术理性”与“人文价值”色彩的科学大数据范式特体。文章认为:科学大数据的概念框架应兼具知识维度和活动维度;科学大数据的“迭代优化”特征将会驱动其范式共同体的扩展与生态系统的形成;科学大数据价值链的提升则需要通过资源、模式与内容等方面的优化进行综合推进。在新技术环境下,科学大数据具有广阔的应用前景,其范式重塑与价值实现对于推进现代大科学研究理论与实践体系的建设具有积极意义。

  关 键 词:科学大数据 数据科学 范式 价值链

  标题注释:本文系国家社会科学基金重大项目“面向学科领域的网络资源深度聚合与导航机制研究”(项目编号:12&ZD221)的研究成果之一。

  中图分类号:G355 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2017089

  1 引言

  近年来,大数据热潮促进了数据科学的发展,尤其是计算机技术、互联网通信技术、传感技术的持续创新,使得科学研究的数据化能力得到进一步提升,以大数据为推动力的科学研究范围、方法、方式等发生了极大改变[1]。在此背景下,科学研究与工程实践不断推进,一系列大科学、大工程、大项目与大数据密切相关,如“E级超算”项目、人类基因组计划、未来世界计划等。科学大数据是科学研究中的海量数据,它既取之于科学,也反过来影响和扩大更多的科学探索与应用,成为架起数据科学与业务实践之间的关键桥梁。随着知识经济与科技竞争不断白热化,新一轮的科技革命蓄势待发,科学大数据逐步成为重塑国家科技水平与生产力的主导力量。同时,政府管理与社会治理进入了新常态,科技发展进入纵深发展的转折期,科学大数据管理迈向了新的节点和征程,科学研究、政府决策、产业发展等越来越依赖于科学大数据以及对其分析的能力。

  科学大数据是支撑国家科技创新的战略资源,党和政府高度重视科学大数据的发展。2015年8月,国务院发布的《促进大数据发展行动纲要》中,强调了发展科学大数据,积极推动由国家公共财政支持的公益性科研活动获取和产生的科学数据逐步开放共享,构建科学大数据国家重大基础设施,实现对国家重要科技数据的权威汇集、长期保存、集成管理和全面共享等。2016年8月,国务院印发的《“十三五”国家科技创新规划》,其强调着力扩大科技开放合作,从政策指引上部署了科技2030的大数据重大工程等。不仅如此,科研机构也积极参与科学大数据的相关实践,为了契合国家战略,中国科学院“十三五”信息化专项专门设置和实施了科学大数据工程项目,以期通过重点数据库建设来推动科学大数据的发展等。

  在现实背景、社会需求与政策导向上,科学大数据的基础理论与实践推进已经成为当前政府与社会关注的重要议题。长期以来,数据驱动理念与科学研究现状的固有矛盾一直制约着科学大数据的发展,新一代数据科学研究对科学大数据管理与服务提出了更高要求。然而,目前关注科学大数据的学理议题讨论较为少见,特别是关于科学大数据跨领域、跨学科协同的复杂性问题,学术界鲜有系统性研究。过去人们对于科学大数据的理解局限于自然科学视域,人文社会科学视域下的科学大数据逻辑没有得到应有的重视,而实际上,人文社会科学研究恰恰在大数据时代显示出其新的生命力。因此,如何从全新的视角系统厘清科学大数据的基础科学问题,以指导科学大数据的应用实践,支持满足社会发展与国家安全的重大需求,成为当前科学大数据研究的重要突破点。鉴于此,本文主要从数据科学、信息管理、图书情报的角度出发,旨在探究并提出科学大数据的核心内涵与数据价值链问题,形成兼具共识性的科学大数据理论与实践范式,以此推动科学大数据的繁荣与发展。

  2 科学大数据的概念框架

  科学大数据的提出源于大数据对科学知识发现与创新研究的深刻影响,其节点是2012年美国总统奥巴马宣布启动“大数据研究与开发计划”。从词语结构上看,科学大数据是一个典型的复合词,学术界关于科学大数据的术语裁定是围绕词根语素“大数据”之本身,强调“大数据”层面的范畴定性问题。如诸云强等[2]学者将科学大数据被定义为与科学相关,反映和表征着复杂的自然和社会科学现象与关系的大数据:黎建辉等[3]学者认为科学大数据是通过“机器”自动化快速采集、规模化存储与分析处理、具有较高维度和复杂关联的数据及其衍生产品。实际上,随着不同类型科学研究的交叉与关联倾向不断加强,科学大数据问题已经从单纯的大数据问题延伸为科学研究体系的大数据化问题。换句话说,科学大数据不仅仅来源于物理层面的科学数据,还涉及社会空间、信息空间的科学关联数据问题,也就是说,科学大数据的概念逻辑理应在内涵与外延层面进一步拓展与延伸。

  科学大数据是以数据科学为本位学科的专有术语,目前图书情报学科与数据科学的相融愈加密切,基于该范畴出发,本文认为,科学大数据有狭义与广义之分:狭义的科学大数据是指科学实验、科学设计等科学研究领域产生的一系列原始性、基础性数据,其本质上是以数据论(强调数据体量、类型与传播)为代表的科学大数据集合:广义的科学大数据存在于科研活动与科学研究的整个生命周期之中,包括科研启动、科研合作、科研结果与成果利用过程中涉及的科研人员数据、科研资料数据、科研技术数据与科研环境数据等。从广义视角来看,科学大数据的概念范畴可分为两个结构维度,一是知识维度,即科学知识大数据,包含各科学领域已形成的基本数据、资料、文献等承载知识内容的数据;二是活动维度,即科学活动大数据,包括科学活动中的实体(如人员、机构、项目等)及其关系数据(如合作、引证、共现、社交等)。目前学术界对科学大数据的理解主要着眼于知识维度层面的科学大数据集聚与融合问题,而对活动维度层面的科学大数据实体关系识别与效用计量评估等问题关注较少。实际上,走向大科学(Big Science)范畴的科学大数据是以目标为导向的科学家合作、科学网络形成与科学数据价值共创的系统工程,由此,科学大数据的外延将不断泛化,而内涵则固化到具体的科学问题与科学任务攻克,最终形成数据聚合、工具集成与专家协同的科学大数据“网”。

  3 科学大数据的范式建构剖析

  库恩将范式定义为针对科学革命的整体性框架与价值标准,包括定律、方法、技术等[4]。科学大数据的提出与形成有其历史特殊性,图灵奖获得者Jim Gray提出科学研究的第四范式,即数据密集型科学发现,科学大数据正是该范式下的核心基点和载体。面对科学研究的特定问题,科学大数据范式在研究途径、功能、机制等方面表现出不同于其他范式的独特内涵和新兴解释力,这与其范式变革与建构密切相关。

作者简介

姓名:孙建军 李阳 工作单位:

转载请注明来源:中国社会科学网 (责编:毕雁)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们