分享到: | 更多 |
□ 杨 兰
导语:科学数据是人类社会在科技活动中产生的各类数据资料,是科技创新的基础,也是经济社会发展决策的重要科学依据。人类的知识,无不是来源于所掌握的数据和信息的分析,尤其是在“大数据”时代的今天,科学研究、政府决策、产业发展越来越依赖于科学数据。因此,科学数据的开放、共享非常重要,特别是在人类社会投资力度不断加大,获取科学数据的能力飞速发展,而数据孤岛却极骤增长下,科学数据的共享显得尤为迫切。作为科研大国向科研强国迈进的过程中,十年的科学数据共享努力,中国的科学数据共享到底如何?
科学数据共享的价值与难题
半个多世纪以来,通过国家各级、各地政府部门和公益型事业单位开展的有组织的、大规模考察、调查、勘探、监测、试验、实验,以及各类科学工程、科研项目的实施,我国已经积累了海量的科学数据。进入21世纪后,科学数据更是以指数级的速度在增长,我们已经进入“数据洪流”“大数据”的时代。
尽管我国已经拥有丰富的科学数据资源,但数据共享问题仍然十分突出。诸多数据库往往局限于本部门、本单位使用,甚至小群体专用,缺乏部门间的交流和沟通,更没有形成面向社会共享的局面;国家各类科技计划项目所产生的科学数据,也没能得到有效的管理和利用。科学数据共享问题已经造成了重复建设和资源的巨大浪费,在相当程度上制约了科技创新,乃至国家整体科技水平的提高。
孙枢院士专门撰文呼吁:“科学数据共享可以使科研结果得到最广泛的利用和传播,科学家和社会公众可用最低廉的费用获得数据。充分利用他人已有的研究成果,避免不必要的重复,使科研资源得到有效利用”。“国际科技界花了100年的时间认清了科学数据的战略地位。我国应该仔细学习这段历史,一步到位给予科学数据应有的战略地位,这是科技长期可持续创新的重要保障,也是我国参与国际科技竞争的重要支撑条件”,孙鸿烈院士在谈到科学数据共享时表示。秦大河院士长期推动科学数据共享,认为:“科学数据具有非排他性、无消耗性和可增值性。科学数据共享,使科学数据更加开放、交换更加顺畅、应用更加便利”。国际科学数据委员会(CODATA)主席郭华东院士指出:“数据与信息的共享是实现不同学科、领域间合作的核心”。孙九林院士指出:“科学数据的科学、社会、经济价值只有在数据流动和共享中才能充分体现”。
然而,科学数据共享涉及到政策法规、标准规范、数据资源、技术系统、运行服务等诸多因素,是一个开放的、复杂的巨系统,尤其是涉及到部门利益、理念意识等,实施起来非常困难。“真正实现科学数据共享,要切实改变传统的科学数据占有观念,打破信息壁垒,实现科学数据的合理流通。”科技部原部长徐冠华院士说,“在确保国家安全和相关知识产权的前提下,大力促进信息公开,实施最大限度的科学数据共享,进而更加有效、更大范围地服务于社会和广大民众,是社会发展的必然”。科技部原副部长程津培院士2004年在科学数据保护与共享战略国际研讨会上指出:“科学数据共享要做好五个方面的工作:转变观念、提高认识。统筹规划,建立健全科学数据共享的法律、法规体系和标准规范体系。整合存量,构建国家科学数据共享服务体系”。
除政策法规、部门利益外,面向海量、分布、多源、异构的科学数据,如何从机制上保障这些数据资源的持续集成与共享,如何从标准规范、技术方法上有机整合集成这些数据资源,为用户提供“一站式”的数据服务都是急迫需要研究和解决的问题。
从试点到平台,中国科学数据共享的发展
启动试点工程,谋划中国科学数据共享
我国科学家一直呼吁科学数据的共享。早在1994年,中国科学院地学部徐冠华、孙枢、周秀骥等院士就提出了加强科学数据共享的建议。1999年,科技部在科技基础性工作和社会公益性研究专项中,启动了科技基础数据库建设。2001年,科技部成立“科学数据共享调研组”,在黄鼎成研究员的主持下,完成了“基础性工作及国家政策与管理研究”等调研报告,提出了“实施科学数据共享工程,增强国家科技创新能力”的建议。
2001年底,“气象科学数据共享试点”启动。2002年6月,科技部等5部委联合下发《关于进一步增强原始性创新能力的意见》文件,提出“要建立重要科研设备和科学数据资料共享机制,实施科学数据共享工程”。2002年11月,“中国科学数据共享”第196次香山科学会议召开,徐冠华、孙鸿烈、孙枢、程津培、秦大河院士和张先恩研究员担任会议执行主席,与会专家呼吁:“应加强国家对科学数据共享的统筹规划与协调,设立国家科学数据共享工程专项,推动我国科学数据共享问题的彻底解决”。 同年,继气象数据共享后,又启动了地球系统、水文、海洋、地震、国土、农业、林业、人口健康数据共享,作为国家科学数据共享工程第一批的9个试点,标志着我国科学数据共享工程的正式实施,掀开了中国科学数据共享事业新的一页!
在科技部发布的“科学数据共享工程规划”中明确了科学数据的战略资源地位及其共享管理的必然选择,确定了我国科学数据共享的建设目标、总体框架、主要任务与实施方案。通过试点工作探索了分散科学数据共享机制,基本解决了科学数据共享共性的标准规范、技术方法和软件系统等问题。通过试点项目,推动了科学数据共享在资源环境、农业、人口与健康、基础与前沿等领域共24个部门的开展,包括:气象、测绘、地震、水文水资源、农业、林业、海洋、国土资源、地质与矿产、对地观测等行业领域国家科学数据共享中心和地球系统、人口健康、基础科学、先进制造与自动化科学、能源和交通等学科领域的科学数据共享网,为科学数据共享的全面建设奠定了扎实的基础。
全面建设科技条件平台,夯实数据共享服务基础
为了进一步推动科学数据等科技资源的共享,2004年7月,国务院办公厅发布了《2004—2010年国家科技基础条件平台建设纲要》。2005年7月,科技部、发改委、财政部、教育部联合发布了《“十一五”国家科技基础条件平台建设实施意见》,同年,科技部、财政部设立平台建设专项,科学数据共享纳入国家科技基础条件平台,标志着科学数据共享等进入了全面建设阶段。
2006年12月,国家科技基础条件平台中心(以下简称“平台中心”)挂牌成立,专门推动和管理各类科技资源的优化配置和开放共享。国家科技基础条件平台重点建设了六类资源的43项共享平台:一是研究实验基础和大型科学仪器设备共享平台,包括全国大型科学仪器设备、研究实验基地、野外科学观测研究台站和计量基标准体系及检测技术体系;二是自然科技资源共享平台,包括植物种质资源、动物种质资源、微生物菌种资源、人类遗传资源、生物标本资源、岩矿化石标本资源、实验材料资源和标准物质资源;三是科学数据共享平台,包括科学数据共享中心和科学数据共享网;四是科技文献共享平台,包括科技图书文献信息保障系统、专利文献和标准文献共享服务系统;五是科技成果转化公共服务平台,包括科技成果信息服务体系、公益与行业共性技术转化平台和技术标准支撑体系;六是网络科技环境平台,包括国家条件平台应用服务支撑系统、网络计算应用系统、网络协同研究与工作环境、全国科普数字博物馆和全国科技信息服务网。
科学数据共享,在国家科技基础条件平台的推动和支持下,得到了进一步的发展和夯实。