1、情报资料工作 2023年3月第44卷第2期“开放科学”引领着科学研究范式的变革,也是加速实施联合国 2030年可持续发展议程 和达成可持续发展目标的重要驱动力量。在大数据与人工智能日益融合的“数智”时代,开放科学的重点正从开放科学数据的“独角戏”逐步转变为数据与软件等新型研究对象的“联袂”开放共享。2021年11月,联合国教科文组织(UNESCO)召开第41届大会,193个国家共同通过第一个关于开放科学的国际框架 UNESCO开放科学建议书(下文简称 建议书),标志着开放科学迈入全球共识的新阶段1。建议书 将“开源软件和源代码”同“研科学软件共享的FAIR原则*背景、内容与实践翟军程义婷王统左
2、李剑锋沈立新(大连海事大学航运经济与管理学院辽宁116026)摘要:目的/意义联合国教科文组织 开放科学建议书 将“FAIR原则”确立为值得推广的基本原则,该原则的适用范围已从“数据”扩展到“软件”,对于开放科学的可持续发展具有重要的推动作用。方法/过程文章采用文献分析和网络调查方法,梳理“FAIR软件原则”的产生背景和开发历程,介绍其主要内容和实践进展情况。结果/结论科学软件的重要性和独特性催生了“FAIR软件原则”,已落实到政策制定、基础设施建设和人员培训等领域,能够保障数据与软件的“携手”开放共享,促进开放科学的全面、均衡、协同和深入发展。关键词:开放科学科学软件科学数据FAIR原则开放
3、共享FAIR Principles of Scientific Software Sharing:Background,Content and PracticeZhai JunCheng YitingWang TongzuoLi JianfengShen Lixin(School of Maritime Economics and Management of Dalian Maritime University,Liaoning,116026)Abstract:Purpose/significance The FAIR principle is established as a basic p
4、rinciple worthy of promotion in theUNESCO Recommendation on Open Science.The scope of application of this principle has been extended from data tosoftware,which plays an important role in promoting the sustainable development of open science.Method/processUsing the methods of literature analysis and
5、 Web investigation,this paper combs the background and development process of FAIR principles for Research Software(FAIR4RS principles),and introduces their main content and practicalprogress.Result/conclusion The importance and uniqueness of scientific software gave birth to the FAIR4RS principles,
6、which have been implemented in the fields of policy,infrastructure and training.As a result,the FAIR4RS principles can ensure the hand in hand open sharing of data and software and promote the comprehensive,balanced,coordinated and in-depth development of open science.Keywords:open sciencescientific
7、 softwarescientific dataFAIR principlesopen and sharingDOI:10.12154/j.qbzlgz.2023.02.010*本文系教育部人文社会科学研究规划基金项目“集装箱多式联运电子 一单制 的智能合约设计方法及应用研究”(项目编号:21YJAZH070)的研究成果之一。实践研究93情报资料工作 2023年3月第44卷第2期究数据”并列,与传统的科学出版物一起成为开放共享大家庭的“一等公民”。与此相呼应,法国高等教育、研究与创新部制定的第二个 国家开放科学计划(20212024)确立的四大支柱分别是:开放获取、开放研究数据、开放研究源代码
8、和使开放科学成为科研转型的默认原则2。“欧盟开放科学云”(EOSC)基础设施建设也将出版物、数据和软件等并列为开放共享的头等对象3。建议书 向各国推荐FAIR原则,即可发现(Findable)、可获取(Accessible)、互操作(Interoperable)和可重用(Reusable),彰显了开放科学的全球化和FAIR化发展趋势。科学数据的FAIR原则(下文简称“FAIR原则”或“FAIR数据原则”)于2016年3月被正式提出4,迅速融入“数据生态系统”的各个层面,对各国的科学数据政策和开放科学实践产生了深刻影响。仅在欧盟,由于使用了FAIR数据,每年可节约成本约102亿欧元5。2020年
9、11月至2021年11月期间,正值FAIR原则提出五周年之际,Springer Nature等组织专家会议和研究社区调查,显示越来越多的研究机构和科研人员开始熟悉和支持FAIR原则,66%的受访者表示知晓这一原则,而2018年的这一数字仅为40%6。FAIR原则在诞生之初就考虑到了一般性和扩展性,对其的修订、完善和扩展持续不断7。其中,在FAIR原则从“数据对象”推广到更广泛的“数字对象”过程中,第一个得到惠顾的是“科学软件”(Scientific Software)。2022年3月15日,在研究数据联盟(Research Data Alliance,RDA)、研究软件联盟(Research
10、Software Alliance,ReSA)和FORCE11(Future Of Research Communications and E-Scholarship)社区的共同努力下,最终形成了“研究软件的FAIR原则”(FAIR Principles for Research Software,FAIR4RS Principles,下文简称“FAIR软件原则”)8,对于促进数据与软件的开放协同、持续提升二者的FAIR化水平具有重要意义。近年来,国内学者对FAIR原则的关注持续升温,包括对FAIR原则的解读9-11,基于FAIR原则的数据融合体系12、数据出版13和本体构建14、FAIR评估
11、模型与框架15等,但还未涉及科学软件。本文系统介绍FAIR软件原则的产生背景、主要内容和实践进展情况,以期为新形势下我国开放科学的理论研究、政策制定和实践发展提供借鉴和参考。1产生背景和开发历程1.1产生背景由于“几乎所有的数据都需要用软件进行某种形式的处理”,在开放科学所关注的新型研究对象中,数据与软件的关系最为密切。随着FAIR数据原则的广泛采纳和深入实施,人们深刻认识到科学软件的重要性和独特性,逐步在“没有软件的FAIR化就没有真正的FAIR数据”上形成共识,成为催生FAIR软件原则的关键因素。1.1.1软件与数据的同等重要性“软件”是以源代码(文本文件)或编译形式(可执行文件)存在的计
12、算机程序,通常还包括相关的文档、算法、用例和数据等。在科学研究领域,在研究过程中出于研究目的被开发出来的软件,主要用于生成、处理或分析研究结果或结论,被称为“科学软件”或“研究软件”8,16。近年来,在各方的不懈努力下,科学软件逐步从“幕后”走向“前台”,取得了与科学数据相当的学术地位,主要体现在:第一,研究成果认定。为鼓励科学家共享和重用软件,避免重复开发和资源浪费,美国、英国和欧盟的一些科学资助机构和学术评价组织已将软件认定为有效的研究成果,也有更多的科学、工程和人文等领域的研究社区将软件看作科研的主要产出之一,而不仅仅是副产品或辅助工具17。“十三五”期间,我国已通过项目资助、版权登记和
13、科研政策等措施保障科研软件的基础地位18。第二,引用原则与实践。新型研究对象价值被认可的首要标志之一是同传统的科学出版物一样,以一致的规范方式被引用。为此,于2014年2月通过的 数据引用原则共同宣言 确立了八项原则,成为指导各界数据引用实践的基本准则。在对“数据引用原则”进行剪裁的基础上,FORCE11社区于2016年4月发布“软件引用原则”,促使一些期刊、存储库和图书馆在提供数据引用服务的同时,也提供软件引用指南和服务19。相应地,支持数据引用的DataCite元数据,在2017年10月以后发布的V4.1至V4.4版本中已支持“软件引用”。第三,新兴学术论文出版。为推动开放科学时代学术出版
14、模式的创新,Elsevier出版集团于2014年推出实践研究94情报资料工作 2023年3月第44卷第2期全新的学术论文出版类型研究要素出版,主要包括数据出版和软件出版等20。在此背景下,新型的数据期刊和软件期刊如雨后春笋般出现,如Elsevier的Data in Brief(2014年创刊)和Software Impacts(2019年创刊),SSI 的 Journal of Open Research Software(JORS)(2013年创刊)和OSI(Open Source Initiative)的Journalof Open Source Software(JOSS)(2016年创
15、刊)等,其上发表的新型论文的数量、规范性和学术影响力在稳步增长。第四,软件存储和归档。为支持数据出版和软件出版过程中相关源代码的长期保存,大型科学仓储中心Zenodo和法国开放科学平台HAL(French Open Archive)在提供数据存储服务的同时,分别于2014年和2018年增加“软件类型”,开始为软件资源分配持久的DOI(Digital Object Identifier)和提供存储服务21。专门支持开放科学软件的“软件仓储中心”也陆续出现,主要有UNESCO和法国国家数字科学研究所共同支持的Software Heritage(www.softwareheritage.org)、N
16、ature 等支持的Code Ocean()和荷兰eScience中心的软件存储库(research-software.nl)等。1.1.2软件有别于数据的独特性从广义上讲,“计算机程序”(即软件)也是一种“数据”可以被计算机处理的任何事物22。但对照严格意义上的“数据”对事实或结果的电子记录,“软件”却有许多独特之处22-24,主要是:(1)软件具有“可执行性”,要完成一定的功能,如数据转换和可视化等,而数据是静态的、是被处理的对象;(2)在科学研究和管理决策中,数据提供证据,软件提供工具;(3)软件是人类创造性工作的成果,富含知识、模型和算法等,受到知识产权的保护,而数据仅仅是人工或自动观测和记录的结果,需要经过分析、提炼后才能上升为信息和知识;(4)软件的“复合性”(Composite Nature)导致软件之间存在错综复杂的依赖关系,软件运行会依赖其他软件、操作系统和硬件环境等,因此软件必须不断地维护和更新才能保持正常运行,而数据的独立性要强得多,这意味着软件的重用要比数据的重用更为复杂;(5)软件的生命周期通常短于数据的生命周期,软件的演化和更新比较频繁,新的版本会取代旧的版