美国是全球公认在科研数据管理建设方面起步较早、成效较好和影响最大的国家之一。自第二次世界大战以来,美国的科研数据获取和共享政策在科学本身的开放流动性,以及政府数据公开透明化双重驱动下逐步发展完善,并通过七国集团、经济合作与发展组织等多边平台积极向全球推广,其间也受到地缘政治紧张和科技经济竞争等影响,如近年美国联邦政府出台的敏感数据保护和研究安全等政策,在一定程度上与开放科学的愿景和逻辑相背离。本文梳理了美国联邦政府科研数据管理政策的发展演进,尤其是美国相关政策在“数据开放共享”与“研究安全保护”间的数次角力,并结合美国联邦政府最大科学研究资助部门——国家科学基金会(National Science Foundation,NSF)等分析其相关政策要求和具体实践,以期为国内科研数据管理和国际创新合作提供参考。

一、美国政府科研数据管理政策演进的历史脉络

1.1 科研开放与政府公开双引擎驱动下的稳步发展期(1945—1990年)

一方面,科学界自身的驱动。知识开放流动是科学发展的内在特征。从17世纪中叶发源于欧洲的各类学会组织及其会刊的诞生起,科学界自发形成并确立了基于学术研讨和期刊发表的科研成果公开模式。到第二次世界大战时期,美国政府认识到科学技术发展的重要性,从政治考量出发,认为“科学是政府应关注的领域”“科学进步对国家福祉至关重要”。1945年,万尼瓦尔·布什向罗斯福总统提交《科学:无尽的前沿》报告;同年,总统签署行政令成立国际技术信息服务局,开始有组织地系统化收集、管理科技报告。1958年,成立科学与技术信息委员会。1963年,总统科技顾问委员会发布了由时任橡树岭国家实验室主任温伯格牵头的《科学、政府与信息》报告(又称温伯格报告),指出“信息传递是研发活动不可分割的组成部分”,强调科学信息管理的必要性,推动美国联邦政府加大科学信息管理投入,促进美国科学数据共享和标准化发展。表1列出了这一时期美国出台的相关主要法律、政策或事件。

另一方面,政府治理的需要。为促进公民知情权和国内民主进程,美国联邦政府提倡非机密政府信息的公开可及性。1962年《存储图书馆法》生效,授权启动联邦“存储图书馆计划”,建立民众免费获取政府文件的渠道;1966年《信息自由法》颁布并生效,确立公民知情权原则及政府信息申请与公开的机制流程,明确国家机密(国防、外交等)、内部人事、商业秘密、执法调查记录和个人隐私等9类政府信息豁免公开。其后,1974年《隐私法》、1976年《阳光政府法》等构建起美国政府数据和信息资源公开的法律基础。1985年,白宫管理和预算办公室(Office of Management and Budget,OMB)发布“联邦信息资源管理”(A-130通告),明确美国联邦政府各部门在包括科研数据在内的联邦信息资源管理层面的职责。联邦科技报告体系也逐步发展完善,建立覆盖美国国防部、商务部、国家航空航天局和能源部四大领域的科技报告系统。

20世纪80年代,在冷战氛围下,美国和苏联持续紧张对峙,美国对日本、德国等国家技术经济竞争的担忧也日益加剧,美国政商界部分人提出限制美国高科技设备和相关专业知识流动。美国国内各界就科研信息开放和转移进行了一次广泛而深入的辩论。1985年,时任美国总统里根发布题为“国家科学、技术和工程信息转移政策”的国家安全决策指令(NSDD-189)。该指令明确了“基础研究”的定义和美国联邦政府对于基础研究成果数据的管理政策——“在最大可能的范围内保持不受限制”“需管控的研究成果应通过标准保密程序管理控制”“不得对由联邦政府资助且无国家安全保密要求的基础研究的开展和报告施加任何限制”。该指令发布以来,尽管美国国内又出现数次关于研究成果是否应开放共享的争论和调整,但该指令奠定了美科学数据开放共享的总体基调。

1.2 网络信息技术和政府问责制推动下的发展成熟期(1990—2017年前后)

对政府绩效和透明度的更高要求成为本阶段美国联邦政府科研数据管理政策快速发展的主要动力。1993年,《政府绩效结果法》生效,开启美强化政府问责制的时代;同年,为顺应网络信息技术快速发展,《加强政府印刷局电子信息访问法》生效,要求美国联邦政府各机构在其网站提供电子版政府文件和信息。2002年又推出《电子政务法》,进一步推动联邦政府信息的互联网访问。2005年,OMB颁布M-06-02号备忘录,要求美国联邦政府各部门在互联网发布的信息通过分类、受控词汇或元数据等模式实现“跨机构搜索”。2009年,时任美国总统奥巴马启动“开放政府倡议”,强调信息透明度对于政府问责制、公众参与的重要性。2012年,奥巴马总统发布“建设21世纪数字政府”备忘录,鼓励联邦政府各机构利用移动和基于网络的技术改善包括信息传递在内的数字服务。2013年,OMB按照“使开放和机器可读成为政府信息的新默认设置”总统行政令要求,制定发布“开放数据政策”备忘录,声明其目的是“帮助推动创业、创新和科学发现,改善美国人民生活并创造就业机会”,要求“尽可能确保政府数据以易于查找、访问和使用的方式公开发布”“新的政府信息在整个生命周期内应保持开放、机器可读和可互操作,同时保障个人隐私、保密性和国家安全”。同年,推出联邦政府数据网站(data.gov)以改善政府数据访问,成为联邦数据开放的平台,公开包括研发资助机构在内的各机构通过基金赠款、合同和合作协议生成的数据集。1990—2016年美国出台的相关主要法律、政策或事件详见表2。

美国科技界高度重视信息网络技术为科研数据高效共享带来的机遇。1997年,美国国家研究理事会发布《比特力量》报告,倡导“全面开放的科学数据交换”,提出“公共资助研究的数据和信息应在尽可能少的限制下,以非歧视的方式提供”。2003年,NIH发布“研究数据共享政策(NOTOD-03-032)”,要求年直接经费超过50万美元的研究项目,在申请时提交关于研究数据共享的计划。数据共享计划需要包括时间表、数据格式和共享方法等,以及对共享及时性、隐私保护等要求。NSF于2005年发布了“公共访问政策”,并在项目资助指南中要求:研究人员应在合理时间内,以不超过增量成本的方式,与其他研究人员共享在NSF资助下工作过程中创建或收集的原始数据、样本、实物收藏等信息和材料;2011年,NSF数据共享政策进一步细化,要求所有项目在申请时提交“数据管理计划”(Data Management Plan,DMP)文件。

为响应科学界呼声,美国国会曾于2006年提出《联邦研究公共获取法案》草案,推动由联邦政府11家科技相关部门资助的科研成果免费、及时地在线获取,因其未能成法,后于2009年和2012年又多次被提出,得到众多美国大学校长和诺奖得主的支持。针对相关诉求,OSTP时任主任霍尔德伦于2013年2月发布“扩大联邦资助科研成果获取渠道”备忘录(又称霍尔德伦备忘录),要求年研发经费超过1亿美元的联邦政府机构须在6个月内制定其资助科研成果的“公共获取计划”,围绕利用好现有数据库、提升公众获取能力、优化数据搜索存档与传播、告知被资助对象其义务和合规监测等要素明确并细化,确保被资助人员制定DMP,实现联邦资助科研成果(包括经同行评议的出版物和数据)在出版12个月内实现公众免费线上获取,以加速科学突破与创新、促进创业、支撑经济增长与创造就业。随着政府联邦各科技相关部门研究数据管理政策的制定与实施,美国科研数据管理政策框架已基本成形,并在实践和发展中逐步改进成熟。

2016年,为推动美科研数据管理理念和实践在全球更广泛的范围内得到认同,美国家科技委员会(National Science and Technology Council,NSTC)发布了《通过国际科技合作加强联邦资助科学数据和科研发现获取的有关原则》报告。报告将联邦非保密科研数据明确为四大类,包括原始数据(观测和测量等)、生成数据(基于原始数据加工计算的结果)、数字格式的元数据和出版物,并倡导7个方面的原则:一是尽早且持续地推动科学数据的建立、描述、管理、维护、验证、可发现、可访问和传播;二是科学数据应在法律允许范围内被最大限度地公开获取,遵守隐私、保密、安全和专有权、商业机密和知识产权等适当限制;三是政府支持的科研数据应尽可能的免费提供;四是国际科技合作参与方应在项目启动时制订涵盖科学数据整个生命周期的数据管理计划;五是联邦政府各机构应鼓励技术和法律层面的互操作性,使用兼容、公开和开源的格式,促进政府支持科研数据的国际共享;六是政府支持的科学数据及出版物应尽早开放,明确规定公开时间和延迟期限;七是联邦政府各机构应与国际科技伙伴合作,加强在七国集团、经济合作与发展组织等多边框架下的协调,制定有利于数据开放共享的政策和数据标准。2016年,在中国杭州举办的G20峰会公报写入支持“促进开放科学”,“推动在可找寻、可访问、可交互、可再用的原则(Findable,Accessible,Interoperability and Ressability Principle,FAIR)下,提高获取公共财政资助的研究成果的便利性”。

在这一阶段,面对中国经济科技实力的快速跃升,美国政府、战略界和科技界又开展了新一轮辩论和反思。2007年,美国国家科学院发布《超越风暴》报告,强调以加大研发投入、加强开放合作、重视科学、技术、工程和数学(Science Technology Engineering Mathematics,STEM)教育等措施增强美国自身科技竞争力,而非选择限制对外科技合作和数据共享。同年,美国国会通过《美国竞争法》,推动NSF、能源部科学办公室、国家标准与技术研究院(Natioinal Institute of Science and Technology,NIST)等研发经费翻番,推行美国STEM教育改革等;2010年又通过《美国竞争再授权法》,进一步加强美国跨部门科技政策协调、研发投入和人才培养。

1.3 开放科学与数据安全“角力”下的发展调整期(2017年以来)

2017年以来,美国科技界继续倡议和推动开放科学和数据共享。2018年,美国国家科学、工程与医学院(National Academy of Science,Engineering and Medicine,NASEM)发布共识研究报告《开放科学设计:实现21世纪研究的愿景》,强调“数据开放和共享是科学进步和科研体系有效运行的基础”,科学界应携手构建面向未来的开放科学生态系统。2022年,OSTP时任代理主任尼尔森向联邦政府各部门负责人发布“确保联邦资助研究的自由、及时和公平获取”备忘录(又称尼尔森备忘录),盘点2013年霍尔德伦备忘录发布以来的进展,强化政策力度,细化管理要求,进一步加强联邦资助研究数据和成果的开放。备忘录强调“科学开放是基础、安全是必要,自由和诚信是关键”的理念,要求所有联邦科研资助机构尽快并在2025年底之前制定或更新其科研成果的公共访问政策;相关研究成果必须及时公开(不再设置12个月的延迟期);必须确立透明的程序,确保符合科研诚信要求;不仅强制开放获取,更是涉及机器可读性、持久标识符等技术要求,确保研究成果易于发现、使用和验证。美国政府将2023年定为“开放科学年”,从政策、基础设施、人才培养和社区参与等方面开展了大量活动,营造了全政府的开放科学文化。该时期美国出台的相关主要法律、政策或发生的事件见表3。

NIH已于2024年末完成了公共获取政策的更新,新政策于2025年7月1日起正式实施。该政策演进“反映出人们日益认识到开放科学的重要性,以及研究成果公开获取后加速创新的潜力”,“标志美国科学界朝向更加开放、公平和协作的格局迈进”。

面对中国科技、经济和军事实力的持续稳步快速提升,美国情报界、战略界鹰派借各种机会以“网络攻击”“技术窃取”等为由攻击中国,“中国威胁论”逐渐成为美国白宫与国会、民主与共和两党及社会的共识。2021年和2024年,拜登政府先后发布“保护美国公民敏感信息不受外国对手侵害”和“防止关注国获取美国公民敏感个人数据和美国政府相关数据”两个总统行政令,强化对美国政府和个人敏感数据的保护,其中涉及个人的基因组数据、生物识别数据、健康数据等与科研高度相关的数据均被列入保护范围。2025年1月,美国司法部发布具体规则;2025年4月,NIH发布“增强NIH受控访问数据的安全措施”实施更新(NOT-OD-5-083),明确“禁止位于受关注国家,即中国、俄罗斯、伊朗、朝鲜、古巴和委内瑞拉的机构访问NIH受控访问数据库及相关数据”。涉及包括基因型和表型数据库(Database of Genotypes and Phenotypes,dbGaP),基因组数据分析、可视化和信息学实验室空间(Analysis Visualization and Informatics Lab space,AnVIL),美国国家癌症研究所(National Cancer Institute,NCI)基因组数据共享中心等20个数据库的受控访问部分。

此外,以中国为主要目标的研究安全问题在美国也受到越来越多重视。2018年,美国司法部启动“中国行动计划”,旨在起诉与中国有关联、存在间谍行为的在美科学研究人员和学者,虽然多起案件因证据不足而撤销,该计划也于2022年中止,但是却给美国科技界,尤其是华裔科研人员及对华有合作的人员和机构等造成了持久的“寒蝉效应”。2021年,特朗普在卸任总统前一周发布“研究安全”国家安全总统备忘录(National Security Presidential Memorandum-33,NSPM-33),该备忘录在拜登任期延续并持续细化落地。2022年,美国通过《芯片与科学法》,其中包括要求在NSF设立研究安全官、启动研究安全研究计划等大量涉及研究安全的条款;2023年以来,OSTP先后发布“通用披露表格政策”“外国人才招聘计划”“研究安全计划”等指南,要求联邦政府各机构落实NSPM-33具体要求;NSF推出“使用保障措施和透明度的可信研究”框架,在量子领域科研项目立项评审中试点研究安全审查,启动“研究安全计划”,并投入6700万美元实施“保护美国研究生态系统的整个社区”项目等。这些政策和措施虽不与科研数据开放共享直接相关,但针对科研人员和科研项目的披露、培训、报告和审查等额外要求,以及其所引发的“寒蝉效应”已大大干扰了美国科研机构和科研人员开展国际科技合作的积极性,对美国国际科技合作及科研数据共享等带来了显著的负面影响。

二、美国联邦政府科研数据管理实践——以NSF为例

2.1 美国国家科学基金会数据管理与共享要求

NSF在2024年更新的“申请与立项政策程序指南”中,对其资助项目的数据管理与共享提出明确要求。在申请阶段,应提交不超过两页的“数据管理和共享计划”,作为申请书的一部分以供评审。DMSP需涵盖:数据类型,描述项目产生的主要数据、样本、实物收藏、软件和课程材料等;元数据标准,说明数据和元数据的格式与内容标准;访问与共享计划,数据开放的时间计划,包括保护隐私、保密、安全和知识产权等措施和计划;数据利用,明确数据复制、利用和扩散的计划;归档与保存,明确对数据、样本等的长期保存和归档计划,拟选取的保存平台;责任人等。

由于不同学科的特殊性,NSF各学部及部分学部的学科处,在总体要求下提出了关于数据管理与共享更细化的安排。据不完全统计,NSF下各学部及相关学科、领域处发布的数据管理计划指南至少有16个。例如,NSF地球科学学部地球科学处发布“EAR数据管理与共享计划指南”,对地球科学学科下资助项目数据管理所需遵循的原则、数据范围、长期存储要求、开放获取、涉及成本和最佳实践等进行细化,包括列出NSF支持形成的现有数据库资源清单,如北极数据中心、环境数据倡议、地球化学数据库、大陆科学钻井设施、国际大洋钻探计划核心储存库、NSF冰芯设施等,鼓励相关存储和共享能够令整个学科收益最大化。NSF规定,没有数据管理和共享计划的项目申请将不予受理。

项目执行和验收时,研究人员需在年度报告和最终报告中列出所有项目出版物成果及相关数据,并确保其公开可访问,数据集需附带相关标识码,确保可追溯性和可重用性。NSF管理人员将对数据管理计划实施情况进行评估,相关实施情况将影响研究人员后续NSF资助的申请。

2.2 美国国家科学基金会的开放获取要求

NSF制定并更新了其资助科研成果的开放获取规定《NSF开放获取计划2.0》(2025年1月31日起生效),明确提出:一是覆盖范围,包括所有同行评审出版物及科学数据,如期刊文章、书籍章节、编辑文章和经审查的会议论文等;二是存档要求,相关成果需立即存入NSF成果开放获取库,不可延迟,需采用机器可读格式,并附带持久标识符;三是数据要求,需提供详细元数据,包括研究人员姓名、机构、资助信息、出版日期及外国资助披露等;四是再用权,建议使用知识共享署名许可以明确重用权;五是文章处理费(Article Processing Charge,APC),将探索替代开放模式,减轻研究人员负担。

NSF成果开放获取库(par.nsf.gov)是面向公众开放的平台。截至2025年7月,已公开学术论文24.99万篇、会议论文8.16万篇、会议论文集3 872部、数据库3148个、软件97套。

2.3 美国国家科学基金会的研究安全政策

NSF按照《芯片与科学法》和联邦政府要求设立了研究安全战略与政策官及其办公室,由其管理NSF研究安全相关事务。2025年7月10日,NSF正式发布“研究安全政策更新(149号重要通知)”,明确6个方面的具体要求,包括:一是NSF在受理项目申请时可开展研究安全评估并要求申请人提供相关信息,二是申请项目负责人及主要参与者完成研究安全培训,三是涉孔子学院合作美国高等教育机构申请NSF项目的认证或申请豁免要求;四是恶意外国人才计划参与人禁止申请NSF项目,五是NSF项目申请参与人需声明未参与恶意外国人才计划,六是要求受NSF资助的研究机构每年提交涉外国财务收入的披露报告。因相关政策启动实施时间较短,尚未见对其实施效果和影响的分析与评价。

2.4 美国国家科学基金会国际合作项目的数据管理要求

对于涉及国际科技合作项目的数据管理,NSF并未制定单独的管理办法和流程要求,相关数据管理、开放获取均按照NSF统一的规定执行。经考察NSF近年合作项目相关指南,发现额外要求主要体现在以下两个方面:一是相关数据管理和分享需遵守合作国关于科研合作数据成果管理的具体要求;二是合作机构间需额外制订知识产权计划,提出准备知识产权协议的安排和时间计划,明确项目研究所产生的数据或其他知识产权的所有者,知识产权的经济利益分配方式,出版物署名方式及知识产权纠纷的解决方式等。NSF在指南中强调,合作中由NSF资助产生的科研成果、数据和材料需按照美国政府要求,不加限制地开放使用。

三、对中国科研数据管理的启示

美国政府科研数据管理政策经过80余年的发展演变,期间力推“开放共享”的美国科学界与侧重“国家安全”的美国安全情报界多次“角力”,引发美国国内多轮较大规模的研讨和辩论,使得不同时期美国科研数据管理政策的“指针”在开放与安全的平衡间数度震荡摇摆。目前,美国已确立“科学开放是基础、安全是必要、自由和诚信是关键”的科研数据管理理念,试图兼顾科学开放与国家安全,并建立了较为完备的三级政策规范与管理体系:一是联邦政府层面法律、通告、指引和数据平台;二是联邦各部门层面政策、规范要求及平台;三是学科和领域层面(如NSF学科处、NIH下属的研究所)具体细化规则和数据库平台等。

美国政府科研数据管理政策的发展演变历程和经验,可为中国科研数据管理的政策制定与发展实践提供借鉴。一方面,开放是科学的本质属性,在大数据、人工智能技术快速发展背景下,数据开放共享对引领科研范式变革具有重要意义,应认清“科学无国界、惠及全人类”是全球科技共同体的共同追求,加强中国科研数据管理的顶层设计和开放数据基础设施等能力建设,以“开放合作”“开放科学”对冲有关国家“科学安全化”“技术管制武器化”倾向,以倡导和践行“开放、公平、公正、非歧视”理念引领全球科技合作大方向。另一方面,应认清数据是与土地、劳动力、资本和技术并列的第五大生产要素,是孕育新质生产力发展的优质生产要素,更是支撑国家科技、经济、军事竞争力和国家安全的重要资源,应在总体国家安全观的框架下统筹好科研数据资源的开放共享与敏感战略性数据的安全保护,提升科研数据生命周期全过程的治理能力与水平。

作者:仲平

中国21世纪议程管理中心,北京 100038

来源:《全球科技经济瞭望》2025年8月第40卷第8期

文章观点不代表主办机构立场。

声明:本文来自科情智库,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。