ITIF报告：探索数据共享模式，推动数据效益最大化

10月2日，美国信息技术与创新基金会（The Information Technology and Innovation Foundation，简称“ITIF”）发布了《探索数据共享模式，推动数据效益最大化》（Exploring Data-sharing Models to Maximize Benefits from Data）的报告。该报告评估了六种常见的数据共享模式的优劣势，并且为政策制定者提供建议，从而帮助他们推动数据共享模式得到更多应用以在美国实现数据经济社会效益最大化。同时，本报告还为决策者提供了关于推行或者拓展某些模式的建议。

摘译 | 许艺凡/赛博研究院实习研究员

来源 | ITIF

1.数据共享伙伴关系

（Data-sharing Partnerships）

数据共享伙伴关系涉及诸如学术机构、研究组织、行业伙伴、个人消费者和政府机构等不同实体之间的合作努力，它们共享和交换数据以开展研究、合作开发新产品和加强循证决策。构建数据共享伙伴关系旨在利用各方的集体专业知识、资源和数据来解决复杂的问题，并产出有价值的见解。

然而，这种数据共享模式也存在着局限性。例如，当两个存在竞争关系的机构建立起数据共享伙伴关系时，往往会出现知识产权和竞争方面的问题。同样，此类合作可能涉及质量和标准各不相同的数据集。

本报告指出，决策者应当通过制定相关的合同范本（model contracts）来促进数据共享伙伴关系的构建。每当出现新的数据共享机会时，各组织往往不得不重起炉灶，通过新的合同和谈判过程构建数据共享伙伴关系，因此，决策者应通过制定各组织可采用和定制的合同模板（如数据类型、保留条款、知识产权等）来为各方减少这一阻碍，以促进更多的数据共享伙伴关系建成。

2.数据联盟

（Data Consortia）

数据联盟允许各方为其利益汇集数据。数据共享伙伴关系涉及双边协议，而数据联盟成员之间则需达成一系列互惠共享协议。这些联盟的成立旨在解决某个具体问题，同时也是为了能够广泛和持续地互通信息。例如，沿河的一些城镇可能会组成一个数据联盟，共享水中细菌的数据。

数据联盟有利于促进更多的数据共享和汇总。只有特定联盟的成员才能访问数据，而且联盟成员必须为组织贡献数据。最终，数据联盟将产生一个临界点效应，即加入联盟比退出联盟更有利。一旦达到临界点，数据联盟就能确保持续的数据共享，并推动构建起一个支持数据共享的世界。

本报告指出，决策者应积极调研、寻找建立跨部门数据联盟（cross-sector data consortia）的机会。联邦机构应将特定部门内现有的数据联盟编目，并积极为关键领域创建新的跨部门联盟。数据联盟可为决策者提供更广泛、更多样的数据来源，包括来自其他机构和私营部门的数据。例如，联邦紧急事务管理署等跨学科机构的决策者应建立联合体，将环境保护署、农业部、住房和城市发展部等机构以及私营部门组织的利益相关者聚集在一起，协调数据共享，确保更有效地防治自然灾害。

3.数据托管

（Data Trusts）

数据托管是一种数据治理框架，指个人和组织以实现商定为目的而对数据进行管理、保护和共享。尽管对数据托管的定义尚且存在争论，但这类数据共享机制仍然具备相同的特点。数据托管的核心是将数据权利委托给一个独立的中介机构（称为受托人），由其与研究人员、私营公司和公共部门机构共同做出有利于数据主体的数据共享决策。数据托管为管理和使用汇总数据提供了结构和规则，有助于释放数据的价值、维护公共利益。

然而，数据托管也面临着一些挑战。首先，鉴于托管机构所持有的数据往往具有敏感性，在数据共享方面缺乏社会信任可能会导致项目被搁置甚至取消。其次，数据托管需要大量的财政、技术和人力资源投入。最后，数据托管可能与以保障个人权利为重点的数据保护法（常见于许多西方国家）相抵触，因为数据托管的重点是集体赋权和集体利益，而在严格的数据隐私法背景下，这种集体模式可能难以实施。

本报告指出，决策者应实施针对具体部门的数据托管（sector-specific data trusts）。美国有一些特定领域，如医疗保健、交通、教育和环境研究，在这些领域建立特定部门的数据托管基金可以产生巨大的社会效益。同时，整合特定部门内的数据资产也有助于全面了解特定部门面临的挑战、趋势和机遇。

4.数据合作组织

（data cooperatives）

数据合作组织是一种自下而上的数据治理形式，个人自愿将其数据集中起来，与私营公司和其他实体进行集体谈判。数据合作组织的成员制定数据共享规则，旨在使团体中的成员受益。这些合作组织通常旨在将成员的集体数据货币化，并由数据共享协议产生的收入提供资金。数据合作组织与农业、住房和消费信贷合作组织类似，组织由其成员拥有和共同管理，成员共享收益。

数据合作组织所面临的一个挑战是，它所产生的经济效益并不总是有效。每个数据贡献者的价值可能相对较小，但如果没有众多数据持有者的广泛参与，合作效率就会变得低下。因此，数据合作组织必须谨慎选择对成员的补偿方式——补偿太少，就不会有足够的数据贡献者加入；补偿太多，又难以为继。

本报告指出，决策者应在非数据合作和集体谈判领域探索数据合作。当个人因担心第三方会利用其数据损害自身利益而不愿共享数据时，数据合作组织的作用便得以凸显，例如，小农户担心大型农业公司会利用他们的数据牟利。已经为各类非数据合作组织提供监督或支持的联邦机构，如美国农业部、全国信用社管理局和全国劳资关系委员会，应召集利益相关者，讨论数据合作组织在各自领域的潜在价值，以促进数据共享。

5.联合数据分析

（federated data analytics）

联合数据分析是一种在组织无法或不愿共享数据的情况下也能进行数据分析的方法。联合数据分析指的是一种分布式数据处理方法，即在不同的位置分析数据，并将最终的结果集中呈现出来，提供了一种获取大量数据的新方法。例如，生物医学研究和临床试验需要患者数据，这些数据通常由多个不同的医疗机构持有，并受到严格的隐私法约束。联合数据分析法可以在不泄露任何特定患者数据的情况下对数据集进行隐私保护分析，而且每个数据提供者都能保留控制权。

但与此同时，联合数据分析法在成本、可扩展性、利益相关者的抵制以及技术等层面上具有一定的局限性。作为一种新兴的数据共享技术，联合数据分析的计算成本较高。此外，联合数据分析法的大规模应用实例也很有限，尤其是在医疗保健等领域，这就造成了可扩展性方面的问题。联合数据分析法需要一个可扩展的平台，帮助其处理大量数据，同时还需要通过先进的应用编程接口（API）实现平台之间的协调。

本报告指出，决策者应继续致力于资助联合分析的研发工作（continue funding R&D for federated analytics）。从某种程度上说，联合数据分析是一种技术解决方案，可以解决在收集和使用数据方面存在的不信任或不同国家数据保护法之间存在的数据共享法律障碍等社会问题。因此，决策者应致力于资助该领域的研发工作，并明确哪些部门能够通过联合数据分析获取最大的效益。

6.合作研究与开发协议

（cooperative research and development agreements）

合作研究与开发协议（简称”CRADA“）是政府与私营部门之间的合作伙伴关系，指政府研究机构与私营部门合作伙伴共享数据，以促进研发项目的商业化。根据这些协议，政府向合作者提供人员、服务、设施、知识产权、设备、数据等，但不提供资金。合作伙伴可以是私营企业、非营利组织、大学，甚至州政府，他们提供同样的服务，但也可以为研发工作提供资金。CRADA允许私营部门合作伙伴申请专利并保留专利权，同时确保政府获得任何商业化产品的许可。

合作研究与开发协议具有诸多益处。首先，它不会增加政府的财政预算负担，而是通过利用现有的基础设施，促使政府和私营企业的合作更加高效和有效。此外，CRADA还能保护知识产权，并允许合作伙伴将解决方案货币化，这意味着它们具有内在的激励作用。同时，这些协议也有助于丰富政府、产业界和学术界现有的专业知识，从而提高国家的整体竞争力和创新力。

该模式具有高度针对性和合同性质，这意味着它们需要获得授权，并需要就与责任和知识产权相关的条款进行仔细谈判。例如，研究结果必须向公众公开，因此CRADA必须在一定时期内不公开研究成果，以便私人合作伙伴为商业用途的任何发明申请专利。虽然联邦研究机构都有权签署此类研究协议，但并非所有机构都有机会与机构开展此类合作，甚至并非所有机构都具有开展此类合作的意愿。

本报告指出，决策者应评估研究与发展可以从客户关系与合作协议安排中获益的领域（evaluate areas where R&D can benefit from CRADA arrangements）。许多政府机构已经在使用CRADA，其中该模式在物理和医学科学领域的应用尤为广泛。本报告认为政府机构应继续推广和授权使用CRADA，鉴于这类数据共享协议的诸多益处，有关政府部门应当明确哪些类型的研发目前能够从这类合作中获取最大效益，以及哪些机构应更好地利用CRADA。

本报告所做的分析以及所列举的实例表明，数据共享可以为企业、政府和个人创造巨大的社会和经济价值。实现数据共享意味着更多的人和组织可以访问海量数据并将其应用于生产的过程中，从而推动创新的发展；同时，数据共享也有利于促进更多数据驱动型决策的产生。

声明：本文来自赛博研究院，版权归作者所有。文章内容仅代表作者独立观点，不代表安全内参立场，转载目的在于传递更多信息。如有侵权，请联系 anquanneican@163.com。

ITIF报告：探索数据共享模式，推动数据效益最大化

面向数据要素流通的商用密码安全保障体系研究

国家数据局印发《关于推进行业高质量数据集建设行动的实施方案》

开源情报中数据过载问题的破解之道