文 | 中国信息通信研究院云计算与大数据研究所 吕艾临 白玉真 杨靖世 贾轩

近年来,伴随着国家层面相关文件的政策引导和产业内数据流通利用的实际需求不断得到强化,可信数据空间作为一种数据流通利用设施方案受到广泛关注,全国各地区、各行业积极参与探索实践。当前,可信数据空间领域仍处于发展初期,行业各方对其核心概念的理解存在一定差异,相关建设方案在快速涌现的同时,整体质量仍有提升空间。部分试点项目在技术路径选择、运营管理规范及数据权属规则等方面存在探索性差异,客观上影响了数据流通效率与价值挖掘效果。未来需要通过加强系统性规划与标准规范建设,逐步构建更加协同的发展环境。

一、可信数据空间的概念内涵

2024年11月,国家数据局印发《可信数据空间发展行动计划(2024—2028年)》(以下简称《行动计划》),提出“可信数据空间是基于共识规则,联接多方主体,实现数据资源共享共用的一种数据流通利用基础设施,是数据要素价值共创的应用生态,是支撑构建全国一体化数据市场的重要载体”,旨在引导和支持可信数据空间发展,促进数据要素合规高效流通使用,支撑构建全国一体化数据市场,引起了业界对于可信数据空间的广泛关注。

(一)概念溯源

可信数据空间的概念最早可追溯至2005年,美国计算机科学家迈克尔·富兰克林等人从数据共存的角度提出数据空间(Data Space),认为“数据空间是一种数据共存而非简单的数据集成,以增量的、即付即用的方式融合异构异质数据资源”。而后,随着全球科技革命和产业变革的不断深入,数据安全流通的需求不断加强,数据空间的概念也不断演化发展。

2011年,在德国工业4.0战略背景下,弗劳恩霍夫协会牵头提出工业数据空间(Industrial Data Space,IDS)的建设构想。这一构想在2018年升级为国际数据空间(International Data Spaces,IDS),强调以数据主权为核心理念,关注保障数据所有者对数据主权的控制。随后,许多国家和地区着手探索新型数据流通利用机制。例如,印度科学院面向城市生活各方面开发了互联数据空间的生态系统,涵盖公共交通、火情救急、垃圾处理等场景。由此,数据空间形成德国起源、欧盟推广、全球探索的发展态势。

在我国,数据空间最初基于工业互联网的发展需求被引入。2022年初,参考借鉴IDS,中国信息通信研究院提出面向工业建立数据可信、安全共享和流通的新型基础设施,即可信工业数据空间。而后,随着数据要素市场化配置改革不断深入推进,数据可信流通不断成为各行业的广泛需求,国家层面提出以可信数据空间为抓手,大力推动数据要素的合规高效流通利用。

(二)核心特征

可信数据空间通过构建可信管控、资源交互、价值共创三大核心能力,为数据流通各方提供流通全过程的控制、管理、计量等共性技术服务,为数据的生成、流通、共享和使用提供安全可信环境。

可信管控能力是空间建设基础能力。一是对空间参与主体、接入数据资源、预集成应用服务进行管控。二是对数据全生命周期,重点对数据跨主体的流通范围、使用过程、使用方式等行为进行管控,并借助隐私计算、使用控制、区块链等技术执行履约机制,增强各主体之间的信任关系。

资源交互能力是空间互通的关键能力。一方面,通过数据目录和数据标识、语义转换等资源互通技术,构建数据资源的供需对接能力。另一方面,对不同空间的应用服务进行标准和协议转换对接,实现跨空间数据、身份、应用服务的共享和相认,提高数据流通的便利性和效率。

价值共创能力是空间发展的持续动力。通过建立流程机制、共性技术服务能力和市场规则,面向各类参与主体提供数据价值共创的环境。由此积极保障可信数据空间中各参与方的合法权益,创新数据流通新模式,构建数据流通新生态。

(三)概念辨析

自数据空间的概念提出以来,分析其与数据技术领域内其他名词之间的区别与联系成为业界认识和理解这一概念的必要环节。从实践情况来看,数据中台和数据交易平台是与数据空间关联度最为密切的两个概念。

具体来看,数据中台是企业内部的数据管理与服务平台,主要面向企业内部业务场景,旨在整合企业内部数据资源,提供统一的数据存储、处理与分析服务,提高企业内部运营效率,而可信数据空间则是面向跨组织、跨行业的数据流通场景;数据交易平台主要聚焦于数据的交易环节,以数据买卖为核心业务,旨在提供一个交易场所,而可信数据空间则不仅仅关注数据交易,更注重数据在全生命周期内的流通与利用,包括数据共享、协作分析、联合建模等多种场景,是一个更具综合性的数据流通利用基础设施。因此,三者并非替代关系,而是共同构成数字经济时代的基础支撑体系,数据中台可作为数据空间接入高质量数据源的提供端,而数据交易平台则可以作为数据空间的一个应用场景,结合可信数据空间的共识规则体系的运行,最终形成“内部治理-市场交易-生态协同”的多层次数据流通格局。

二、可信数据空间实践进展

为进一步打破数据应用壁垒,全球数据空间建设提速。《全球数字经济发展研究报告(2024年)》指出,国外数据空间建设加快、成熟度提升。欧洲形成160个数据空间实例,较2023年同比增长60%。同时,我国多元建设路径与技术路线展现创新潜力,加速推动行业空间、公共空间、城市空间等建设,助力打通不同领域数字化转型数据堵点。

(一)国外实践进展

建设行业数据空间已成为许多国家和地区推动数据流通利用的共性做法。《欧洲文化遗产公共数据空间》等行业数据空间政策的出台,为数据空间建设营造了良好的制度环境。在此基础上,欧盟委员会于2025年3月发布《数字欧洲计划(2025—2027年)工作方案》,投入32亿欧元专项资金,重点支持人工智能、高性能计算等战略领域。该计划通过“人工智能工厂”建设、数据空间整合及跨国协同机制,构建欧洲人工智能技术主权。从建设成熟度来看,移动、物流、汽车、制造业/工业、能源等行业数据空间较为成熟,欧盟的移动数据空间、绿色协议数据空间均具有集成性数据生命周期管理特征。

欧洲行业可信数据空间主要有三种建设模式。一是龙头企业主导建设模式,解决供应链的数据孤岛问题。例如,宝马、奔驰、西门子等欧洲汽车企业共建汽车数据空间项目Catena-X,通过汽车行业数据共享实现制造商和供应商之间紧密协作,优化供应链管理,提高生产效率和产品质量,目前已接入超过1000家企业。二是产业组织牵头,联合行业企业共建模式,解决行业内数据流通不畅问题。例如,欧洲工业协会推动的制造业数据空间项目Manufacturing-X,得到了欧洲多个国家和众多制造业公司的支持,致力于解决制造业中的数据分散问题,通过数据的集成和分析,帮助制造商优化生产过程。三是政府指导建设模式,解决政府、企业多方数据共享难问题。例如,德国能源署发起的能源数据空间项目Dena-ENDA,通过推动能源企业、工业企业、政府等多方的能源数据共享,预测和管理分布式运营商电网中的能源生产和消费,促进德国能源系统灵活高效运行。

(二)国内实践进展

在《行动计划》明确建设方向、进一步凝聚共识后,全国多地可信数据空间建设加速推进,以城市可信数据空间和行业可信数据空间居多。据不完全统计,已有20个省份开展了可信数据空间建设实践,整体呈现出积极推进的态势。

在政策支持方面,江苏、福建分别出台《江苏省推进可信数据空间发展工作方案》《福建省加快推进数字化全面赋能经济社会高质量发展总体方案》,为可信数据空间建设营造有利的政策环境。在落地场景方面,北京、黑龙江、浙江、山东、湖北、广东等地依托具体行业积极谋划和推进可信数据空间建设,以解决数据碎片化、开放权责不清等问题。例如,广州城市可信数据空间首批涵盖绿色低碳、医疗健康、交通运输等12个产业专区,覆盖37个高价值场景,全面覆盖城市精细治理和产城融合发展的主要方面,为数据驱动城市发展提供了丰富的应用场景和实践路径。温州发布了营销数据空间、医疗健康数据空间、包装产业数据空间和鞋革产业数据空间等四个空间。南方电网建立的南方能源行业可信数据空间上线试运行,已完成了16个场景上线和业务验证工作,后续将逐步推进33个场景的建设。服务平台方面,哈尔滨启动城市可信公共数据空间支撑服务平台项目,主要解决政务数据整合不足、跨平台共享难及安全可信流通问题。从落地场景来看,各地所依托的行业多与医疗和汽车产业链相关。一方面是医疗和汽车相关产业全链条深度依赖数据,数据流通共享市场空间大,另一方面是医疗和汽车产业链条辐射范围极广,凸显产业影响力与渗透力,商业价值高。从建设模式来看,城市数据空间普遍以公共数据供给为牵引,授权运营为机制,带动企业数据、个人数据的融合应用,为数据开发利用提供安全可信环境,赋能城市治理与公共服务优化等方面。行业数据空间多是行业龙头企业牵头建设,通过数据融合利用解决行业共性问题、创造行业共性价值,并通过与其他行业数据空间互联互通,丰富场景应用,创新商业模式。此外,在创新应用方面,部分空间与大模型应用、高质量数据集进行紧密结合。

三、可信数据空间的技术实现

为实现数据“可控可计量、可溯可追责”的流通目标,需从技术架构、核心能力及安全保障三个维度构建完整体系。

(一)技术架构

可信数据空间作为一类数据流通利用基础设施,技术架构方面强调通过服务平台和接入连接器实现数据的可信管控、资源交互和价值共创。服务平台为参与方提供数据发现、申请使用、合约签订等数据流通利用基础服务,企业间交易数据通过连接器进行交付和使用,两者通过标准化接口进行协同联动。

从技术组件来看,可信数据空间服务平台和接入连接器共同支撑实现数据可信流通利用。服务平台是空间运营方管理生态内身份、目录、服务、存证等各类要素的中枢节点,承载数据产品目录、服务目录,提供各类要素的注册、核验、发现服务,具备逻辑空间管理、数字合约管理等功能。接入连接器作为独立的软硬件系统,是可信数据空间生态内各参与方对接外部的窗口,数据提供方的业务系统主要与己方连接器进行数据对接,保障业务系统的安全,交付过程由连接器按合约内容进行核验、判断和执行,保证数据仅按约定方式使用。

从交互关系分析,服务平台与接入连接器之间通过标准化接口进行身份、数据目录、合约、日志等类型数据的交互。服务平台面向接入连接器提供主体身份的注册、认证和更新接口,数据提供方、服务方通过接入连接器将本地的数据产品、应用服务发布至服务平台,服务平台提供全局数据产品的集中发现与申请服务,由数据使用方发起数据申请,提供方和使用方通过连接器进行合约的协商、确认与交付执行,交付过程由连接器记录使用行为和异常信息,并将合约信息、使用情况、连接器状态等信息上报服务平台进行存证。

(二)关键技术

可信数据空间以实现数据可控流通为核心,其数据管控和资源互通能力依赖于多项技术的协同应用,数字合约、数据使用控制、数据沙箱与隐私计算共同构成数据可信流通的技术基石。

数字合约作为可信数据空间内多方协作的“规则引擎”,通过形式化、可验证的技术手段,将数据被使用的对象、方式、时间等限制条件转化为结构化的描述语言,同时在功能层面保证合约不可篡改和执行结果自动验证。应用数字合约不仅可为后续各参与方的数据交付、使用管控和审计提供操作基础,标准化的数字合约模板也将实现数据在异构连接器间的互通与使用。数据使用控制用于确保数据按数字合约内容执行,核心技术包括策略引擎、行为监测、行为决策、动态权限控制等,能够实现数据在交付、应用、转发、销毁等各环节对用户、时间、地点、设备、算法等多维属性的管控,支持根据数据使用的实时上下文环境自动做出允许或拒绝等响应。数据沙箱是提升数据使用安全性与灵活性的重要手段,本质上是基于虚拟化或容器化技术构建一个内外部环境隔离、各任务隔离的运行环境,同时可结合硬件虚拟化技术进一步增强安全性。在可信数据空间中,数据使用方在一般数据沙箱环境内利用提供方数据,数据沙箱通过隔离进程、限制资源和管控输入输出来防止数据在分析、计算、建模过程中被非法下载或窃取。隐私计算是多方数据联合计算时实现“数据不出域”“可用不可见”的一类技术集合,基于多方安全计算的隐匿查询和隐私集合求交可实现多方数据的分析与验证,基于联邦学习可实现参与方仅交换模型参数方式的模型构建。可信数据空间通过集成隐私计算,为高敏感、高价值数据的流通提供了安全保障。

(三)安全保障

安全保障体系是支撑数据可信流通的基础,涉及平台运行、系统交互和合约执行等方面。安全保障体系应覆盖环境、存储、交互、应用、合约等多维度,充分考虑来自内外部的攻击风险,同时应实施数据分类分级管控,按重要性、敏感性等维度,针对性施加差异化使用控制策略和交付方式,实现安全与效率平衡。

在环境安全方面,连接器通过应用数据沙箱、虚拟化安全技术为各参与方的运行环境构建安全边界,确保即使在多用户、多任务并发运行场景下,各数据与任务互不干扰。在存储安全方面,针对服务平台存储的日志、合约等敏感信息,应通过加密存储、访问管控、完整性校验、行为监控等手段,防止数据被非法读取、篡改或盗用。在交互安全方面,连接器等各组件间的通信应进行身份认证和数据加密,具备防攻击、流量监控等措施,避免身份伪造、资源耗尽和恶意内容发送。在应用安全方面,服务平台应对接入可信数据空间的工具和应用程序进行全面的功能性和安全审查,在部署过程进行版本确认,更新升级过程持续进行安全验证。在合约安全方面,数字合约作为明确数据如何被使用的方式,应确保其在生成、备案、传输过程的安全性和完整性,并具备对合约终止、变更、撤销等操作的身份认证和操作确认,保障合约全过程的可信。

四、可信数据空间的建设路径

综合可信数据空间的概念、核心特征与实践案例来看,建设可信数据空间的核心要素可以总结为通过一套支撑的技术方案和一套共识的规则体系,解决数据跨主体流通的信任和互操作问题。具体的建设路径应包含明确规划定位、盘点建设基础、打造核心能力、持续运营生态四大环节。

(一)明确规划定位

《行动计划》提出了企业、行业、城市、个人和跨境共五类可信数据空间,不同类型的数据空间服务于不同的需求场景,各有侧重。例如,企业可信数据空间,强调龙头企业协同和带动供应链上下游企业开放共享数据资源,以一个核心企业的业务需求为出发点进行数据流通利用;而行业可信数据空间则聚焦于解决行业内的共性问题。因此,对于建设运营者来说,需要首先结合国家和行业政策导向、企业发展需求与自身定位,明确数据空间的建设定位、目标和范围。

(二)盘点建设基础

明确建设定位后,需对规划纳入数据空间的参与主体、涉及的数据资源、承载数据资源的系统平台、潜在的应用场景及对应的业务逻辑进行摸底盘点,识别并筛选出可信数据空间内的主要参与方及其角色定位、重点对接的平台或系统,以及数据基础条件(如数据分布、数据标准化程度、数据质量等因素)较好的潜在应用场景,确保应用场景牵引的可信数据空间具有明确的业务价值和可操作性。

(三)打造核心能力

在落地建设的核心环节,应聚焦可信数据空间的业务流程、技术平台、规则体系三方面进行能力建设。一是梳理可信数据空间运转的业务流程,明确数据提供方、使用方、服务方、运营方、监管方等各类参与主体基于数据空间实现协同的具体过程,以此为技术平台和规则体系的建设提供依据。二是基于业务流程和应用需求进行技术架构设计,搭建可信数据空间的管理服务平台和接入连接器,遵循相关标准合理设计和安排使用控制、隐私计算、区块链、语义互操作等核心功能模块,并确保技术平台具有良好的兼容性与可升级性。三是遵循业务流程设计搭建规则体系,参考现有法律、法规和标准,从数据规则、技术规则、行为规则、业务规则、安全规则五方面为可信数据空间运行建立清晰的规范指引,在规则制定过程中,应充分争取各参与方的共识,保障规则的公平性、合理性与可落地性。

(四)持续运营生态

生态运营是在初步完成可信数据空间建设后的持续性长期工作,如何持续吸引主体参与,打造活跃的数据共享共用生态是可信数据空间有效发挥作用的关键。可以通过建立面向数据提供方的评价反馈和激励机制、面向所有参与主体的数据应用共创机制、主动引入行业监管部门共建数据安全合规联合监督机制等,为各类参与主体提供数据应用价值共创的合作平台,建立完整的数据服务链条,营造公平透明的互信环境,赋能可信数据空间高质量发展。

五、思考与展望

随着国家政策的发布,可信数据空间的内涵及发展目标已明确,将与其他数据流通利用基础设施协同支撑全国一体化数据市场建设。需要注意的是,当前可信数据空间尚处于起步阶段,从国内实践视角观察,具备可推广复制性的成熟建设经验仍有待积累,未来需在持续应对挑战的过程中稳步推进。

具体而言,当前推进可信数据空间建设需突破以下三方面关键问题。一是标准规范体系不完善,全国数据标准化技术委员会(TC609)已发布《可信数据空间 技术架构》技术文件,但是针对可信数据空间的参与主体权责划分、运营机制、规则体系、安全合规要求等内容的标准规范仍需加速构建,为产业落地提供指引。二是建设部署缺乏统筹规划,当前各地区、各行业和各龙头企业均积极探索可信数据空间建设,但普遍集中于医疗、交通等少数领域的行业空间,不同空间内覆盖的参与主体和数据资源交叉重复。三是数据流通利用的法律法规不健全,数据流通的信任体系未有效建立,影响各类参与主体的建立互信,进而降低对可信数据空间的参与热情。

针对上述挑战,可从标准规范、统筹规划、法规保障三方面构建系统性应对策略。一是要加快标准规范建设,坚持问题导向、急用先行原则,加快构建可信数据空间标准体系,除技术标准外,还应覆盖数据标准等内容。同时,应积极参与国际标准制定,提升我国在全球数据空间领域的话语权。二是要加强统筹引导,合理规划不同行业、不同区域的可信数据空间建设范围和路径,避免产生大规模的重复建设。三是建立容错纠错机制,以尽职免责的方式鼓励各相关方积极参与可信数据空间建设探索,并从备案准入、内部管理、安全合规、评估评价等方面出台配套规则,引导数据空间有序运营。

(本文刊登于《中国信息安全》杂志2025年第5期)

声明:本文来自中国信息安全,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。