作者

中国工商银行金融科技研究院区块链研究团队

为贯彻落实党的二十届三中全会决策部署,促进数据要素合规高效流通使用,加快构建以数据为关键要素的数字经济,国家数据局于2024年11月发布了《可信数据空间发展行动计划(2024—2028年)》(以下简称《行动计划》),明确以建设可信可管、互联互通、价值共创的数据空间为重点,分类施策推进企业、行业、城市、个人、跨境可信数据空间建设运营。响应上述要求,工商银行以国家可信数据空间发展战略和方案为指导,以构建一个安全、高效、开放、协同的数据生态体系为目标,构建工商银行数据空间体系,涵盖“私有、公共、共享、商用”四个主题,实现了工商银行集团内、工商银行与外部间的数据要素高效流通,在确保数据要素流通全过程“可信、可控、可证”的前提下,充分发挥数据要素价值,赋能业务高质量发展。

一、可信数据空间的内涵与发展

1.可信数据空间的概念

在国外,德国最早于2014年提出“工业数据空间行动”,之后随着欧洲数字化转型和欧洲数据市场的发展,逐步演化为国际数据空间(IDS)。在官方介绍中,数据空间是一个受保护的生态系统,具备去中心化和数据主权可控的特性,通过认证的参与者进入空间后可以将其数据进行共享并制定使用规则,同时由IDS连接器实现数据安全管控和多方互联。在此模式下,任何公司或企业主体只要安装部署了IDS连接器即可以实现互联互通,并共同组成一个数据流通利用的互联网络。

具体来说,IDS连接器可以安装在服务器、云、物联网设备或者智能手机上,作为数据与服务的网关为应用提供可信运行环境。可信运行环境内的数据将受到严密保护,有效防止未授权的访问和篡改,并且只能按照各参与方约定的方式进行使用。其间,数据供需双方可通过IDS连接器建立一条安全信道,数据及其使用和控制策略将由数据提供方侧的IDS连接器流转到数据使用方侧,并由数据使用方侧的IDS连接器实现数据受控使用,继续保障数据安全。

在国内,国家数据局发布《行动计划》,在国家层面首次针对可信数据空间这一新型数据基础设施进行了系统性的说明和规划布局。与IDS类似,可信数据空间是我国实现数据要素价值共创的应用生态,是支撑构建全国一体化数据市场的重要载体。可以说,我国的可信数据空间是在欧盟等国际先进实践的基础上,结合自身国情和发展实际需要,基于国内外最新技术发展进行完善和创新的科学形态。可信数据空间能力如图1所示。

图1 可信数据空间能力示意

根据《行动计划》,可信数据空间自下而上包括可信管控、资源交互、价值共创三大核心能力:一是通过接入认证、可信存证、使用控制、隐私计算、数据沙箱、智能合约等技术强化全流程数据使用信任管控,解决数据提供方共享意愿不足的问题;二是利用资源目录、数据标识、语义发现、元数据智能识别等技术为数据提供方和使用方建立互联互通机制,提升数据流通效率;三是借助高价值的应用场景以及数据价值评估模型,让数据开发利用过程的参与者获得相应收益,为参与方开发数据产品和服务创造条件,促进数据资源价值实现。通过以上三步,《行动计划》旨在深度赋能企业、行业、城市、个人、跨境五类可信数据空间建设和应用推广。

2.可信数据空间的技术需求

按照可信数据空间三大能力、九个方向的技术分类(如图2所示),IDS最大的改进是实现数据使用控制,填补了常规技术的缺失。相关研究显示,数据提供方在对外提供数据时,其最大的顾虑是数据被用于合同目的之外导致数据泄露和滥用,但传统约束措施则是以访问控制和日志审计为主,而由于数据易复制的特点,上述举措相当于未采取有效手段进行数据管控,这也是一直以来企业不愿且不敢对外提供数据的根本原因。针对上述问题,可信数据空间的履约机制与数据管控技术可视为是“从0到1”推进数据要素流通落地的突破关键,并成为当前业界讨论可信数据空间技术的焦点话题。

图2 可信数据空间技术特性

目前,履约机制与数据管控技术的发展主要包括两个方向:一是以隐私计算为代表的不交付原始数据但可以进行联合计算的密文计算方向,二是以IDS为代表的交付原始数据但受控使用的明文可控方向。基于上述两个方向的优势互补,可信数据空间将能够实现明文与密文的可控使用。

3.区块链在可信数据空间中的角色

首先,针对可信数据空间的目标和要求,区块链可作为底层交互基础设施支撑空间中的数据可信流转。当前,区块链作为一种具备多方共识、去中心化、不可篡改、可追溯等技术特性的交互基础设施,已成功支撑加密货币与NFT等数字资产的自主可控与可信流转,而数据资产与上述数字资产有很多相似之处。

其次,区块链的特性与可信数据空间的核心要求高度契合。例如,分布式数字身份能实现接入认证以及跨机构身份互认,智能合约能实现履约机制控制以及全过程存证溯源,分布式账本有利于公开透明的资源共享以及权属证明,对等共识网络能支持共建共治互联互通,跨链能实现不同类别的空间互联等。

最后,通过“区块链+”的方式,区块链很容易融合可信数据空间中提到的其他各类技术。以最核心的履约机制与数据管控技术为例,智能合约可编程强制执行的特性可很好地融合隐私计算以及使用控制技术,实现可信数据空间所需的明文、密文可控,达到平衡安全与使用的要求。

二、区块链赋能可信数据空间建设的方案设计

现阶段,以区块链作为底层交互基础设施赋能可信数据空间建设,一方面可依照可信数据空间三大核心能力的顺序逐步推进,重点实现可信管控;另一方面由于《行动计划》属于顶层设计,因此可参考国外IDS去中心化网络和连接器的设计,为资源交互和价值共创提供一个分布式的网络空间基础环境。区块链赋能可信数据空间建设方案如图3所示。

图3 区块链赋能可信数据空间建设方案

具体而言,一是可直接应用区块链已有能力(如分布式数字身份认证、可信存证等),实现接入核验审查和存证溯源;二是通过“区块链+”融合使用控制、隐私计算、数据目录、数据确权授权等技术和机制,实现履约机制与数据管控,以及数据发布发现、互操作、运营和权益保障等;三是将跨链、数字钱包、合约开发等面向数字资产场景的技术,改造优化为支持跨空间交互等面向数据资产场景的技术。通过以上三点,区块链将能够为可信数据空间提供一个成熟且易扩展的底层交互基础设施。

1.可信管控

《行动计划》指出,可信管控是指对空间内主体身份、数据资源、产品服务等开展可信认证,确保数据流通利用全过程的动态管控,提供实时存证和结果可追溯。对此,区块链作为可信数据空间多方交互的基础网络,结合硬件可信执行环境(TEE)能构造出一个与现有环境隔离且互联互通的安全空间。该空间整体结构与IDS类似,通过可信数字身份(DID)准入,集成包含数据使用控制(UCON)或多方安全计算(MPC)能力的数据智能合约,可对外提供可信(智能合约+TEE/DID)、可控(智能合约+UCON/MPC)、可证(存证溯源)等能力。

在接入核验审查方面,区块链支持基于公私钥的DID,可实现跨机构用户身份互认和包括机器在内的各类主体可信身份认证,从而为可信数据空间提供准入控制。

在履约机制与数据管控方面,针对交付原始数据的情况,区块链支持数据提供方和使用方共同开发智能合约,在合约中对数据使用方式进行编码控制,并限制数据只能通过智能合约进行使用和销毁,利用TEE对合约及密钥进行保护,避免数据泄露或合约逻辑被篡改,实现硬件级别的数据安全保护;针对不交付原始数据的情况,区块链通过在智能合约中集成双方信任的多方安全计算MPC算法组件,可对数据进行密态计算,也可以选择进一步利用TEE防止合约逻辑被篡改,实现数据可信联合计算。

在日志存证与溯源方面,智能合约作为数据在可信数据空间流转全生命周期的载体,可以直接对数据的各种操作进行存证溯源,并基于区块链的链式数据结构,有效防止非法篡改。

2.资源交互

《行动计划》指出,资源交互是指支持不同来源数据资源、产品和服务在可信数据空间的统一发布、高效查询和跨主体互认,实现跨空间的身份互认、资源共享和服务共用。对此,区块链作为支撑可信数据空间多方交互的基础网络,可借助分布式机制轻易完成信息共享,实现资源的快速发现与使用。

在空间互联互通能力方面,区块链可借助DID实现跨域身份互认,当把一个区块链网络作为一个数据空间时,跨数据空间的互联互通可以利用跨链技术进行优化实现,比如企业、行业、城市、个人、跨境可信数据空间之间的互联等。

在数据发布与发现能力方面,数据空间运营方和数据提供方可以联合制定数据目录并在链上公开,同时对源数据进行哈希标识,通过元数据说明与数据目录关联,从而使链上用户可在分布式账本上快速搜索自身需要的数据,以及找到合适的数据提供方。

在数据互操作能力方面,以NFT等数字资产为例,区块链已经证明了其具备实现资产流转的能力。鉴于此,数据资产也可使用类似方式,先通过哈希上链实现链下数据资产锚定,链上使用DID凭证进行授权,之后再以通证TOKEN的方式进行流转,并结合可信管控技术实现密文计算或明文可控进行数据共享融合和互操作。

3.价值共创

《行动计划》指出,价值共创是指支持多主体在可信数据空间规则约束下共同参与数据开发利用,推动数据资源向数据产品或服务转化,并保障参与各方的合法权益。针对该领域,区块链不仅具备多方共识、公开透明和共建共治的特性,且智能合约还具有可编程强制执行等特点,因此很容易从面向数字资产的流通场景过渡到面向数据的开发利用场景,并继续发挥区块链保障用户资产权益的能力。

在数据服务方接入能力方面,区块链可提供数字钱包作为用户的可信接入客户端,实现对数字身份和数字资产的主权管控,在此基础上,再结合面向数据流转的智能合约,即可作为可信数据空间连接器成为数据进出空间的网关。

在数据开发利用环境方面,区块链基于智能合约的可编程特性,能够灵活适配各类业务场景的应用需求,而通过把用数策略和用数逻辑集成在合约内,即可进一步将合约开发环境优化为面向数据开发利用的环境。

在运营规则和权益保障方面,区块链在数字资产领域已经证明了所有者对链上资产的所有权具备自主可控的权益保障能力,并可通过存证溯源为数据资产的权属证明提供确权,以及结合数字身份凭证实现数据授权。在此基础上,通过在智能合约内融合数据价值评估模型算法,即可根据合约强制执行的特点有效支撑数据市场化流通。

三、工商银行探索与实践

《行动计划》明确指出,可信数据空间是基于共识规则,联接多方主体,实现数据资源共享共用的数据流通利用基础设施。根据这一定义,工商银行通过对前沿技术开展创新研究,在实践中探索利用能够进行多方共识、联接多方主体的区块链技术实现数据资源共享共用的可行方案。通过“区块链+”协同融合隐私计算、数据使用控制等技术,重点解决数据流通中的权属不清、隐私泄露与滥用风险,为数据可信流通构建了基础支撑。

1.基于浦江数链的金融行业级数据授权链

为贯彻落实《上海市推进城市区块链数字基础设施体系工程实施方案(2023—2025年)》部署,推动区块链技术与数据流通、航运物流融合,工商银行上海市分行联合浦江数链公司于2024年启动基于浦江数链打造数据授权链的合作,以区块链技术创新打造行业级、地方性用数基础设施,支撑上海地区金融机构在开展普惠金融等金融业务过程中的合规用数需求。具体而言,数据授权链是为数据各方进行数据授权共享建立的联盟链,通过提供身份认证、场景资源查询、授权签署、授权核验及存证溯源等数据授权服务,支持数据主体主动授权金融机构从供数方机构获取特定数据内容用于特定应用场景,并可限制用数条件及用数时间范围。目前,该项目已成功入选中国人民银行上海总部的金融监管沙盒,其通过构建“主体自主授权、机构合规用数、监管穿透管理”的创新范式,旨在为上海国际金融中心数字化转型提供安全可控的基础设施支撑。数据授权链业务流程如图4所示。

图4 数据授权链业务流程

2.金融同业首个开放式数据交易平台

2023年,工商银行建设行业领先的数据交易平台,致力于为数据供应商、数据提供方、数据使用方等用户主体提供线上化、智能化,涵盖数据产品上架、交易等流程的一站式数据要素流通综合服务。该项目首期依托区块链防篡改特性,融合隐私计算技术,支持对交易记录、权属变更、计算过程等核心数据行为进行安全管控,并实现全流程可追溯,同时利用可信数字身份凭证进行数据授权和校验,实现对工商银行及外部机构数据流通的统筹管理,有效支撑了上层数据要素流通的应用生态建设。数据交易平台区块链交互流程如图5所示。

图5 数据交易平台区块链交互流程

除此之外,目前工商银行正加速推进可信数据空间建设,以智能合约为载体,将数据权益主体的数据使用控制意愿转化为可执行的智能合约条款,成功解决了数据可控的前置性问题,实现对数据资产使用时间、地点、主体、行为和客体等因素的有效管控,并将在总分行用数及行外催收、授信、营销等场景进行应用探索。

四、总结与展望

综上所述,区块链所具备的多方共识、去中心化、不可篡改、可追溯、权属保护等技术特性与可信数据空间的核心要求高度一致,且区块链智能合约可编程的特点使其容易与其他新技术进行融合,同时区块链本身已经构筑了一个互联互通的基础环境,因此以区块链作为底层交互基础设施可高效支撑上层可信数据空间应用建设。与传统模式相比,“区块链+隐私计算/使用控制”等技术能有效解决数据使用和安全的矛盾,更好地消除数据提供方在对外提供数据时对数据泄露和滥用的顾虑,使数据要素真正流得动、流得通,进而加速释放数据要素价值,推动企业数字化转型。

当前,可信数据空间尚处于发展初期,业界还缺乏成熟的商业技术产品,市场上不断涌现的各类技术方案在应用深度和广度上也有待进一步拓展。针对该领域,工商银行将持续进行新技术应用探索,并在依法合规、风险可控的前提下,积极参与企业、行业、城市、个人、跨境可信数据空间建设,与各类可信数据空间运营者合作建立基于数据的增信体系,创新符合数据要素发展特征的金融产品和服务,推动构建更加智能、安全、高效的数字经济新生态。

本文拟刊于《中国金融电脑》

声明:本文来自中国金融电脑,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。