摘要

传统的数据交易在合规性、数据权属、数据供给等方面存在挑战,为了破解传统数据交易的局限性,数据交易模式目前升级到密文计算方式,依托多方安全计算技术、区块链与智能合约技术,在不泄露原始信息前提下,对多方数据进行充分挖掘并保证整个使用过程中数据是安全可控的,实现数据交易“可用不可见、可控可计量”的全新交易范式。

关键发现

• 多方安全计算基于数据密文(计算因子)进行计算,并直接输出密文的计算结果,利用多方安全计算技术,可以实现“可用不可见”,以特定数据、特定算法下的密文计算,得到计算结果,实现特定“使用权”而非“持有权”的交易;

• 通过交易合约和可信存证,可以满足多方数据在密文计算方式下的数据使用控制需求,利用区块链与智能合约技术,对整个数据交易过程进行记录、审计,保证数据使用过程可控,并且确保存证不可篡改和可追溯。

分析师建议

• 新型数据交易所实质上不是作为交易数据本身的代理或通路,而是统筹数据资源、算法、模型和参数资源、算力资源,为交易的需求方提供数据服务的服务提供商;

• 基于多方安全计算和区块链融合技术,在数据流通过程中将数据承载的具体信息和计算价值分离,新型数据交易所可以实现数据使用价值的流通及全流程监管,保护隐私安全,突破场外交易,打破数据孤岛和数据垄断。

作者:沙丘社区分析师团队

01 数据交易市场现状

2019年10月,党的十九届四中全会首次将数据纳入生产要素,并将数据与土地、劳动力、资本、技术并列,作为新的生产要素,并且将数据要素市场化配置上升为国家战略。

数据要素化的前提是做到机器可读化和市场化流通。电子化、机器可读化是数据要素共享流通的基础,数据要素的使用方是计算机而并非是人,要让计算机可以读取数据、理解数据;市场化是数据要素发挥更大作用的必要建设,数据要素的市场化本质上是将数据流通给他方使用,利用市场供需关系评价贡献和决定报酬收益等。因此,数据交易是数据要素市场化流通中的一种重要形式。

数据交易在我国的发展经历了三个阶段:

第一阶段(2014-2016年):井喷期。从2014年大数据首次被写入政府报告后,全国各地建立了很多数据交易机构;

第二阶段(2017-2019年):冷静期。由于数据交易存在的各种问题逐渐暴露出来,数据交易未达到预期水平,这段时间数据交易进入冷静期;

第三阶段(2020年至今):重启期。2019年之后数据要素市场化配置逐步上升到国家战略,数据交易回暖,北京、上海、深圳等地均开始成立自己的交易所,以贵阳为代表的大数据交易所也焕发第二春。

当前,数据交易核心面临的挑战如下:

第一,合规性要求。人工智能、大数据等技术不断发展,数据需求量越来越大,近年来由于数据泄露、使用不可控,带来的安全影响受到世界各国的高度重视。在我国,《网络安全法》、《数据安全法》、《个人信息保护法》的相继出台,在保障网络安全、数据安全、隐私安全的基础上,进一步要求保证数据使用目的明确、合理,严格控制数据处理应当按授权约定的目的、方式与范围等执行。国务院《要素市场化配置综合改革试点总体方案》第二十条更是进一步提出探索“原始数据不出域、数据可用不可见”的交易范式,并且探索建立数据用途和用量控制制度,实现数据使用可控可计量。

第二,数据权属。数据的“权属”是制约数据交易的老问题,由于数据本身的特殊性,无法使用如“财产权”、“物权”等概念。在今年6月深改委通过的《关于构建数据基础制度更好发挥数据要素作用的意见》中,创新性提出“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”,为数据权属的确认提出新思路。为探索数据“持有权”改革,广东省佛山市于今年10月举行数据要素市场化配置全流程改革发布会,颁发全省首批《公共数据资产登记证书》,推动公共数据产品的入市交易。

第三,数据供给。随着人工智能、大数据等产业的发展,往往同一来源的数据无法完全满足应用需求,多个数据提供方的数据融合才是未来数据流通交易的趋势。数据交易所提供了一个数据从场外交易转向场内合规交易并实现跨行业、跨公司等多方数据融合的平台,同时方便国家对数据流通进行监管。为此,北京国际大数据交易所等打造了“隐私保护计算+合约交易”的新范式,以确保多源数据的安全融合计算,并通过打造数字金融、智慧医疗等行业数据专区,促进跨行业的数据要素应用;广州市海珠区也颁发了首批数据经纪人牌照,发挥南方电网、广州金控、唯品会等行业龙头企业优势,撮合多方数据融合应用,为数据交易提供中介。

传统的数据交易存在较多局限性,例如:

• 交易形式局限于数据集、数据包等,在交易的同时数据的持有权甚至所有权也可能发生转移;

• 没有有效的技术手段对数据使用进行控制,交易供需双方以及交易所之间必须建立完全的互信关系;

• 使用数据托管或者供需直接交付的方式,一方面,交易所承担的数据安全责任过高;另一方面,难以支持多方的数据融合;

• 监管机构需要同时对供方、需方、交易所进行监管,难度很大;

• 需要较为封闭的安全环境,难以利用第三方的算力、算法资源;

• 通过收集的数据资源变现,难以获得长期收益。

为了破解以上局限性,数据交易模式目前已经升级到3.0模式,以密文计算方式,在不泄露原始信息前提下,对多方数据进行充分挖掘并保证整个使用过程中数据是安全的。在数据服务模式下,可以支持多方数据融合,提供多样的数据服务产品,在第三方云计算与数据中心运算时也可以保证数据安全。

02 新型数据交易所关键技术

在新型数据交易所建设中,除了传统的大数据相关技术、数据安全与融合技术、传统系统安全技术等,多方安全计算技术、区块链与智能合约技术是实现3.0交易模式的必备技术。

1)多方安全计算技术

多方安全计算是我国姚期智院士于1982年首次提出并实现的,完全自主可控。该技术是基于数据密文(计算因子)进行计算,并直接输出密文的计算结果。其优势在于第一,灵活度高,可以通过多种密码学技术协议、算法等实现;第二,计算过程中无需信任硬件、软件或操作人员,使得多方数据在相互保密的前提下进行计算和融通交易。

一个简单的多方安全计算示例如下:

数据提供方A和数据提供方B使用秘密分享技术方案,数据供方、计算方和数据需方均可独立,其他方方均无法得知隐私数据,全过程保证隐私数据的安全,并且只有需方能获得最终计算结果。

当前,国家各个层面都对多方安全计算技术提供政策背书,包括国家发改委、工业和信息化部、中国人民银行等,同时,多方安全计算在国际和国内的标准化进程也在不断推进中。

利用多方安全计算技术,可以实现“可用不可见”,以特定数据、特定算法下的密文计算,得到计算结果,实现特定“使用权”而非“持有权”的交易。

但仅使用多方安全计算技术,不足以支撑新型数据交易,还需要更多的制度约束等,例如在数据“可用不可见”基础上还需探索建立用途用量控制制度,法律要求对数据使用进行约定、执行、存证、审计,算法审查也是监管的重点,对算法的安全性、可解释性、伦理、公开透明等方面的治理诉求不断提升。

2)区块链与智能合约技术

不同于1.0和2.0的数据流通模式下仅用一纸合同明确数据供需双方的权利义务即可,3.0模式下涉及多方数据,通过密文计算交易结果,牵扯多种角色,还会涉及算法审核等问题,仅签署一份合同难以满足3.0模式下的数据使用控制需求。

通过交易合约和可信存证可以满足3.0模式下的数据使用控制需求。交易合约由数据、算法、算力等信息组合而成,是一个可以体现数据用途和用量的服务契约;可信存证是对交易过程和加工计算结果进行不可篡改的记录。

为了实现交易合约和可信存证,可以使用区块链与智能合约技术,对整个数据交易过程进行记录、审计,保证数据使用过程可控,并且确保数据不可篡改和可追溯:

• 利用区块链技术,可以实现责任共担、分散风险,并保证数据使用透明,合约、存证不可篡改、可追溯;

• 利用智能合约技术,实现交易合约条款机器可读、可自动执行,并利用电子签名确认合约的有效和不可否认。

通过交易合约,可以对数据交易的整个过程进行数据使用的控制:

• 事前:通过各方的合约生成进行电子签名签署,共同确认合约内容和即将执行的交易程序;

• 事中:计算机直接读取合约条款,控制数据的加工计算、交付等进程,出现问题时可以及时终止数据交易行为;

• 事后:通过合约验证计算结果,验证计算过程是否符合合约、计算结果是否符合需方要求,并且对整个数据流通交易过程进行安全审计。

03 新型数据交易所的建设思考

从商业视角上看,新型数据交易所在数据资源、商业模式和交易参与方之间的关系上,最大程度的解决了传统数据交易所无法有效解决的问题,如数据组织形式和互信机制等问题。

在技术、监管和市场挑战等方面,新型数据交易模式更符合当前社会数据要素化的需求,从传统的数据集API方式转变为基于多方安全计算和区块链融合技术的方式,实现全流程监管,保护隐私安全,保证交易所技术自主可控要求,突破场外交易,打破数据孤岛和数据垄断,最终体现到流通和安全的层面上,将具体信息和计算价值分离。

新型数据交易所实质上不是作为交易数据本身的代理或通路,而是统筹数据资源、算法、模型和参数资源、算力资源,为交易的需求方提供数据服务的服务提供商。各方交易的是数据定性定量的使用价值,可以推动数据要素化的安全融通,通过多方安全计算和区块链技术的结合,实现数据交易“可用不可见、可控可计量”的全新交易范式,建设多方密文数据融合计算的数据交易所3.0。

关于新型数据交易所建设的几点建议如下:

1)通用灵活

交易所平台建设应该是灵活通用的,可以支撑多角色、多主体、多资源,可以灵活扩展、灵活部署,除了提供交易服务外,还可以提供合约服务、加工服务、算力资源服务等,扩展交易所的业务范围。

2)合约交易

从交易供方数据资源登记,交易平台方审核发布、登记上架,合约创建,合约审核,合约执行,一直到计算结果到达交易需方,整个交易过程应该基于交易合约进行管控。

3)全流程存证

在进行数据监管,选择贯穿于数据交易过程的关键节点进行上链存证,包括应用场景目录、数据目录、交易合约、合约审批记录、计算结果、交易记录、交易订单结算、交易结果等,实现交易从头到尾全程留痕,出现问题时交易所可以举证,监管方可以通过调用区块链对交易进行审查。

4)权责明细、监管友好

新型交易所平台在传统明文流通的基础上,应该增加密文计算合约流通,实现数据使用价值的流通,将原数据转化为可以体现使用价值的数据资产。在建设时,交易所应选取对监管更友好的架构,例如代理计算模式,监管方只需对交易所的数据加工处理过程进行监管,就可以完全了解到整个数据的使用过程,方便对数据的全流程监管。

关于新型数据交易所运营管理的几点建议如下:

1)交易模式

交易模式上应为供需双方提供更多元的服务,例如对交易供方提供上线、发布、匹配、建模等服务,对交易需方提供订阅、下单、求购等服务。在交易对象品种上,除了传统的数据集形式,还可以提供数据产品及其应用、数字化资产、数据处理服务等。对于低敏感数据,可以采用常规数据交易方式,对于高敏感、高价值数据,则可以采用密文计算交易方式,仅交易数据定制化的服务结果。

2)生态建设

交易所应分层次建设生态网络。首先,建立交易所数据交易网络,汇聚吸引更多数据交易联盟成员加入建立数据生态;其次,基于数据流通网络,吸引地方产业客户加入数据交易所;之后,与其他地区数据交易所建立合作,不断扩展数据生态网络。从而,让更多的数据提供方加入,融合更多的行业数据,并确保各方的利益。

案例来源:沙丘社区《沙丘大会》隐私计算专场

分享专家:靳晨,华控清交技术标准化专家

关于我们

沙丘社区是一家数字化研究与知识服务机构,为客户提供客观、可执行的数字化研究与市场洞察,致力于帮企业做更好的技术决策。

沙丘社区长期聚焦于数字化市场,并提供研究报告、会议活动与定制化咨询服务,协助企业业务部门、IT部门解决数字化市场研究与产品选型需求,平台注册用户与粉丝量已超10万+,覆盖超80%的财富中国500强企业、5000+企业CXO与部门负责人。

声明:本文来自沙丘社区,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。