文 | 上海市大数据中心 梁满
随着大数据与人工智能技术的突破性发展,数据已成为驱动我国数字经济发展的新型核心生产要素。公共数据因其具有权威性、系统性和稀缺性等特征,在促进产业升级、提高公共服务水平、优化营商环境、激发市场活力等诸多领域展现出巨大潜力。当前,我国公共数据开发利用正处于蓬勃发展的关键阶段,国家层面持续加强顶层设计与规划,各地也积极开展实践探索。然而,公共数据的开发利用仍面临体制性障碍、高价值数据供给不足、资源分布分散等挑战,其根本矛盾则聚焦于数据流通利用与隐私安全保护之间的平衡难题。
为有效破解这一难题,切实贯彻国家“原始数据不出域、数据可用不可见”的政策要求,上海着力构建城市可信数据空间(TDS)。以制度创新引领技术创新。该可信数据空间通过整合分散的数据资源、建立标准化流通框架,旨在为数据要素安全高效流通提供基础设施。在此过程中,隐私计算(PPC)技术作为实现数据“可用不可见”的核心底层技术,在可信数据空间的构建与应用中发挥着至关重要的作用。借助隐私计算技术,能够在保障数据隐私和安全的前提下,实现跨域数据的深度融合分析与价值挖掘,有力推动公共数据要素由“存量”向“增量”价值转化,全面赋能数字经济高质量发展。因此,研究隐私计算技术在上海城市可信数据空间中的应用模式,剖析其伴生的安全风险,并据此构建适配的安全监管体系,已成为保障数据要素市场健康发展的关键课题。上海在这一领域的政策与实践协同推进,形成了具有示范意义的“上海方案”,为我国公共数据的安全、高效、合规开发利用提供经验与借鉴。
一、政策驱动下可信数据空间的构建与数据流通创新机制
2024年10月,中共中央办公厅、国务院办公厅发布了《加快公共数据资源开发利用的意见》,明确提出了促进公共数据合规高效流通使用,提高公共数据资源开发利用水平,同时要求将安全贯穿公共数据资源开发利用全过程。2025年1月,国家发展改革委等六部门联合印发了《关于完善数据流通安全治理 更好促进数据要素市场化价值化的实施方案》,进一步明确了对于重要数据,要在保护国家安全、个人隐私和公共安全的前提下,鼓励通过“原始数据不出域、数据可用不可见、数据可控可计量”等方式,依法依规实现数据价值开发。2025年3月,上海市政府发布的关于《上海市公共数据资源授权运营管理办法(征求意见稿)》,明确了借助区块链、隐私计算、可信数据空间等数字技术,打造全市统一的数据基础设施。这些国家和地区层面的规范性文件的出台和发布,为公共数据开发利用的可持续发展提供了坚实的政策层面的保障,标志着我国公共数据开发利用进入全新的历史阶段。
当前,上海公共数据的开发利用已经取得了显著的成绩,但仍然存在一些问题。一是存在体制性障碍和机制性梗阻,导致开发利用的深度和广度不够。二是经济价值和社会价值高、敏感度高、市场主体需求高的“三高”公共数据的开发利用,还远远不能满足数据要素市场的需要。三是分散的数据资源、复杂的开发环境、受限的数据产品和服务推广等都严重制约了上海公共数据要素价值的进一步释放。针对上述问题,上海着力构建了城市可信数据空间,这不仅仅是为了解决公共数据开发利用的问题,更是上海城市数据资源高效合规开发利用的关键载体,是实现城市数据战略的核心要素。通过有序整合分散在各领域的数据资源,可以为上海城市规划、建设、管理和服务等提供有力支撑。
上海城市可信数据空间以“统一基础设施、统一能力服务、统一流动规程”为核心理念,开创可信数据流通创新模式。基于上海市全域数据基础设施体系,以存储资源、计算资源、区块链技术等核心能力为支撑,聚焦公共数据授权运营、开放共享、隐私计算等关键领域,构建起标准化、全流程的数据流通服务框架。通过整合多方技术优势与制度保障,为数据要素市场化配置提供全周期解决方案,全面赋能上海数字经济高质量发展。
二、可信数据空间应用隐私计算的机制
2024年11月,国家数据局正式发布的《可信数据空间发展行动计划(2024—2028年)》中明确定义隐私计算是一种可信管控技术,即允许在不泄露原始数据的前提下进行数据的分析和计算,旨在保障数据在流转全过程各个环节的“可用不可见”。同时,还明确提到了利用隐私计算等技术提升可信数据空间信任管控能力。由此可见,可信数据空间与隐私计算是互补且协同的关系,两者共同服务于数据安全流通与价值释放的目标。可信数据空间解决“谁能在什么条件下使用数据”的问题,而隐私计算解决“如何安全地使用数据”的问题。因此,隐私计算是可信数据空间的“技术基石”,提供核心安全能力,而可信数据空间是隐私计算的“落地载体”,提供治理框架与协作生态。隐私计算不仅是信任管控的技术锚点,也是技术攻关的核心战场,没有隐私计算的合理应用,就无法构建真正的可信数据空间。只有将两者结合,才能实现从数据孤岛到安全互联的跨越,释放数据要素价值。
如何在可信数据空间中应用隐私计算来提升信任管控能力一直是上海着力解决的重要问题。2024年11月,上海市市场监督管理局发布了上海市地方标准《基于隐私计算技术的公共数据开发利用管理规范》(DB31/T 1524—2024)(以下简称《规范》),明确提出了基于隐私计算技术实施的公共数据开发利用,是指在符合法律法规要求的需求场景中,在授权范围内,由七个主要参与方(即“七方模型”)依托上海市公共数据开发利用隐私计算平台,实现多方相互监督下的数据融合应用,并满足“原始数据不出域、数据可用不可见”要求的创新应用模式。
《规范》提出的七个主要参与方包括:一是数据需求方,是对公共数据有需求的参与方。二是开发利用方,是对公共数据开发利用,并提供数据服务的参与方。三是公共数据管理方,是对平台运营过程进行监督管理的参与方。四是数据提供方,是提供公共数据的参与方。五是平台运营方,是对平台进行建设、运营及运维的参与方。六是第三方监管机构,是对开发利用过程进行监督、审查和审计等的参与方。七是第三方评估机构,是在开发利用过程中提供价值评估、风险评估等服务的参与方。
《规范》在“七方模型”的基础上,进一步明确规定了应用隐私计算开展公共数据开发利用的实施流程(如图1所示),以及各参与方在公共数据开发利用过程中的运营和技术保障要求,适用于上海市基于隐私计算技术开展公共数据开发利用的管理工作,因此构建了在上海城市可信数据空间中应用隐私计算的机制。
图 上海公共数据开发利用隐私计算技术应用实施流程
三、可信数据空间应用隐私计算的实践
上海作为中国数字化转型的前沿阵地,一直将城市可信数据空间建设视为释放数据价值,赋能实体经济的关键举措,开展了一系列富有成效的探索和实践工作。
(一)上海城市可信数据空间的战略布局
2024年10月,上海市数据局明确提出以国家数据空间试点为牵引,构建“企业、行业、城市、个人、跨境”五大类型的数据空间体系,重点聚焦多元异构数据的统一组织管理,依托区块链、隐私计算等技术打造分领域、分场景的实践示范。
(二)隐私计算赋能数据要素流通的实践
隐私计算技术在上海城市可信数据空间的落地实践中展现出强大的场景适配能力,在多个领域实现了数据“不出域”前提下的价值协同计算与安全合规应用案例。例如,在金融领域,上海城市定制型“沪惠保”,依托数据沙箱技术为739万人完成投保;上海徐汇区依托隐语开源社区构建技术生态,链接超过2万名开发者与30余家机构,为政务数据开放提供底层技术支撑。这些实践标志着上海政务数据开发利用已经从“量”的积累迈向“质”的安全可控。
(三)政策与生态体系的协同构建
2022年1月,《上海市数据条例》配套政策的施行为隐私计算技术应用落地提供了合法性基础。同年2月,上海牵头建设“全国一体化算力网络长三角国家枢纽节点”,推动长三角区域间的数据基础设施互联互通。上海对于城市可信数据空间建设的探索再次证明隐私计算不仅是技术工具,更是重构数据生产关系的基础设施。2025年,上海宝山区聚焦绿色低碳、大宗商品等领域可信数据空间建设,推动公共数据与行业数据的深度融合应用。
四、可信数据空间隐私计算的安全问题分析
在可信数据空间中应用隐私计算技术时,仍面临诸多安全问题与风险。能否有效解决这些问题,直接关系到在可信数据空间内数据隐私保护的有效性,以及系统自身的可靠性。经分析,主要存在以下三方面问题。
(一)隐私计算技术自身的安全风险
隐私计算技术自身亦存在诸多安全风险。一是算法缺陷与漏洞。主流隐私计算技术(安全多方计算、联邦学习、同态加密等)在落地实施的过程中,若存在设计缺陷或实现漏洞,可能导致隐私数据泄露。例如,在联邦学习中的梯度泄露攻击可能逆向推导出原始数据:在机密计算环境中,未完善的系统设计可以使旧版本数据被伪造解密,形成所谓的“回滚攻击”等。二是理论假设存在局限性。以多方安全计算为例,其安全性基于理想化范式进行界定,其中涉及的半诚实敌手模型、恶意敌手模型以及隐蔽敌手模型,实际上已全面覆盖了不同程度的攻击场景。三是旁道攻击。这种攻击方式可以通过分析加密系统在加密过程中泄露的功耗、电磁辐射、时间延迟等旁道物理信息来推断敏感信息(如密钥)的攻击方式,在硬件执行环境中风险更为显著。
(二)数据全生命周期管理的安全挑战
数据在可信数据空间中的生命周期大致可以划分为输入、计算、输出三个阶段,且在每个阶段都面临安全挑战。在数据输入阶段,恶意参与者可能注入伪造数据(如联邦学习中的投毒攻击),破坏模型完整性或泄露他人隐私;在计算阶段,往往需要在密态或分片状态下操作和处理数据,但计算的中间结果(如梯度、交互消息)若缺乏必要保护,也可能暴露敏感信息;在输出阶段,即使输出了聚合或脱敏结果,仍可能通过关联外部数据重新识别出个体信息。
(三)系统与外部环境的安全威胁
除技术自身和数据生命周期的内部风险外,隐私计算在可信数据空间中的安全应用还面临着来自系统架构和外部环境的严峻挑战。一是分布式架构的通信安全,在多方协作时,节点间的通信可能被窃听或篡改。二是恶意节点或内部攻击者可能违反协议(如隐瞒真实输入或伪造计算结果),往往需通过审计、零知识证明等技术手段加以约束。三是应用隐私计算需满足国内外相关法律法规的要求,若技术方案不符合法律要求,则可能面临外部合规性风险。
五、可信数据空间隐私计算的安全监管模型
在上海城市可信数据空间中合理应用隐私计算技术,可以促进公共数据在保障安全的前提下高效流动,兼顾发展与安全的平衡。为此,在上海城市可信数据空间中构建隐私计算技术的安全监管模型,从构建分层安全监管架构、隐私计算关键技术支撑、隐私计算管理及合规机制三个方面形成动态闭环的安全监管模型。
(一)构建分层安全监管架构
分层安全监管是一个包括技术层监管、数据流动监管、协作层监管的全方位安全监管模型。
1. 技术层监管
针对隐私计算技术自身的安全风险和系统架构威胁,技术层监管是构建安全基线的首要环节。可以从两个方面开展技术层面的监管:一是要制定在可信数据空间中应用隐私计算技术的安全基线要求(如加密算法强度、通信协议版本、抗攻击能力等级)。例如,安全多方计算需满足成熟的安全框架;联邦学习需通过梯度泄露攻击测试等。同时,需要加强对开源或商用隐私计算框架进行代码安全审计与漏洞扫描。二是加强运行时监控。例如,在可信执行环境部署硬件级监管以确保计算环境不被篡改;通过日志审计与异常检测识别潜在恶意行为等。
2. 数据流动监管
在确保技术基础安全的前提下,对数据在可信数据空间内流转全过程的安全管控是监管的核心目标。数据流动监管主要涵盖两个方面:一是确保全链路可追溯性。例如,采用政务区块链记录数据输入、计算过程、输出结果的哈希值,确保不可篡改性与追责依据。通过数据血缘来标记数据来源、处理者、权限变更记录,支持违规溯源。二是严格实现最小化披露控制。例如,基于差分隐私的动态预算管理限制查询次数与噪声添加量,防止累计隐私泄露等。
3. 协作层监管
考虑到城市可信数据空间涉及多方主体协作,建立有效的协作治理机制成为保障整体安全的关键。协作层监管主要包括两个方面:一是制定多方治理协议。通过在政务区块链网络部署智能合约,明确七个主要参与方的责任边界;通过建立和设计奖惩机制抑制恶意行为等。二是加强第三方审计。比如,“七方模型”中第三方监管机构需要对公共数据开发利用全过程进行监督、审查和审计,定期验证系统安全性与合规性,对计算结果进行合规性检查避免间接泄露。
(二)隐私计算关键支撑技术
为了有效支撑上述分层监管架构的实施,需要依托一系列隐私计算关键支撑技术提供安全保障。一是可验证计算,使用零知识证明等技术验证计算过程正确性,无需暴露原始数据。二是建立隐私度量与风险评估机制,量化隐私泄露风险并动态调整保护强度。三是建立跨域身份认证,基于分布式身份实现参与方身份互信,避免攻击者通过伪造多个虚假身份开展恶意攻击等。
(三)隐私计算管理及合规机制
除了技术支撑和分层监管框架,完善的管理及合规机制是确保安全监管落地执行的制度保障。主要从三个方面来考虑:一是加强沙盒监管,必须确保在一个封闭环境中测试新隐私计算方案,通过安全认证后再上线。二是实施分级分类监管,根据数据敏感度划分监管等级,匹配差异化的技术保护要求。三是建立数据泄露应急预案(如自动熔断机制等)。
六、可信数据空间隐私计算技术安全监管建议
为进一步规范公共数据的管理与开发利用,保障数据流动的安全性和合规性,推动隐私计算技术的应用,提出以下安全监管建议。
(一)强化风险管控,完善监管机制
基于对隐私计算应用面临的多维度安全风险的深入分析,首要建议是构建系统化的风险管控与监管机制。一是加强安全评估,防范多方安全计算、联邦学习等技术因假设漏洞或信息推导攻击引发的风险。二是建立覆盖数据全生命周期的多层次监管机制,包括接入、授权、使用、存储、传输及销毁等环节。三是运用动态监测技术,实时监控数据流动与计算过程,及时识别和处置安全风险。
(二)健全标准规范,明确安全基线
为统一安全要求并指导实践,亟须建立健全相关的标准规范体系。一是制定隐私计算安全标准,明确算法安全、计算过程保护等核心要求。二是建立产品安全认证机制,对多方安全计算、联邦学习等产品统一测评,确保安全可控。三是细化数据所有权与使用权分离机制,完善授权管理、访问控制及使用追踪体系。四是优化数据脱敏与加密技术,加强密文计算方案研究,保障数据处理中的隐私安全。
(三)加强技术测评,构建综合防护体系
确保所用技术的安全性是基础,因此需要加强技术测评并推动构建综合防护体系。一是分类明确隐私计算产品(如多方安全计算、联邦学习等)的安全要求。二是推行隐私计算产品安全评价机制,通过认证方可应用于公共数据领域。三是推动隐私计算与传统安全技术(如加密等)融合,形成多层次防护体系。
(四)推动技术创新,支撑数据基础设施
从长远来看,持续的技术创新是提升安全能力并支撑大规模数据基础设施建设的根本动力。一是优化隐私计算技术,提高计算效率,满足大规模公共数据流通需求。二是完善公共数据溯源与合规监管功能,确保公共数据要素市场的安全可信。三是促进技术互操作性,支持政府、企业及个人数据的合规共享与价值释放。
七、结 语
上海在城市可信数据空间建设上的先行实践,给数据要素市场化配置进程提供了有效经验,隐私计算技术在其中起到了核心技术研究和信任管控主要支撑作用。通过隐私计算技术与可信数据空间的深层融合,实现上海城市公共数据从“数据孤岛”到“互联互通”、从“单点应用”到“协同生态”的跃迁。这一实践不仅为数据要素流通安全与价值释放提供了可复制的技术实践范式,更通过“制度创新+技术赋能”双轮驱动,探索出兼顾发展效率与风险防控的平衡路径。未来,随着数据确权机制、跨域协同规则及长效运营体系的持续完善,可信数据空间有望成为激活数据要素潜能的核心载体,为全国数字化改革与高质量发展注入新动能。
(本文刊登于《中国信息安全》杂志2025年第5期)
声明:本文来自中国信息安全,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。