作者简介
吕艾临
中国信息通信研究院云计算与大数据研究所工程师,主要从事数据要素、数据流通等方面的研究工作。
王丹阳
中国信息通信研究院云计算与大数据研究所工程师,主要从事数据合规、数据流通方面的研究工作。
杨晓芸
中国信息通信研究院云计算与大数据研究所工程师,主要从事数据流通、数据空间等方面的研究工作。
杨靖世
中国信息通信研究院云计算与大数据研究所工程师,主要从数据流通、数据空间、高质量数据集等方面的研究工作。
白玉真
中国信息通信研究院云计算与大数据研究所工程师,主要从事数据流通、高质量数据集等相关研究工作。
论文引用格式:
吕艾临, 王丹阳, 杨晓芸, 等. 数据要素流通发展热点与趋势分析[J]. 信息通信技术与政策, 2025, 51(4): 2-7.
数据要素流通发展热点与趋势分析
吕艾临 王丹阳 杨晓芸 杨靖世 白玉真
(中国信息通信研究院云计算与大数据研究所,北京 100191)
摘要:数据要素流通对于推动数据要素市场建设、创造数字经济新质生产力有着重要作用。通过对数据流通的供给侧、需求侧和支撑侧相关政策与实践进展的跟踪分析,可以看到当前我国数据要素流通正朝着积极方向发展。然而,客观层面上,充分激活数据要素流通仍是一项长期、复杂的系统性工程。在数据治理基础、数据应用挖掘和数据基础设施建设等方面仍需坚持“长期主义”,持续有序推进,才能充分发挥数据资源的规模优势和数据应用的场景优势,牵引数据要素的大规模高效流通。
关键词:数据流通;数据要素;数据基础设施;可信数据空间
0 引言
数据作为新型生产要素,已成为推动经济增长、社会治理和科技创新的关键驱动力。作为数字经济的核心生产要素,数据的高效有序流通,是完成数据要素全部三次价值释放[1]、推动要素合理配置、支撑新质生产力蓬勃发展的重要引擎。深入剖析数据要素流通的内涵与重要性,跟踪我国数据要素流通发展现状、剖析关键障碍与未来趋势,对于构建高效、安全、可信的数据要素市场具有至关重要的意义。
1 数据要素流通的内涵与重要性
数据要素流通的本质是通过制度、技术与市场的协同创新,使分散的、异构的数据资源在不同主体之间进行合法、有序、高效的传输、共享与交换[2]。这一过程突破了传统生产要素的物理边界,实现了数据价值的跨时空转换与赋能。
从微观层面来看,数据要素流通是企业之间实现数据共享与协同创新的基础。通过数据流通,企业可以获取外部数据资源,丰富自身的数据资产,从而提升数据分析与决策的精准度。例如,金融机构大量采购外部数据资源,帮助业务人员更全面地评估客户信用风险,优化金融产品与服务。从宏观层面而言,数据要素流通是推动数字经济发展的重要引擎。一是赋能传统产业的转型升级。例如,工业互联网的发展依赖于工业企业内部数据以及产业链上下游数据的流通与共享,通过数据驱动的智能化生产与管理,实现制造业的转型升级。二是推动新兴产业创新发展。例如,人工智能技术需要大量的数据进行模型训练与优化,企业在广泛获取来自不同领域、不同场景的数据资源的基础上对数据进行清理、治理、标注等,打造高质量训练集,为人工智能研发升级提供重要养料。
全国数据工作会议明确提出坚持推进数据要素市场化配置改革“一条主线”,这一主线为数据要素流通指明了清晰方向。强调以市场机制为导向,打破“数据孤岛”,促进数据在各领域的高效配置与自由流动,充分释放数据作为生产要素的巨大潜能。但是,数据要素流通并非简单的数据复制或转移,而是需要在保障数据安全、隐私保护以及合规性的前提下,数据可被不同主体在不同场景下合理利用,既包含多个环节的技术支撑,也需要完善的治理机制和规则引导。因此,可以看到,国家数据局自成立以来,围绕构建数据基础制度、促进要素高效流通、赋能经济社会发展的核心目标,从制度设计、基础设施建设、生态培育等多维度发力,致力于构建健康、有序、安全的数据流通生态。
2 数据要素流通发展现状与热点
2.1 供给侧:公共数据资源开发利用成为强化数据供给重点
在推进数据要素流通进程中,公共数据资源开发利用已成为强化数据供给的关键着力点[3]。国家政策层面,公共数据资源的社会化供给有了更明确的管理要求和更清晰的路径指引。2024年10月,《关于加快公共数据资源开发利用的意见》对公共数据资源开发利用进行了系统部署,《公共数据资源登记管理暂行办法》《公共数据资源授权运营实施规范(试行)》(简称《实施规范》)《关于建立公共数据资源授权运营价格形成机制的通知》三份实施层面的配套文件也陆续发布。其中,《实施规范》在充分吸收前期各地探索经验的基础上,明确了各相关部门的角色及责任划分,确保厘清各地方、各行业授权运营探索中的参与主体、授权范围、运营实践、工作成果等。《公共数据资源登记管理暂行办法》一方面加强了公共数据资源的统一管理,通过授权运营数据强制登记的方式,摸清开展授权运营活动的部门和地方授权的具体数据、形成的产品和服务,确保规范化透明化运营;另一方面有效促进了公共数据资源的供需对接,依托国家公共数据资源登记平台及各省级平台,供数单位可发布数据资源和产品信息,用数单位可查找数据资源等,为发现数据、使用数据创造条件。《关于建立公共数据资源授权运营价格形成机制的通知》则基于运营机构特殊角色定位,划清收费范围,明确管理权限,规范定价程序,一方面解决了此前不会定价、不敢定价的问题,保障了授权运营方的合法权益;另一方面又通过设置最高准许收入和上限收费标准等管控机制,防止其形成垄断利润。随着上述“1+3”政策体系的出台,公共数据资源的开发利用从运营模式、监管机制、市场定价等方面具备了更完备的基础。
地方实践层面,多地积极响应推动规范运营,各行业充分拓展应用深度与广度。从地方实践来看,各地还在持续探索完善公共数据授权运营机制。如2025年1月发布的《贵州省公共数据授权运营管理办法(试行)》对授权运营机构的选择和授权运营程序进行了规定,同年1月发布的《深圳市南山区公共数据授权运营管理暂行办法》更为详细地明确了各部门的职责分工和授权运营工作流程。此外,部分省市在成效评估、合规审查、纠纷解决等保障机制层面也进行了重点探索。如2024年12月公开的采购信息显示,浙江省数据局采购了公共数据授权运营成效评估服务,2024年4月《石家庄市公共数据运营纠纷管理办法(征求意见稿)》则针对公共数据授权运营过程中产生的个人权益纠纷、组织权益纠纷和协议纠纷的处理程序进行了规定。
行业实践层面,各行业挖掘公共数据行业属性价值,拓展丰富应用场景。目前,国家数据局已发布两批“国家数据局重点联系示范场景”,且将延续到2025年底并每季度持续发布。示范场景提供多领域典型应用,为复制推广提供参考思路。从涉及领域看,既包含应急管理、普惠金融、农业农村、医疗健康等传统领域,也包括双碳管理、数字文旅、低空经济、跨境贸易等新兴领域,还涉及“气象+新能源”等跨领域场景,覆盖面广,为不同行业领域的应用挖掘提供了样例。从区域特色看,山西、陕西的文旅场景、山东的内河航运场景、辽宁大连的海洋场景、江苏南京的跨境飞行低空经济场景等,都体现了鲜明的地域和产业特色,类似场景在当地的复用和推广具备较好的实践条件。
2.2 需求侧:“数据要素×”、数据资产化推动数据应用加速渗透
近两年,在“数据要素×”与企业数据资源入表等相关政策的驱动下,各行业企业加速挖掘数据流通利用场景,推动数据价值显化向产业全链渗透。一方面,“数据要素×”三年行动计划聚焦工业制造、金融服务、医疗健康等12个重点行业,推动数据要素与实体经济深度融合,发挥数据的乘数效应。另一方面,企业数据资产入表政策推动数据从成本中心向价值中心转变,提升了企业对数据资产的重视程度,还激发了数据交易、质押等创新应用,加速了数据资源的流通和价值释放。
2024年,国家数据局发布《“数据要素×”三年行动计划(2024—2026年)》并通过开展典型案例征集、举办大赛等多种举措,激励重点行业领域,探索数据利用的新方法、新路径,进而提升数据利用的整体水平。从当前成效来看,一方面,在金融服务、医疗健康、交通运输以及城市治理等发展相对成熟的行业领域,高价值数据应用持续深化。例如,在金融服务领域,诸多金融机构借助数据要素进行精准的信用评价和数字金融服务;在医疗健康领域,医疗机构整合患者的病历、检查检验、基因等多源数据,不仅辅助临床诊断决策,还在疾病早筛诊疗方面取得进展,推动新药研发;在城市治理领域,借助数据实现基层治理精细化。另一方面,随着政策强势驱动、行业数据流通需求增强,现代农业、气象服务、应急管理等新兴行业数据需求方也纷纷发力,强化数据融合应用,挖掘新型数据应用场景。例如,在应急管理领域,通过整合地理信息、人口分布、灾害历史等多源数据,实现灾害预警防控智能化。总体而言,无论是持续深化数据应用的成熟行业,还是积极挖掘新型数据应用场景的新兴行业,都展现出数据要素流通利用的巨大潜力。
企业数据入表和数据资产化探索也牵引着企业进一步挖掘数据流通利用需求。随着《企业数据资源相关会计处理暂行规定》的正式施行和《关于加强数据资产管理的指导意见》的印发,企业数据资源入表和数据资产化探索的热潮掀起。从不同类型企业的反馈来看,数据资源入表进程呈现出多面态势。一是众多城投、类城投企业表现突出,成为各地数据资源入表的“首单”案例。截至2024年12月底,228家非上市公司公布了数据资源入表进展,其中城投企业和类城投国企占比高达85%[4]。二是上市公司数据资源入表进程加速但多数入表金额较小。在2024年三季度报的披露中,当前共55家上市公司披露数据资源入表金额,总计达15.12亿元,相较于前两季度增长显著,但入表金额占总资产比例普遍不超过3%,大部分企业低于1%,三大运营商集团数据入表金额虽相对较高,占比也均未超0.1%[4]。三是非上市民营企业数据入表积极探索新兴行业实践。在已公开的入表案例中,34家民营非上市企业完成数据资源入表并获得1.12亿元银行授信[4],这些企业主要围绕科创、跨境往来、工程机械、工业智能、营销风控和心理模型等多个前沿领域开展数据资源入表尝试。从当前进展来看,数据入表的需求对于企业主动挖掘数据应用需求,打造创新的数据产品和服务起到了一定的推动作用[5]。
2.3 支撑侧:数据流通利用基础设施建设加快布局建设
关键技术提供可信支撑是数据要素流通实践中的重要基础,如何在维护各数据主体权益的基础上实现数据价值的共创共享是相关企业参与数据要素流通时的关切所在。近年来,以隐私保护计算、区块链、数据使用控制为核心的数据流通技术体系加快构建。隐私保护计算以联邦学习、安全多方计算与可信执行环境为核心构成一套技术体系,以解决分布式协同建模、多主体安全计算问题,实现数据“可用不可见”,产品形态向多技术融合方向发展,通过混合架构整合不同技术优势,实现效率与安全的平衡。区块链技术通过分布式架构与密码学创新重塑数据流通信任基座,逐步从单一链式结构向分层多链架构发展,通过分片技术、侧链协议提升系统吞吐量与可扩展性,满足高频率数据交易需求。数据使用控制技术则自传统访问控制发展而来,随着数据跨域流通需求增长,基于属性的访问控制(Attribute-Based Access Control,ABAC)和可扩展访问控制标记语言(Extensible Access Control Markup Language,XACML)技术兴起,数据使用控制逐步从静态权限判断向动态化、细粒度化演进。
随着各类技术通过不断演进,技术融合形成的互补增强效应,为打造支撑全国一体化数据市场、保障数据安全高效流通的基础设施提供了可能性。2024年12月,国家发展改革委、国家数据局、工业和信息化部联合印发《国家数据基础设施建设指引》(简称《指引》),系统性定义了数据基础设施的内涵与建设框架,提出到2029年基本建成国家数据基础设施主体结构,形成横向联通、纵向贯通、协调有力的国家数据基础设施基本格局。依托《指引》开展的数据流通利用基础设施试点是国家数据基础设施建设过程中的重要一环,试点以数场、可信数据空间、数联网、数据元件、隐私保护计算、区块链六类数据流通利用技术方案进行先行先试,围绕工业、金融、医疗等行业和电子商务、金融支付、智慧医疗等场景,探索可信数据流通方案建设,推动数据流通利用的场景创新。
在各类技术方案中,可信数据空间受到广泛关注。除数据基础设施相关工作外,国家数据局于2024年11月发布《可信数据空间发展行动计划(2024—2028年)》以推动数据空间的推广应用。可信数据空间核心在于通过技术、规则与生态协同,构建安全可控的数据流通环境,在保障数据可控与安全前提下,提升跨主体协作效率[6]。目前,相关企业正在加速研发可信数据空间平台和连接器,构建可信管控、资源交互、价值共创能力。通过内置多方安全计算、联邦学习、可信执行环境、数据水印、数据脱敏等多种隐私保护计算技术增强数据流通安全性,融合数据使用控制、数据沙箱、区块链等技术实现数据可控和可追溯。在流通利用功能方面,开发数据调试、技术分类使用、关键信息存证、数据计量等功能。在数据应用方面,通过内置可视化分析、数据建模、多维分析等数据应用工具,支持外部应用程序的集成接入,为数据高效、多样化分析利用提供支撑。在互联互通方面,构建统一的身份认证体系,集成元数据识别、语义转换等功能,实现跨数据空间的身份互认、数据标识发现与数据订购。
在应用和生态方面,各行各业加快可信数据空间生态建设。在能源行业,南方电网探索构建能源行业可信数据空间,通过应用多类安全技术搭建数据可信流通底座,为数据安全汇聚和利用提供支撑。通过融合公共数据与各类能源企业数据,赋能城市治理、设备优化、能源配置优化,并同步建设了涵盖电碳耦合、能源需求预测等示范试点的场景,有效推动能源行业创新发展。在医疗行业,上海数据交易所与芯超数据、上海交通大学医学院附属上海市第一人民医院等机构共建幽门螺杆菌数据空间,汇聚了多家医疗机构和企业的数据,有效降低试剂盒研发成本,并充分利用多维度数据支撑,提高医疗器械证的获批率。
3 数据要素流通发展趋势与挑战
近年来,各地区各行业已有一系列实践探索成果密集出现,但实现大规模数据要素可信流通的基础尚未完全筑牢。
3.1 发挥供给侧的规模优势需筑牢数据治理基础
从资源供给来看,我国虽然拥有数据生产的规模优势,但资源分布不均、基础不牢等问题仍长期存在。根据《全国数据资源调查报告(2023年)》,2023年我国数据生产总量达32.85 ZB,同比增长22.44%;截至2023年底,全国数据存储总量为1.73 ZB,这一规模和增速反映了我国近年来信息化建设、数字化转型已取得的成效[7]。但是,一方面,大量数据集中于少数主体,数据分布不均的情况客观存在。例如,在所有数据资源中,设施物联传感数据占比超40%,车、路、云、网数据快速交换的背景下,出行数据同比增幅达到49%,这些数据往往来自于传感器、互联网、数控化设备等,这些设施或应用的开发部署需要大规模、长周期资金投入,多由城市基础设施提供方或大型企业承担,数据资源必然向这类主体集中[7]。另一方面,对于大多数企业来说,数据资源往往产生于企业业务经营的过程中,是业务的“副产品”,并非主营的核心业务,因此对数据管理的重视程度很难提升,往往存在数据底数不清、标准参差不齐、数据质量无法支撑开发利用等问题,导致大量数据无法形成有效的数据要素资源供给。
3.2 激活需求侧的应用挖掘将是长期持续性工程
一般认为,丰富的应用场景是数据产业发展的潜在优势,因为数据发挥作用的本质就是提供信息,而大部分企业生产经营的业务场景中均存在提升信息精准程度、扩充信息量的需求。但是,相较于营销、风控等少数已形成普遍数据应用的领域,其他生产经营环节中,数据应用很难直接影响企业经营效果、改变经济收益状况,导致在更广泛场景中,数据应用的规模性、典型性不足,数据复用增值的潜能也有待进一步释放。如《全国数据资源调查报告(2023年)》显示,2023年,企业一年未使用的数据占比为38.93%;开展数字化转型的大企业中,实现数据复用增值的仅有8.3%[7]。应当注意到,过往信息化、数字化建设浪潮也涌现出一批应用场景,造就了一批应用系统,但由于缺乏面向数据的统一管理,有大量数据被封闭在系统之中。
3.3 数据流通利用基础设施建设仍在探索初期
当前,围绕数据流通利用基础设施建设成为各界讨论的焦点,各地各行业也涌现出诸多实践案例,但整体来看,由于数据基础设施建设仍处于起步探索阶段,各类方案和思路在内涵理解与认知层面尚未形成统一。以可信数据空间为代表,业内已出现的案例和观点可归纳为4种不同层次的含义:一是将可信数据空间简单定义为一套标准化的技术平台或系统,主要由各数据技术提供商依据国际数据空间协会(International Data Spaces Association,IDSA)提出的技术理念给出了参考实现;二是将基础的技术工具与具体应用场景适配,基于某个数据流通场景打造可信数据空间的解决方案;三是不强调技术实现方案,将过往在场内数据交易建设过程中打造的各类行业或领域专区纳入为行业可信数据空间实践;四是对标国家政策要求,将可信数据空间视为一套包含了主体、技术、制度、生态等一系列内容的有机整体。认知上的不统一容易导致重复建设、资源错配,甚至出现“技术先进但业务难落地”的困境。因此,还需尽快推动相关概念内涵、组成架构等形成明确共识。
4 结束语
在全方位、多角度的政策指引下,在数据供给和应用需求的双向牵引下,可以期待数据要素流通将积极蓬勃地向前发展。但是,数据治理、应用挖掘等基础性工作不扎实带来的挑战与阻碍仍需客观承认并重点关注,需要保持战略定力、坚持长期投入,以逐步改善。长远来看,只要坚持市场化发展的总体导向,在政策、制度、产业、技术等多方力量的协同推进下,数据要素流通的基础将逐步夯实,生态将逐步完善,实践也将逐步丰富而活跃,为数字经济发展提供重要动能。
Hot spots and trend analysis of data element circulation development
LYU Ailin, WANG Danyang, YANG Xiaoyun, YANG Jingshi, BAI Yuzhen
(Cloud Computing & Big Data Research Institute, China Academy of Information and Communications Technology, Beijing 100191, China)
Abstract: Data element circulation plays an important role in promoting the construction of data element market and creating new quality productivity of digital economy. By tracking and analyzing the progress of relevant policies and practices on the supply side, demand side and support side of data circulation, it is found that the current circulation of data elements in China is developing in a positive direction. However, at the objective level, it is still necessary to realize that fully activating the circulation of data elements is a long-term and complex systematic project. In terms of data governance foundation, data application mining and data infrastructure construction, it is still necessary to adhere to the long-term principle and continue to promote in an orderly manner, so as to give full play to the scale advantage of data resources and the scene advantage of data application, and lead the large-scale and efficient circulation of data elements.
Keywords: data circulation; data element; data infrastructure; trusted data space
本文刊于《信息通信技术与政策》2025年 第4期
声明:本文来自信息通信技术与政策,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。