1月13日,英国首相斯塔默宣布“人工智能机遇行动计划”,其中提到创建国家数据图书馆以安全可靠地释放公共数据的价值,支持人工智能的发展。近期,英国托尼·布莱尔全球变革研究所发布《Governing in the Age of AI》报告,提出建立国家数据图书馆,以解决英国现有数据基础设施落后的问题,消除数据访问的系统性障碍,充分释放数据在驱动AI创新发展中的潜力。当前,英国公共部门数据面临数据分散、数据访问成本高、数据安全性不足等突出挑战。为打破这一困境,国家数据图书馆被视为英国数字化转型议程的核心支柱。本文通过分析英国在AI创新发展中面临的数据难题,及报告提出的国家数据图书馆构建路径,研判全球AI数据治理面临的挑战,并为我国规避“数据孤岛”与“治理失灵”提出启示及建议。

英国在AI创新发展中面临三大数据难题

1.“数据孤岛”问题突出,削弱数据使用价值

一是英国政府在部分关键领域已具有一定的数据积累,但相关部门数据分散。据英国政府网站2025年1月发布的英国数字政府现状回顾报告1,英国只有53%的政府部门超过60%的数据已上公共云,63%的国家医疗服务体系和公共机构中少于40%的数据已上公共云。

二是英国政府部门数字化服务程度偏低,数据采集和访问的门槛较高。据英国数字政府现状回顾报告,截至2024年,传统技术仍占英国中央政府部门系统的28%,而47%的中央政府和45%的国家医疗服务体系尚未建立起有效的数字化途径1

2.投资不足及成本高企,掣肘创新发展进程

对于现有的数据基础设施和数字服务系统的技术投资不足,维护成本高。2023年,英国公共部门在技术领域投入约260亿英镑,低于行业基准约30%。该投资缺口带来了双重挑战:一方面,新技术的研发和应用缺乏足够资金支持,导致创新动力不足;另一方面,现有系统的维护成本却在不断攀升,甚至达到新替代方案的3至4倍2

构建超大型数据库需较高的成本,托尼·布莱尔全球变革研究所预测,若政府只优先考虑部署10个高影响的用例,初始成本就可能高达2亿英镑。且英国政府在技术领域过度依赖高成本外包,政府在数字化能力方面存在不足,缺乏足够的内部数字人才和技术能力,这将限制政府在数字改革和创新应用方面的自主性和效率。

3.数据安全性不足,影响公众信任

英国对数据安全保障不足,数据泄露事件频发阻碍推进数据共享及流通。2024年,英国国家网络安全中心报告的全国重大网络安全事件同比增长超50%,事件严重程度提升了3倍。2024年英国国家医疗服务体系(NHS)遭遇网络攻击,泄露的数据包括2018年到2024年的患者和捐赠者的全名、地址、捐赠金额、医疗报告(包括独特的医院编号和出生日期)以及财务文件。

国家数据图书馆是英国数字化转型议程的核心支柱

国家数据图书馆将是实现高价值的数据集成,为各部门提供工具、标准和专业知识,以促进安全、负责任的数据共享及开启新协作机会的中心。尽管构建英国国家数据图书馆初期成本高,但回报潜力巨大。一个全面开发的人工智能数据生态系统可能会带来20倍的投资回报。据DARE UK预测,2050年更先进的数据访问方式将带来相当于每年130亿英镑的经济效益。通过建立国家数据图书馆,可助力英国成为人工智能驱动创新和经济增长方面的全球领导者,并成为其重新构想在全球人工智能治理中战略位置的实践典范。

1.分阶段推进国家数据图书馆建设

按照《Governing in the Age of AI》的设想,英国国家数据图书馆构建可分三阶段推进:即刻行动、中期部署和长期规划。

1、打破数据孤岛

采用数据联邦架构,各部门对其数据保持控制权,同时对敏感数据进行分散控制。部门间数据主权意识可能阻碍共享,需通过法律豁免(如数据控制者赔偿机制)和政策激励(如绩效挂钩资金分配)推动协作。

报告提出的建议:

o 设立跨部门协调委员会,明确数据共享的权责边界与经济收益分配。

o 建立一个有明确的部长级监督和跨政府协调的高级领导团队。

o 以存量数据资源为基础,启动核心数据池建设,重点打通跨部门数据接口。

o 预链接高价值数据集,如卫生-就业一体化,为公共服务提供人工智能驱动的解决方案。

2、解决成本问题

为确保被快速采用的势头,国家数据图书馆必须从一开始就带来切实的利益。但同时应明确其非盈利定位,其商业模式主要目标是收回开发和运营成本,而非产生利润。

报告提出的建议:

o 制定分层的数据访问付费方案,大型企业按从数据中所获商业价值多付费,学术机构和独立研究人员则享受折扣。

o 若国家数据图书馆开放授权给外国实体使用,可以引入一种版税支付机制,借鉴ARIA的海外融资机制,确保国家能够在公共部门数据的经济价值中保留相应的利益份额。

o 聚焦于五个与政府任务相关联的高价值、高影响用例,通过敏捷冲刺开发交付“最小可行产品”,以在支持国家优先事项中展现价值。

3、平衡隐私与安全

出于对国家数据图书馆隐私和安全考虑,需要严格的保障措施和明确定义的访问框架。

报告提出的建议:

o 建立动态风险分层机制,定期更新匿名化标准,并与独立机构合作审查。

o 采用分级访问权限(Reader Pass),通过分层访问系统来平衡安全性和可用性。

o 开发先进的合成数据生成技术,以平衡数据效用与隐私保护。

o 提供更广泛的可访问性,同时保证强大的治理和安全标准。

2.推动政策设计等四个领域数字化变革

国家数据图书馆具备推动四个关键领域协同变革的潜力:政策设计、公共服务、学术研究以及商业研发(R&D)。这些领域不仅高度依赖高质量数据作为发展的基础,而且彼此之间存在深度关联——一个领域的进展往往能够为其他领域提供新的动力和启发,从而形成相互促进的正向循环。

在政策设计领域,国家数据图书馆具备实时访问和分析数据的能力。使政策制定者能够快速响应社会经济变化,制定更有效的政策。通过链接和分析大量数据,国家数据图书馆可以帮助政策制定者预测未来趋势,从而提前规划和应对潜在问题。同时,其透明性框架和数据注册表可以增加政策制定的透明度,确保公众对政策制定过程的信任。

在公共服务领域,国家数据图书馆链接不同数据集以提供个性化的公共服务。如通过分析个人的健康数据和生活习惯,提供定制化的健康建议和预防措施。此外,国家数据图书馆可自动化数据处理和分析,提高公共服务的效率和降低成本。有利于识别潜在的社会问题,如贫困、健康风险和犯罪热点,从而实现早期风险预警和干预。

在学术研究领域,国家数据图书馆提供快速访问大量高质量数据的能力,显著加速科学研究的进程。国家数据图书馆可以促进不同学科之间的数据共享和合作,整合及提供标准化和高质量的数据,推动跨学科研究的发展。

在商业R&D领域,国家数据图书馆为企业提供快速访问和使用数据的能力,加速产品和服务的开发和迭代。通过利用国家数据图书馆的数据,企业可以开发出更具创新性和竞争力的产品和服务。并且,国家数据图书馆可以作为一个平台,促进企业、学术界和政府之间的合作,形成一个支持创新的生态系统。

对我国的启示

我国在数据治理市场规模持续扩张,政策法规体系正逐步完善。然而,当前仍面临一些挑战,如部门间信息系统标准不一,数据分散整合困难,数据分析效能不高。报告建议建立国家数据图书馆推动AI创新发展,并且不要试图集中所有数据,而是推荐采用数据联邦架构等方式。这对我国推动高质量数据集建设工作,为AI技术创新和产业应用提供坚实的数据基础而言具有参考意义。

一是降低大型国家级数据库的使用门槛。通过集中化元数据目录,简化数据发现流程。提供“开箱即用”分析包,降低数据使用壁垒。设立专业服务台,使用户能够有效地读取和处理数据集。

二是平衡数据效用和安全性。在充分发挥数据价值的同时,必须加强隐私保护和合规管理,确保数据的使用符合法律法规,避免因安全问题影响数据的共享和应用。

三是解决数据库运营成本问题。通过合理规划商业模式和资源配置,可以有效降低开发和维护成本,确保数据库在经济上具备可持续性,为国家数据治理和人工智能发展提供坚实基础。

注释:

1.https://www.gov.uk/government/publications/state-of-digital-government-review/state-of-digital-government-review

本文作者

蒙美铮

战略发展研究所

助理分析师

加州大学伯克利分校硕士,就职于中国电信研究院,主要从事AI和产业数字化转型等相关领域研究。

张云霞

战略发展研究所

一级分析师

就职于中国电信研究院,主要从事数字城市,智慧城市,数字化转型,物联网等领域的研究。

媒体运营

编审:研发云数字体验设计与研发团队

制图:李银鑫

编辑:王凯雯

审校:董智明 刘馨

声明:本文来自天翼智库,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。