9月3日,2022世界人工智能安全高端对话在上海世博中心成功举行。安全高端对话以“智绘宇宙,元起安全”为主题,由上海赛博网络安全产业创新研究院主办。会上,上海市人民政府办公厅数据发展管理办副主任殷仍,围绕“公共数据的流通利用与安全保护”进行分享,提出要高质量、保安全推动公共数据资源的开发与利用。

众所周知,数据已经成为第五大生产要素,无时无刻都在影响着人们的生产和生活。数据对于上海这座现代化的大都市的作用就像是血液之于人体,既要保证畅快高效地流动,也需要让它在一定的规则体系下运转。只有这样,数据才能给上海城市化数字转型和打造“国际数字之都”持续输送动力和养分。

构建城市一体化数据资源体系

据统计,2020年只有不到2%的数据被保存并保留到2021年使用;可用的企业数据中,仅有32%的数据被投入使用;全社会数据年增长率达到40%以上,但是数据利用增长率仅为5.4%;到2020年全球数据总量约为64ZB;中国到2025年新数据总量可能达到48ZB。

由此可见,当前数据资源的产生速度与其后期管理运用能力不相匹配,数据资源的开发利用尚有极大的发展空间。我们的目标是构建城市一体化数据资源体系,但城市是一个复杂巨系统,要构建这个体系任务艰巨、过程漫长。这是一项系统性工程,不仅需要演化发展的机制机理、构建体系的基本资源要素,还有一组一组互相作用的主客体关系等构成。

很像太阳系的形成,太阳和万有引力是运行机理,决定了一定范围、一定空间内物质的演化,从而逐步形成行星、卫星等。构建城市一体化数据资源体系尚处于酝酿和发展的前期,如果能找到或建立城市数据资源的利用机制,并结合当前政府、行业、社会各领域已有的数据发展动能,到了一定时期,城市的数据资源也会由于彼此的价值引力,产生流动或者区域平衡,从而形成城市一体化数据资源体系

公共数据的价值与作用

公共数据是指国家机关、事业单位,经依法授权具有管理公共事务职能的组织,以及供水、供电、供气、公共交通等提供公共服务的组织(统称公共管理和服务机构),在履行公共管理和服务职责过程中收集和产生的数据。

如今,城市的数据资源体量巨大,然而公共数据在城市数据总量中占比非常小,且未来的占比将越来越小,但公共数据的价值在整个城市数据资源价值中居于核心地位,对于激活数据要素市场具有牵引推动作用。其理由是,公共数据已被权威部门进行统一规划、科学组织和有效治理。就如同语言文字发展过程中,到了一定阶段总需要有一些权威机构,把分散在各处发明的文字进行搜集、梳理、汇编。2018年至今,上海市政府大力开展公共数据整合和治理,建立了大数据资源平台。它就像一本数据大字典,字典前面部分是目录,是对整个资源体系的整理、编排和索引;后面部分是对数据资源的集中组织,把分散的数据变成汇聚的数据。有了这本大字典,我们可以快速检索数据资源,更可以施以丰富、有效的手段对这些井井有条的资源进行开发利用。公共数据的价值发挥要比其他数据更加快捷、高效。

公共数据开发利用(运营)模式

当前,公共数据利用有两种比较成熟的模式:公共数据共享和公共数据开放。公共数据的共享是指数据在公共管理和服务机构之间的流通。上海市成立大数据中心,建立了一整套围绕数据共享的管理机制、技术体系。已经实现跨部门的共享调用超200亿次,跨层级数据共享超800亿条。公共数据的开放则是指从政府侧向社会的流通。目前上海市公共数据开放平台已开放50个数据部门、100个数据开放机构的近5500个数据集。

但这两种模式服务的应用场景有一定局限性,也遇到一些瓶颈,公共数据价值的挖掘利用还有进一步提升空间,为此,我们正尝试把“运营”理念引入到数据管理利用之中

公共数据运营有两种思路:一种是政府全面主导。一般通过政府购买服务的方式,邀请一些有名的互联网企业、IT企业参与到政府数据治理项目,但实践表明这个模式产出的数据产品和服务的品质和互联网产品服务还是存在差距。

另一种思路是政府指导下的社会化运营。在社会化力量的充分发挥之下,公共数据不再只是解决政府自身的需求,而是要把公共数据以一种要素的形态为经济社会发展提供服务。这是一个趋势,也是一个挑战,也是数据要素市场建设的重要方向。目前部分城市正在探索和试点,上海在《上海市数据条例》中也率先建立了公共数据授权运营的总体制度框架,正在细化制定配套的规则体系。

公共数据安全运营思考

公共数据安全管理的边界现在快速延伸,从原来各政府部门各自分散建设的网络、服务器和应用系统,现已系统性的囊括“网、云、数、用、端”数据的全生命周期。

“一张网”是政务外网,联通政府各个部门,就像血管,把数据输送到政府的每个细胞和组织;“一朵云”是电子政务云,提供了统一计算、存储的基础设施,政府机关的所有电子政务系统已上云,实现“应迁尽迁”;“一个大数据资源平台”,实现了公共数据应归尽归,把分散孤立的数据变成汇聚整合的数据,把管理的数据变成应用的数据。在之上是“一组应用”,目前上海有和“一网通办”和“一网统管”两大品牌,实现业务应用的“应统尽统”。

从数据安全的角度来看,风险主要分为以下两类:

(1)集中风险。公共数据已经实现集中存放和管理,集中一定伴随着安全风险的汇聚。

(2)流动风险。数据数据共享、开放和社会化运营将带来更广范围、更为频繁的数据流动,将导致安全管理难度大大增加。

最后,殷仍分享了对于构建公共数据安全运营保障体系的思考。体制机制,很多省市已经设立了大数据局,以及类似数字广东、数字浙江这种大数据集团公司,上海正在逐步探索适合自身的道路。同时也在探索建立CDO制度,建立生态体系,增强软实力。制度规范上,落实国家数据安全法律法规,制定地方安全制度,完善等级保护制度、内部管理制度等。技术运用上,逐步把隐私计算、区块链、态势感知、拟态安全等,应用到电子政务系统建设和数据安全运营之中。人才发展上,建设安全队伍,开展安全教育培训;探索数据职业发展体系,培养专业人才。其他具体措施还包括了完善公共数据分类分级与重要数据目录管理。

声明:本文来自赛博研究院,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。