郑建华院士: “密码定义安全” 的思考与愿景

郑建华, 信息分析专家, 长期从事复杂信息系统分析和相关基础理论研究. 1956 年 9 月出生于吉林省长春市. 1987 年毕业于中国科学技术大学研究生院. 2011 年当选为中国科学院院士.

“密码定义安全” 的思考与愿景

密码技术已经有数千年历史. 香农的保密系统通信理论奠定了现代密码学的理论基础, 第二次世界大战的密码对抗、第一台电子计算机的诞生、图灵提出计算复杂度理论, 到分组密码、公钥密码、数据加密标准推动密码理论与技术发展到了一个前所未有的高度. 密码成为信息安全的公认的基石. 但不可否认的是, 有史以来, 密码主要扮演的是信息和数据保卫者的角色. 随着全球网络化、数字化及智能化浪潮的到来, 网络安全及由此延伸的数智安全面临前所未有的严峻挑战. 迄今为止, 网络安全技术总体上说属于“后验的”、“经验型的”, 发生什么问题就解决什么问题, 解决问题的方法多是“治标的”, “增加对手的难度, 而不是使对手不可能”. 面对复杂、“强对抗”的网络安全态势, 我们对重要核心网络的安全没有把握, 底数不清. 甚至, 什么是网络安全？网络安全的基石是什么？都难以说清楚.

当前网络安全有三个核心问题比较难解决, 分别是计算层的逻辑一致性、网络层的攻击行为识别和阻断、数据层的全生命周期安全管理.

网络节点 (包括计算节点和交换节点) 是网络业务逻辑和防护策略的执行部, 却常因缓冲区溢出攻击、注入攻击、供应链攻击等, 导致程序执行中异常跳转、注入和执行恶意代码, 致使计算逻辑在一个瞬间被蓄意破坏或篡改, 网络或系统被攻击. 本质上是对手利用计算机程序设计的缺陷漏洞, 篡改了程序的控制流, 破坏了程序的逻辑一致性；信息网络主体间的相互关系、互动机制与耦合关联具有内在的、稳定的行为结构特征, 而对敏感重要网络的侵入、窃密、攻击、破坏等等 APT 攻击等往往都试图通过隐蔽欺骗手段、不破坏这些行为的结构特征, 使网络的管理者和合法用户毫无察觉, 实现其攻击目标；数据是主体在网络环境中实现信息传递与交互的载体. 由于数据的可复制性, 必须保证其在生成、传输、存储、加工、使用和销毁的全生命周期安全性, 特别是基于公有云、面向大数据和人工智能应用背景下的数据全生命周期安全非常重要, 也非常棘手.

对这几个问题的内涵进行深入分析, 不难发现从密码学的原理出发, 似乎可以很好解决这些问题. 因为密码技术不仅可以保证信息、数据的机密性, 它还可以保证信息、数据的不可篡改性和不可抵赖性, 如果用于程序逻辑的“静态”和“动态”、特别是执行过程中的不可篡改和信息网络主体行为的规范性和不可篡改、不可抵赖是不是就可以“先验地”解决程序漏洞攻击和网络的 APT 攻击问题呢？至于, 数据的全生命周期安全离不开密码则是显而易见的. 所以, 我觉得我们没有用好密码. 从密码的原理出发, 把网络安全的重要问题规约到密码系统的安全, 把网络对抗转化为密码对抗, 基于密码的可证明安全实现网络的可证明安全, 是一条重要的、有希望、值得探索的技术路线.

基于上述分析, 我们希望能够研究形成一套理论框架——密码定义安全, 涵盖而不限于密码定义计算安全 (简称密码定义计算)、密码定义网络安全 (简称密码定义网络)、密码定义数据安全 (简称密码定义数据) 三方面, 从密码的基本原理出发, 将密码技术“紧”地作用在保护对象上、要解决的问题上, 将网络安全中的亟待解决的重要问题, 特别是计算一致性问题、APT 攻击防御和面向公有云的大数据安全归约到密码系统的安全上. 密码定义计算安全重点在计算逻辑的一致性保护, 希望通过密码技术使得每个主体能够按照既定逻辑执行对应行为, 保证系统能够严格按照预先设定的逻辑运行、不被恶意篡改. 密码定义网络安全重点在基于密码技术实现网络行为的细粒度管控, 希望通过基于密码的行为主体身份属性和基于属性的行为管控, 对可能的攻击行为进行事前防御. 密码定义数据安全重点在保护数据全生命周期的安全性, 希望通过多样化的密码算法和密码协议的协调配合, 保证数据的管理权“自始至终”掌握在数据所有者手里. 对手要突破我们的防护, “当且仅当”要破解我们的密码, 把网络安全“实质性”地建立在密码安全之上. 如果能做到这一点, 称其为密码定义安全是很自然的. 这是推动网络安全理论和技术发展的一个比较有希望的技术路线, 同时, 对密码的设计和应用也提出了新的要求, 为网络安全新形势下的密码理论和技术自身的发展提供了一个新的赛道.

就密码技术而言, 首先, 需要研究设计一类高效、轻量级的序列密码算法. 该密码算法不是以保护数据机密性为目标的, 需要为保护程序逻辑的不可篡改精心构建. 由于要在处理器中和指令解析同步执行, 对算法的高效性要求很高. 程序的地址作为密码乱源的时序驱动, 利用非线性合成逻辑将程序代码地址与程序代码均匀合成压缩, 生成验证码. 虽然也可以用已有的标准密码算法, 但计算成本会高一些. 在程序发布、加载和处理器执行中还需要一整套密码协议, 保证密码定义计算的安全.

其次, 信息网络的行为主体的行为如何刻画, 并与密码进行绑定, 利用密码规范网络主体的行为, 是一个具有挑战性的难题. 我们目前的思路是利用属性基密码, 将行为主体的属性与可以进行的行为严格绑定, 最大限度缩小攻击面.

全同态加密无疑是解决数据全生命周期安全的首选技术, 可以保证数据从生成开始, 经过传输、汇聚到计算加工全过程处于由数据所有者主导的密文状态且无需明密转换或不同加密算法的转换, 即“全密态”. 但是, 从概念提出到第一个理论意义上的全同态加密算法被提出, 过去了整整 30 年 (1978—2009). 从第一个全同态加密算法被提出到现在又过去了 17 年. 技术不断在进步, 但离实用需求还有不小距离. 在数据“爆炸” (2025 年全球 213.6 ZB, 中国 51.8 ZB)、数据推动科技发展加速的今天, 需要有新的思路, 特别是研究提出我国有自主知识产权的全同态加密技术.

以上是我们的思考, 我们希望能有更多的相关领域学者去思考和研究, 推出更多不同的落地技术, 丰富和发展这一技术体系. 同时, 我们也希望密码科研更加聚焦在解决当前网络安全的重要问题上. 科研项目不求大而全, 解决“真问题”.

声明：本文来自密码学报-中英文，版权归作者所有。文章内容仅代表作者独立观点，不代表安全内参立场，转载目的在于传递更多信息。如有侵权，请联系 anquanneican@163.com。

郑建华院士: “密码定义安全” 的思考与愿景

大模型时代密码学基础设施代码库安全挑战与重构

黄殿中院士：以人为本智能向善——回应人工智能时代之问

封闭计算环境的数据流通价值：从假名化与匿名化的区分来看

郑建华院士: “密码定义安全” 的思考与愿景

大模型时代密码学基础设施代码库安全挑战与重构

黄殿中院士：以人为本 智能向善——回应人工智能时代之问

封闭计算环境的数据流通价值：从假名化与匿名化的区分来看

黄殿中院士：以人为本智能向善——回应人工智能时代之问