一、引言

云计算是Google在2007年提出的全新概念,如今已经成为了产业界、学术界和政府关注的焦点。

云计算是一种具有动态延展能力的计算方式,它被看作是现有的分布式计算、并行处理计算、网格计算等概念的延伸和发展应用,作为一种“基础设施”出现在人们的视野。用户终端设备的计算和存储能力有限,而拥有近似无限资源的云就为用户提供了很多便利。云计算平台能在极短时间内处理非常大数量级的信息,进而把资源以服务的形式用互联网提供给需要此类资源的个体或公司。

然而,相对于传统的网络应用,在云端进行存储和相关业务的处理会导致用户数据的所有权与管理权分离。一方面,为了利用云平台的计算和存储资源,用户需要将数据存储到云服务器或者计算任务外包给云服务器,这将泄露用户的敏感数据和计算结果。另一方面,云服务器一旦出现问题,大量用户的数据与应用将会无法使用和运行。为了保护用户数据在存储方面的安全,基于加密数据的安全云存储服务备受学术界和产业界的关注。

二、云存储数据安全

云存储,就是将数据存储在云端的一种存储方式。它是一种在线存储的模式,即把数据存放在通常由第三方托管的服务器上,具有高容量、高性能、高可扩展性、地理位置无约束、随需付费等优点。通常情况下,云存储服务以数据的安全存储和管理为核心。国内外学者在云存储数据安全进行了大量研究,主要集中在数据完整性审计、密文数据去重、可靠数据删除以及高效密文检索4个方面。

1. 完整性审计

用户为了保证自己的数据在云上完整且正确地存储,需要定期对云服务器上的数据进行审计。因为海量的数据取回会消耗大量带宽以及终端的计算资源,所以将数据全部取回验证不实际。因此,用户通过下载或使用关于原始文件的部分信息来执行外包数据的完整性验证。数据完整性审计是云存储的重要安全技术之一,用于用户(或审计者)验证其存储于云端的数据是否保持完整。

图1 两种完整性审计机制

完整性审计主要包含两种审计机制:可证明数据持有(Provable Data Possession,PDP)和可证明数据可恢复(Proof of Retrievability,PoR),其对应的网络模型如图1所示。这两个方案都是基于审计方与云服务器通过挑战—响应协议来验证数据的准确性或可恢复性。区别在于,PDP在效率方面有巨大优势,在判断云中数据是否损坏上更加快速。而PoR机制对所存储的数据进行了预先编码处理,不仅能验证数据是否被损坏,并且能在数据受到一定损坏时恢复数据。通常,考核数据持有性证明方案优劣的指标如表1所示。

表1 数据持有性证明方案指标

2003年,远程数据存在验证的概念被首次提出后,表明用户可以对文件进行无限次数的完整性验证。在此基础上,基于公钥密码体制的PDP和PoR被提出。近年来,学者们对支持动态更新的PDP方案进行了大量研究,提出了很多特殊场景下的数据完整性审计方案。以PDP为例,数据完整性审计方案执行过程如图2所示。

图2 审计机制细节

2. 密文数据去重

通过数据去重技术可以消除数据冗余,相同文件只保留一个物理副本,从而有效降低用户端上传数据耗费的带宽及节省服务器端的存储空间。对于云计算平台而言,数据去重不仅可以减少存储时付出的硬件成本,还可以提升存储空间的利用率,提高访问效率。数据去重存储技术目前广泛应用于商业云存储及数据备份服务,例如Dropbox、Mozy和Memopal等商业存储中。

然而现有的绝大多数去重方案仅适用于明文数据。为了解决传统加密方案与去重方案不兼容的问题,收敛加密技术营运而生,通过将文件的哈希值作为其加密密钥的方案,收敛加密算法使得即使是不同的用户再不需要通信的前提下也能得到同样的密钥,这使得密文去重得以实现。图3为基于收敛加密的数据去重模型。

图3 基于收敛加密的数据去重模型

3. 可靠数据删除

为保护用户隐私,可靠的数据删除服务显得尤为重要。现有的数据删除技术主要包含两种:安全覆写方法和密码学删除方法。

安全覆写方法是一种物理删除数据的方法,它对数据进行删除操作时首先需要对数据进行破坏,然后使用新的数据在原有数据的位置上进行覆写,从而使得用户数据无法恢复,进而实现可靠的数据删除;具体标准与算法要求如表2所示。

表2 数据覆写标准与方法

密码学删除方法指的是用户在上传敏感数据文件之前,先对其数据文件加密后上传到云服务器上;所有数据文件的密钥按树形结构组织,然后将主密钥保存在物理安全的存储介质中,其他数据和加密的密钥树则被保存在一般存储介质。当数据需要被删除时,将密钥管理者所持有的密钥进行删除,这样就能保证用户存储在云端数据的安全删除。此外,为了实现对每个数据文件的可操作性,每个数据需要单独选择不同的加密密钥,并在本地保留尽量少的主密钥,其它密钥通过主密钥加密方式存储在服务器中。对重复数据删除方案的考核标准主要体现在表3所示的几个方面。

表3 数据删除方案的考核标准

4. 高效密文检索

传统的明文检索方式不再适用于密文数据,高效的密文数据检索技术是保护云存储数据安全的一个关键技术。在密文数据检索中,主要包含关键词搜索、多关键词检索、模糊关键词检索等多种检索方式。现有的加密数据检索方案分为4种类型:

 利用索引访问类型。

 利用陷门信息访问类型。

 利用秘密共享方案访问类型。

 利用同态加密的访问类型。

云环境下的安全密文检索网络图如图4所示。

图4 安全密文检索

根据方案中使用的不同的密码体制,可搜索加密技术分为以下两个技术:对称可搜索加密技术和公钥可搜索加密技术。对称可搜索技术计算具有速度快的优势,已经逐步成为了学术研究的焦点。2004年公钥密码首次被引入可搜索领域,提出第一个基于关键词的公钥可搜索加密方案。对于公钥可搜索加密技术中,用户利用共享者的公钥进行加密,双方不需要进行交互,因此应用场景更为广阔。

三、结语

云计算是时代的必然产物,而从某种程度上讲,云计算安全是为云计算服务的一种服务。随着云计算的高速发展和快速应用,现有的云计算安全研究已经体系化、专业化,云计算安全已经成为很多IT从业者关注的主题。用户对自己的数据安全性需求催生了云存储可靠数据删除,完整性审计技术的发展;本文从完整性审计、安全数据去重和可靠数据删除、高效密文检索这几个方面分析了各领域的研究内容。随着国内外研究的不断深入,我们相信这一领域的发展将会越来越好,为人类科技的高速发展做出更大的贡献。

作者:赵振凯, 北京市海淀区教师进修学校, 附属实验学校;秦波, 博士, 中国人民大学信息学院讲师

声明:本文来自互联网研究前沿,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。