标题 | 基于云计算下的大数据加密检索技术研究 |
范文 | 吴远栋 雷敬祥 摘 要:随着云计算和网络技术的快速发展,越来越多的数据将被存放在云端,云计算的数据检索已成为了热门的话题。本文基于国内外的最新研究成果,提出了云计算的数据检索方案,以及未来的发展趋势。 关键词:云计算;网络技术;数据检索 0 前言 在当今信息技术高度发达的时代,云计算无疑是学术界、互联网企业、通信运营商、政府等关注的宠儿。云计算主要是基于网络就是计算机的重要思想,通过将大量的存储资源和计算资源用网络连接起来进行统一的管理,构成一个庞大的虚拟IT资源池向用户提供按需服务。在 IT 产业界[1],云计算被普遍认为是继互联网经济繁荣以来的又一个重要 IT 产业增长点,具有巨大的市场增长前景;由于云计算的发展理念符合当前低碳经济与绿色计算的总体趋势,并极有可能发展成为未来网络空间的神经系统。不可否认,云计算在信息领域引起了一场新的工业化革命,其带动了整个互联网、传统电信产业乃至真个社会产业的变革,但当前,随着云端数据的膨胀,要从云端海量的数据中快速高效地检索出想要的数据,已经成为一个急需解决的问题,因此数据检索技术越来越成为制约云计算发展的主要因素。 1 云计算下的大数据加密检索技术 (一)云计算的定义 云计算的定义有许多种,其中得到业界最广泛认可的是2011年由美国国家标准和技术研究院(NIST)组织云计算产业界的主要厂商经过多次讨论研究后提出的[2]:云计算是一种通过网络以便捷、按需的形式从共享的可配置计算资源池(这些资源包括网络、服务器、存储、应用和服务)中获取服务的业务模式,云计算业务资源应该支持通过简洁的管理或交互过程快速地部署和释放。 (二)云计算下大数据的加密检索技术 这里的加密检索其实是对密文进行检索,由于用户的数据存放在云端,那么就失去了保密性,这对用户而言是致命的,这也是阻碍云计算发展的一个关键因素,故用户在将数据存放在云端之前,先对要上传的数据进行加密,由于云服务提供商不知道加密算法和加密密钥,所以用户的数据对云服务提供商而言是完全保密的。但是为了用户以后检索文件的便利与高效率,就需要在将数据密文上传云端之前在密文数据的后面添加一个MAC函数值,以后用户需要检索想要的数据时就可以直接通过计算MAC函数值,然后与云端密文数据后面的MAC函数值进行对比,如果相等,则该数据就是所检索的,否则不是。其中该MAC函数值是这样得到的:提取数据明文的关键词组合或者文章标题或者某几个句子的组合,进行MAC函数计算而得到的。其中提取数据明文的关键词组合或者文章标题或者某几个句子的组合的优点是,计算代价小,它突破了之前用整个明文数据进行MAC计算的思想,从而大大降低了计算量,提高了用户检索所需文件数据的速度。 当我们需要检索某个文件数据时,首先通过计算组合的关键词或者文章标题或者某一个句子的MAC函数,结果为M位,然后将计算后的结果给云服务提供商,云服务提供商只需检验文件数据的后M位,找到M位相同的数据则说明其是要查找的数据。然后就可以将搜索到的数据传给搜索者。在上述技术中,由于原始数据以及检索数据都是加密的,故对云服务提供商而言都是保密的,从而达到了加密检索的目的。 通过以上分析,基于云计算的大数据加密检索技术如图1所示: 3 加密检索技术未来发展趋势 通过云计算的加密检索技术,既达到了用户数据保密的目标,又由于该技术方便简洁,计算量小,搜索效率高,因此有很大的应用前景。同时此技术巧妙地运用了消息认证码,故即使不同文件重叠率很高,只要所选关键词或关键句组合不同,那么它们计算出的MAC值也会不同,这就更加证明了此技术的精确性。但是该技术的一个缺陷在于,如果在重叠率很高的文件中所选的关键字或关键词一样,那么就不能保证最终检索出来的文件数据是之前想要的。故在保证方便简洁高效的同时,如何提高加密检索的精度是未来急需解决的问题。 4 结束语 随着云计算与大数据的膨胀,加密检索技术日益凸显出其重要作用。本文通过研究云计算的加密检索技术,归纳出了该技术的优点,然而无论从理论上还是从技术上,该技术还有待优化。而要真正优化云计算加密检索技术,还需要学术界、产业界以及政府相关部门的共同努力才能实现。 参考文献: [1]冯登国等.云计算安全研究[J].软件学报,2011,20(1):71-83. [2]MELL P, GRANCE T. NIST SD 800-145,The NIST definition of cloud computing [S]. Gaithersburg, MD: NIST Special Publication,2011. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。