云计算与大数据时代
熊小玲
摘 要:云计算是当今计算机领域最热门的话题,大数据时代的发展趋势和用户需求迫使研究者们前赴后继地投身这一领域。这是充满挑战的时代,也是充满机遇的时代,突破了网络发展的这一质变过程,计算机学界势必迎来一个更加辉煌的时代。对于广大用户而言,云计算带来的服务将会大大提高工作效率和质量,提高生活品质,为人们幸福生活做出贡献。
关键词:云计算;大数据;虚拟机
计算机的发展仅仅有几十年的历史,也许发明并不断改进这种先进工具的天才们一开始并没有想到它会成为当今人们工作、生活离不开的工具。又借着互联网这股东风,越来越多的数据、信息开始爆炸式地充斥着整个网络,每时每刻都有大量信息涌出,在网上流动着,在服务器中堆积着,大数据时代已经来临。
如果对大数据不能有效地存储、利用,提供针对性的服务,那么互联网不仅有可能成为一个大垃圾场,而且藏在其中的宝藏也可能就此埋没,无法让每个用户享受到网络、大数据能够带来的方便。可喜的是,当今的计算机工作者们及时抓住了网络发展的脉象,如火如荼地探索着基于大数据和互联网的云服务。云计算也许只是众多云服务的一个代表,这个计算不仅是通常意义的计算,还包括虚拟化、操作系统、存储、软件等等,总之,在大数据面前因为自己的终端机不够给力(像内存不够、处理器落后等)而无法痛快完成的事情都可以搬运到云端去做。而这种"搬运"可不像搬个宿舍那么容易,不仅面临着把自己的数据交付给别人所产生的安全风险,很多在普通情况下的服务、产品不仅要做简单的修改,而且有些要进行彻头彻尾的改革,更多地则需要另起炉灶,完全针对大数据进行设计和实施。可以说,大数据时代的到来带来了充分多的机遇和挑战,研究者们所付出了辛劳完全可以和计算机先驱们相提并论。
即使是不从事计算机领域研究的普通人,而今也已经越来越多地与云计算面熟起来。苹果产品的icloud服务每每自动推送通知,询问是否要将电脑中的数据备份到云中;百度的微盘也经常恭喜用户又获得了几兆的免费存储空间。这些还只是有关存储的服务。为了更合理地利用计算机资源,人们也迫切地想要将一台机器完成的工作分散给其他机器,提高效率;也想要直接使用云端的操作系统来操作自己的电脑。当然,这种转移和分摊绝对不能让用户感觉出来,而是需要开发者完成,只把用户当作又懒又笨又想不劳而获的理想主义者。
这里就牵扯出了云计算中的核心技术之一——虚拟机及其迁移技术。虚拟机的特性不仅是兼容性(完全兼容标准的操作系统及在这些操作系统之上建立的硬件驱动和应用)和隔离性(每一个虚拟机都与同在一个服务器上的其他虚拟机相隔离),还包括封装性(虚拟机将整个系统包括硬件配置、操作系统以及应用等封装在文件里)和硬件独立性(可以在其他服务器上不加修改的运行虚拟机)。为了达到这些目的,虚拟机必须解决几大关于迁移的难题,比如内存迁移问题(如何实现实时的内存迁移,而不影响虚拟机内程序的运行?)、硬盘迁移问题(如何实现大数据量硬盘的实时迁移,而不影响虚拟机内程序的运行?)、网络迁移问题(如何实现虚拟机内服务的实时迁移,而不影响客户端程序的访问?)、云计算环境中虚拟机迁移的调度问题(如何有效的利用集群内设备资源,以达到最高的资源利用率?)、虚拟机迁移的性能评估(如何有效的评估虚拟机迁移的性能?)等。这些问题虽然目前还没有统一标准的解决方案,但是每一问题都吸引着无数研究者去探索。而对每一问题的向前推进,都会对云计算的推广产生积极影响。
前面提到的飞行器流场计算和生物计算需要不同的操作系统、应用软件、硬件平台来支持,系统虚拟化可以为这一需求提供支持。系统虚拟化是将底层设备与上层操作系统、软件分离的一种去耦合技术,目标是实现IT资源利用效率和灵活性的最大化。多个系统融合在一台服务器上,资源利用率会提高;应用系统不再依赖特定的硬件,则使得系统维护更灵活。
系统虚拟化和云计算之间有什么关系?目前有两种声音。一种认为虚拟化和云计算之间没有必然联系,一种认为虚拟化就是云计算的基石。我更倾向于后一种观点,虚拟化中处理迁移、分配等问题的一些思路可以用在云计算上。虚拟机的快速部署与便捷的系统管理、资源利用率的提高和云计算的思想是一致的。在虚拟化环境下,需要重新审视或刻画应用程序、操作系统、虚拟机管理器及硬件的各自行为特征以及相互之间的约束、依赖和协同。而云计算也需要针对不同应用的不同运行特征动态调整资源配置。
基于应用程序特征的虚拟机部署能给云计算提供很多思路。每类应用程序都有其计算的特点,当这些应用程序部署在一个虚拟机上时,就反映为虚拟机的计算特征。而对云计算而言,当有多个用户请求不同类型的服务或一个用户请求不同类型的服务时,在云端就形成了云端的计算特征。对于计算特征相似的虚拟机,当把它们部署在同一台物理主机上时,就会存在对相同计算资源的竞争使用,从而考验总体的性能。而对云计算而言,类似的服务部署在同一批机器上,也会形成对资源的竞争。如果尽量把计算特征相容的虚拟机部署在一起,则会提高物理主机计算资源的利用率,提高虚拟机的总体性能。
云计算是大数据时代的主流,对它的研究是对计算机、信息科学等各学科的综合挑战,也给各学科带来了发展的契机。作为信息安全专业的同学,我们今后涉及的云计算方面的研究内容主要与安全有关。各种服务都需要将终端的数据传输到云端并将结果从云端返回到用户这一过程,传输过程中数据的安全性是至关重要的。现有的比较成熟的加密算法有针对较短数据的非对称密码算法,即加密密钥和解密密钥不同的密码算法,如RSA、ECC等,这些主要是用于加密对称密码算法中要使用的密钥的。对于数据量稍大的信息的加密和传输,还是传统的对称密码算法用得比较多,比如AES算法。因为它们的运算量较小,而且破译对称密钥所需的计算的规模较大,可以满足数据安全性的需求。然而在大数据时代,需要加密传输或存储的数据量呈爆炸式增长时,即使是针对较大数据量的密码算法也不能完全照搬过去,以往因为加密解密而消耗的用户几乎察觉不到的时间在大数据面前会变得让用户抓狂,降低了效率,甚至会让云计算得不偿失。所以,密码学界也需要针对云计算的需求重新开发新的研究方向。
云计算时代产生的模式并不是事物发展的一个个例,这种数据由少及多进而颠覆最初的意识形态的变化其本质可以理解为由量变到质变的过程,是事物发展的客观规律。像网购的发展模式一样,最初只是某买家与某卖家突然发现可以利用互联网进行交易,一对、两对,越来越多的买家和买家参与到这种模式中来,而一对又一对的贸易交织成了一个杂乱的网,如果不对由此产生的数据量和交易信息进行一个统一的管理或更规整的安排,会面临着众多安全性、数据垃圾的问题。于是,有高瞻远瞩的第三方开始站出来了,将网上的贸易进行一个规整的管理,设定合理的交易模式,一方面满足了大规模交易的需求,另一方面降低了门槛,让更多的买家和卖家可以参与到其中。说到这里,大家就想起很熟悉的亚马逊、淘宝等网站了。当然,在贸易领域,这种应对量变到质变的思路和方法都相对简单,而对云计算而言,却需要很高深的技术支持才能实现。
参考文献:
[1] 孟小峰. 大数据管理:概念、技术与挑战, 计算机研究与发展.
[2] 陈如明. 大数据时代的挑战、价值与应对策略, 移动通信.
[3] 罗军舟. 云计算:体系架构与关键技术, 通信学报.
[4] 范永清. 密码学及其在现代通讯中的应用, 信息网络安全.
[5] 刘正伟. 云计算和云数据管理技术, 计算机研究与发展.
[6] 吴吉义. 云计算:从概念到平台, 电信科学.