标题 | 数据中心IaaS层云化架构设计和应用研究 |
范文 | 杜有翔 付渲理 明丽洪
[摘 要]本文根据大部分数据中心IaaS层的建设现状,分析其基础资源管理存在的问题,以此提出云化需求。从计算、存储、网络3个层面来分析虚拟化技术在云化IaaS层中的应用,提出数据中心IaaS层云化架构的设想,并在基础资源虚拟化的基础上,搭建云管理平台,实现对异构的物理资源和虚拟化资源的统一规范和可视化管理,分析数据中心云化IaaS的应用成效。 [关键词]IaaS;虚拟化;云管理;智能运维;数据备份 doi:10.3969/j.issn.1673 - 0194.2019.24.027 [中图分类号]TP393.09[文献标识码]A[文章编号]1673-0194(2019)24-00-03 0 ? ? 引 言 云架构因高效的资源整合和运维、低功耗资源管理、低成本扩展、推动大数据融合分析等优势,已成为IT架构的整体发展趋势。从实现层面上来说,通常分为3个层次,自下而上分别是基础设施即服务(Infrastructure as a Service,IaaS)、平臺即服务(Platform as a Service,PaaS)、软件即服务(Software as a Service,SaaS)。其中,IaaS层是IT架构的基础层,也是实现云架构的核心所在,是PaaS和SaaS层的实际载体。本文基于目前大部分中心机房实际情况,从IaaS层分析数据中心云化的方式和应用前景。 1 ? ? 数据中心基础设施现状 目前,很多单位都有自己的数据中心,但大部分只是实现了所有硬件设备的集中摆放和连接,将林立的“烟囱”堆在了一起。即使采用了虚拟化平台,但数据中心没有一个统一的资源整合和运维平台,易造成硬件资源浪费,难以管理。从基础设施的使用来看,可以从以下两方面分析数据中心存在的问题。 1.1 ? 非虚拟化平台 ①旧设备改造的投入成本过高,且难以彻底改造;②部分新设备性能配置高,运行其上的业务未能充分利用设备资源,造成资源浪费;③物理设备一旦开机,能耗较为稳定(不包括制冷能耗),不会因利用率高低而产生较大的能耗变化,造成能源浪费;④部分业务应用系统为了降低建设初期投入,没有过多考虑高可用性和负载均衡。 1.2 ? 虚拟化平台 ①虚拟化平台相互之间是独立的,且应用范围不广,限制了其在资源节约上的优势;②未建设可实现资源自动按需分配的云管理平台,运维人力成本较高。因此,数据中心IaaS层云化的目标是最小化改造成本、提高硬件资源利用率、保证业务高可用和数据安全,实现资源管理自动化和运维智能化。 2 ? ? 虚拟化技术在数据中心的应用 虚拟化技术是所有IT“云”的基础,也是目前最有效的资源整合技术。通过利用虚拟化技术,在实现应用高可用性的同时,提高了设备的资源利用率,能以较低的建设和改造成本,降低数据中心的能耗。从功能上分,数据中心虚拟化技术主要包括3类:存储虚拟化、服务器虚拟化(计算资源虚拟化)和网络虚拟化。 2.1 ? 存储虚拟化 存储虚拟化是为了实现对物理存储资源的抽象、隐藏和隔离,提高设备利用率和可扩展性。可以将一个物理存储设备(卷)虚拟成多个逻辑存储卷,也可以将多个物理存储设备(卷)虚拟成一个逻辑存储卷,供上层的应用服务端调用,如图1所示。 存储虚拟化按实现位置可分为基于主机、基于存储设备和基于网络3类,比较结果如表1所示。 2.2 ? 服务器虚拟化 服务器虚拟化是将一台或多台利用率低的服务器通过虚拟化软件整合在一起,形成一个或多个计算资源池,为多个应用系统提供计算资源,又称为计算资源虚拟化。由于各虚拟机内部运行环境之间是相互独立的,且物理服务器如何为虚拟机提供计算资源,对于运行在其上应用系统来说也是完全透明的,因此,从效果上来看,各应用系统仍然各自“独占”一台物理服务器,如图2所示。 除了整合计算资源以外,以共享存储为前提,服务器虚拟化的一个重要作用还体现在对于运行其上的业务系统的一个连续性保护,主要通过虚拟化迁移、虚拟化平台的高可用、恢复自动化等技术实现。 2.3 ? 网络虚拟化 网络虚拟化可描述为将网络资源进行虚拟化整合和改造,在对用户透明的前提下,实现物理网络虚多、多虚功能,以达到提高物理网络设备利用率、简化物理网络的目的。在服务器虚拟化中,要运用网络虚拟化技术实现多个不同IP的虚拟机通过少量的物理网口对外连接,如图3所示。 数据中心的资源整合主要有3种实现方式:“服务器虚拟化+共享物理存储”“服务器虚拟化+存储虚拟化”、超融合架构。其中,超融合架构是将服务器虚拟化、存储虚拟化、网络虚拟化等虚拟化技术融合在一起的扁平化部署架构。但由于其存储和计算资源都是在同一台物理设备上,因此,如果要对任何一种资源进行单独扩容,为了保证平台整体性能,需要对每台物理设备进行同样的扩容改造,成本较高。因此,此架构适用于对计算、存储资源需求同步增长的应用。通过对常用应用系统(如门户、OA)的分析可知,服务端的计算资源需求量增长远不如存储资源。而特殊应用系统,如桌面云,计算资源需求的增长和存储资源需求的增长就有较强的关联性。比如,新增一个桌面云用户,不仅要为其分配磁盘空间(存储资源),还要为其分配CPU和内存(计算资源)。因此,通过上述虚拟化技术对比分析,对于数据中心中的通用应用系统,应通过重建、数据迁移、P2V等方式将其迁入“服务器虚拟化+基于网络的存储虚拟化”的虚拟化平台中,并将替换下的旧设备纳入虚拟化平台管理,进一步提高资源整合度和利用率,而对于桌面云等特殊应用系统可建设在超融合架构的虚拟化平台中。 3 ? ? 数据中心云管理平台的应用构想 在各虚拟化平台之上构建一个统一的运维管理云平台,接管数据中心所有硬件资源及其承载的虚拟化资源的监控、调度、分配等日常管理运维工作,屏蔽下层复杂的运行环境,简化运维人员操作,并通过可视化监控、统计分析报表、告警机制等功能为运维人员进行决策分析提供依据,完整的数据中心IaaS层云化架构,详见图4所示。 3.1 ? 基础资源管理自动化 对基础资源的管理包括对物理资源的管理和虚拟资源的管理。 3.3.1 ? 对物理资源的管理 要对物理设备在云化架构中的寿命进行全生命周期管理,主要包括以下几个方面。①设备自动发现:平台通过主动询问机制主动发现新入网设备,并将设备信息(如设备型号、IP地址、MAC地址)告知运维人员,由其决定是否将其纳入平台管理。②设备状态监控:定期监控设备运行状态,如开关机情况、温度、CPU和内存占用等,并根据既定的监控策略定时生成监控报表呈现给运维人员,一旦状态有异常,立即发出告警信息,实现日常巡检自动化。③设备移除:运维人员通过平台可将作废的设备移出管理范围,不再进行管理监控。 3.3.2 ? 对虚拟资源的管理 除了进行全生命周期管理,还应具有资源自动按需分配功能。即用户可在线发起虚拟资源申请,由相关管理人员审批通过后,平台自动按照用户需求为其分配虚拟计算、存储资源供其使用,一旦用户告知不再使用,或超过申请的使用期限,自动回收资源。 3.2 ? 基础资源运维智能化 基础资源运维智能化主要包括虚拟资源的智能化调度和故障的智能化处理。 3.2.1 ? 虚拟资源的智能化调度 要实现智能化调度,需要确定不同的优化目标以判断调度优劣,比如性能(响应速度)、服务质量、总成本控制(能耗低)等,并据此制定出合理的调度策略。此处应遵循以下3条资源调度原则。①确定好虚拟资源利用优先级的划分。在进行资源优化调度时,平台会优先考虑优先级靠前的虚拟机资源占用。一旦资源池中的资源匮乏时,平台会优先保证重要应用的资源占用,确保重要业务的连续性。②保持资源利用率的平衡。在虚拟化实践中,常常会因为资源利用率失衡导致资源不充分。如计算资源利用率很低,而存储资源利用率很高,导致新的应用无法迁入(存储资源不够),造成计算资源浪费,反之亦然。因此,在分配虚拟资源时,要充分考虑运行其上的应用对资源的要求。一旦出现失衡,要及时调整现有资源分配,改进原调度策略。如果无法通过调整实现,则需要对利用率较高的一方进行扩展(增加物理资源)。③处理好能耗与计算性能的关系。如果优化目标设定为成本控制(能耗低),则虚拟化平台会根据调度策略,在确保计算资源足够的情况下,将低利用率主机上的虚拟机迁至别的主机,然后休眠此主机,以降低能耗。但如果优化目标设定为性能,在各主机计算资源性能相同的前提下,尽量平均各台主机的资源利用率,以保证各个应用的资源占用和负载均衡。因此,需要根据具体的应用需求、物理主机性能、机房环境,制定合理的调度策略,控制虚拟机的迁移和资源的动态分配。 3.2.2 ? 故障的智能化处理 快速解决故障、提高用户体验,一直是运维人员面临的难题。①建立完善的预警机制。平台自动进行告警过滤、压缩,避免海量告警,只将关键告警通过消息发送给责任人。②建立业务级的运维视图,快速呈现业务与硬件设备、各业务系统之间的逻辑关系,实现故障快速定位,提高故障处理效率。③建立运维知识库。对运维流程进行梳理,制定故障判断和预处理策略。故障发生时,平台据此自动执行抓取故障日志,排查解决故障等操作,实现一般故障的自动化处理。对于需要技术人员处理的故障,平台自动通过消息告知运维技术人员。同时,平台自动关联知识库,协助技术人员处理。技术人员处理结束后处理方案自动转入,实现知识累积。 3.3 ? 数据云备份 在平台中融入灾备云管理,集中统一管理所有的容灾设备、数据备份恢复策略,实现对平台数据的持续性保护。 3.3.1 ? 保护应用系统数据 应用系统数据可分为操作系统、虚拟机、非结构化数据(文件)、数据库四大类。应根据数据类型和数据重要性的不同,制定不同的数据备份策略,确保故障发生后,数据不丢失或少丢失、业务可恢复。 3.3.2 ? 保护用户数据 用户可像申请虚拟计算、存儲资源一样,在线申请灾备资源,并自定义灾备策略,实现“自己灾备数据,自己管理”。 4 ? ? 结 语 在数据中心建立一套IaaS层云化架构,将所有的基础资源纳入统一的管理平台下,可实现基础资源的统一规范管理,有效提升数据中心的资源利用率和运维效率,降低数据中心的整体能耗和运维成本,可为数据中心的相关管理人员和部门提供足够的决策支撑。充分体现该架构的应用价值。 主要参考文献 [1][美]阿尔杰.大数据云计算时代数据中心经典案例赏析[M].曾少宁,译.北京:人民邮电出版社,2014. [2]戴元顺.云计算技术简述[J].信息通信技术,2010(2). [3]郑伟伟.IaaS云管理平台的设计与实现[D].北京:北京邮电大学,2012. [4]李乔,郑啸.云计算研究现状综述[J].计算机科学,2011(4). |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。