网站首页  词典首页

请输入您要查询的论文:

 

标题 新一代云计算模块化数据中心探讨
范文

    颜博艺

    [摘 要]近年来,随着信息化建设步伐不断加快,数据中心作为云计算及大数据分析的基础设施,呈现出高速化、大型化的发展趋势,传统数据中心的低效率、高能耗造成了极大的资源浪费,建设新一代的数据中心与数据中心的技术改革,已经成为当前工作的重中之重。本文重点分析了中国电力科学研究院清河院区、昌平院区新建的云计算模块化数据中心采用的新概念、技术亮点。

    [关键词]模块化;绿色节能;高效

    doi:10.3969/j.issn.1673 - 0194.2018.22.022

    [中图分类号]TP308;F270.7 [文献标识码]A [文章编号]1673-0194(2018)22-00-04

    0 引 言

    在数据中心基础设施的层面,其中模块化数据中心的优点还是比较突出的,比如安全系数高、高效节能等,已然成为数据中心发展的佼佼者。微模块数据中心将传统机房的机架、空调、消防、布线、配电、监控和照明等系统集成为一体化的产品,达到了高效运营、绿色节能的目的,能够实现系统的快速、灵活部署,缩短数据中心的建设周期,充分发挥了模块化设计的优势。数据中心的构成如图1所示。

    1 机房设计的思路及亮点

    1.1 设计思路

    针对中国电力科学研究院云计算数据中心机房的物理结构和IT设备的特点和要求,设计遵循下述指导思想和设计原则。①绿色环保,节能减排。遵循高效、节能、环保的要求,采取合理的基础设施系统,如UPS模块化N+X冗余、机柜的冷热通道布局等提高系统的运行效率。②可靠性。不但具备合理的冗余能力与灾难备份能力,同时还具备稳定工作与长期可靠的优势,还可以确保计算机应用系统稳定运行。③管理、维护方便。具有较强的集中式管理加分布式实施的可管理性逻辑,便于工作人员对环境及放置的设备进行集中管理,便于维护、维修。④可扩展性。各系统都具备灵活的系统扩容和升级能力。基础设施的设计要求可根据负载情况不断增加。⑤环保、节能、舒适性。使用国家认可的环保材料,设计方案要体现节能思想,保证工作人员拥有一个舒适的工作环境。

    1.2 机房模块化机柜系统

    模块化数据中心机房是新一代数据中心基础设施的解决方案,单机柜IT功率可达到2~10 kW,模块内机柜摆成两排,采用面对面的布局方案,形成冷通道。整个通道采用通道封闭系统,空调机组采用行级空调,位于机柜中间,向两侧的设备送风,可有效提高制冷的效率,方便维护。UPS机柜、电池柜、行级空调、机柜系统及冷通道封闭系统均为标准的模块化产品,可快速组建,灵活部署。

    中國电力科学研究院数据中心分为清河院区云计算数据中心和昌平院区云计算数据中心。清河院区云计算数据中心按目前使用需求,首期设计规划一号、二号机房安装8组模块化机柜,作为服务器区,三号机房安装46个布线机柜,作为网络配线区,设计容量5 kW。昌平院区云计算数据中心设计规划安装6组微模块机房,IT机柜50多个,其中1/3为高密机柜,设计容量为1 kW,主要为刀片机,2/3为低密机柜,设计容量5 kW。由于电池柜放置于模块化机房中所产生的酸性气体会对机房设备运行产生不利的影响,故本项目单独划分电池间用于放置电池,将电池与模块化机房隔离开。

    1.3 机房制冷系统

    数据中心能耗巨大,如何降低能耗、节能减排成为数据中心关注的焦点。在我国政府的“十一五”规划绿色数据中心的规划研究里已明确提出了节能降耗目标,并作为约束性指标。绿色数据中心作为下一代数据中心建设的主要核心理念,昌平区、清河区的云计算数据中心,在建设中引入绿色IT理念,以建设绿色节能机房为目标,在保证机房高效安全运行的前提下,采用多个节能方案,降低机房能耗,达到节能环保的目的。

    1.3.1 冷通道封闭系统设计

    模块化机房内机柜摆成两排,采用“面对面、背对背”式隔离交错排列,形成间隔的冷通道和热通道,冷热通道的规划使冷空气从机柜前面吸入,经过机柜和设备的内部运行后变成热空气,再从机柜背面排出。这种方法使冷热空气形成了更强的对流循环,增强了机柜冷却的效果。冷热通道设计有助于对相对集中的设备进行散热和促进整个数据中心机房的气流循环。

    整个通道采用通道封闭系统,模块化机房冷通道封闭技术是在机柜间或机柜内构建专门限于机柜设备制冷用的冷通道,并将冷通道与机房环境热气完全隔离,从而将冷空气限制在机柜中,避免了冷热空气混合,限制了冷气设备散热作用,改善了冷空气利用率,提高了机房的制冷效率和制冷效果。依据回风温度每提高1 ℃,空调制冷能力提高约5%,采用冷池技术的新数据中心空调制冷能力可提高约45%。根据PUE计算公式“PUE=数据中心总负载/IT设备负载”,并按空调占整个数据中心电力负载的38%计,则采用冷池技术后,数据中心仅空调一项就可将PUE值降低约9%。

    1.3.2 列间空调设计

    云计算中心机房采用列间空调作为机房冷源,高密度模块化机柜采用制冷量为35 kW的行间空调,低密度模块化机柜采用制冷量为25 kW的行间空调,每个模块机房列间空调数量按N+1冗余配置。列间空调通常放于服务器机柜列间,可以直接处理机房服务器机柜产生的热量,防止冷热风交汇,机房采用风冷式行间空调,风机采用EC风机,整机可以根据通道内的热负载调节制冷能力输出。

    列间机房空调采用紧贴热源设计,缩短了气流路径。冷风是采用从冷通道送风、后由热通道回风的水平送风方式,从而完全解决了冷热气流短路的问题,保障了服务器机柜温度均匀,消除了局部热点,进而增加了服务器运行的可靠性,同时有效降低了不必要的能耗。

    1.3.3 末端EC风机设计

    机房空调是计算机房的能耗大户,而在机房空调的各主要部件中,压缩机的能耗占较大比重,另外室内风机全年不间断运行,其能耗在空调的总能耗中占有较大的比重,存在较大的节能空间。所以降低计算机房能耗首先要从机房空调着手,尤其要从降低压缩机和风机能耗着手。末端EC风机设计如图3所示。

    EC电机高效节能:EC风机采用直流无刷技术、永磁同步电机配合后倾式风机,整体效率要比传统FC电机的风机高30%左右。EC风机无级变速特性:根据热负荷情况,通过芯片控制,EC风机可以调整转速,在低热负荷的情况下能耗极低。EC风机采用后倾式风机:比原有的前倾式风机效率高,能够有效提高送风效率。电科院的云计算数据中心机房全部采用变频EC风机,每个空调室多台空调自动联机联动,可实时根据机房内的温度自动变频运行。

    1.4 模块化UPS系统

    电科院的云计算数据中心采用模块化UPS主机的先进设计理念,该主机可根据客户的需求自由扩增,其中功率模为分别由20 kVA和25 kVA组成。高密度模块化机柜设计采用1台模块化UPS,每台配置6个25 kVA的UPS模块,采用5+1冗余设计;低密度模块化机柜设计采用1台模块化UPS,每台配置5个25 kVA的UPS模块,采用“4+1”冗余设计;(可方便扩充容量和单个模块热插拔维修,不影响机器正常运行,单台最大可扩充到150 kVA),采用“4+1”双机冗余设计适应数据中心不断发展的设备供电需求。

    模块化UPS与传统UPS在可靠性、综合投资的有效性、高效节能环保、可用性与扩容维护等几个方面均有明显的优势。模块化UPS系统是将UPS各部分功能完全以模块化实现的UPS产品,其具有如下特点。①系统主机由机架、功率模块、静态开关模块和监控模块等组件构成。②系统具有并联冗余、在线扩容的特性,并能构成系统双总线方案,完全取代传统UPS方案。③系统是一个“绿色、节能、环保”的電源方案,具有高输入功率因数、低谐波失真度、高效率、高可靠性和高稳定性的优点。④模块化UPS系统应采用符合行业标准的结构设计,对空间需求低,以模块为安装、扩容、维护单元,具备在线扩容、维护方便的特点,能够最大限度地提高系统的可靠性、可用性、安全性。

    1.5 机房电气系统

    电科院的云计算模块化数据中心采用精密配电列头柜设计方案,精密配电列头柜安装于模块化机柜内,是一款针对数据中心机房能源末端,综合采集所有能源数据的智能配电柜,为终端能源监测系统提供高精度的测量数据,通过显示单元实时反映电能质量数据。同时,云计算模块化数据中心通过数字通讯上载至后台环境控制系统,以有效管理整个配电系统的实时监控和运行质量,帮助用户优化网络数据中心,加强能耗管理,提高服务器机架运行效率,为实现全方位绿色IDC提供可靠保障。

    1.5.1 精密配电列柜规划

    (1)高密度冷池。①高密度冷池内的IT用电功率为:150 kW×1=150 kW(根据UPS功率推算)。②高低密度冷池内的精密空调用电功率为:20 kW×4=80 kW。③其他负荷按10 kW计算。④以上每个高密度冷池总功率为240 kW,配置总开关容量不小于400 A。

    (2)低密度冷池。①低密度冷池内的IT用电功率为:100 kW

    ×1=100 kW(根据UPS功率推算)。②低密度冷池内的精密空调用电功率为:15 kW×4=60 kW。③其他负荷按10 kW计算。④低密度冷池总功率为170 kW,配置总总开关容量不小于250 A。

    1.5.2 精密配电柜的功能特点

    (1)先进的报警功能。及时通过专业网关配合或者显示单元,第一时间将报警信息通过短信、邮件或声光报警的方法传达给管理者。在此之前,多层报警设置的作用主要是预防潜在的故障,提前做好准备措施,以防止失效对一些参数进行多层的报警设置保护。

    (2)完善的监控系统。配合温度传感器附件及时检测列头柜温度,在一定程度上完善供电系统的安全保障,同时精密配电柜也可配合漏电采集单元做好在线漏电监测工作,测量完整的电气状况,不但可以监测多条馈线回路与电源进线的电气参数,还可以为供电系统提供更好的管理条件与风险预测。

    (3)智能化系统监控。操作及电能管理更高效,让用户及时了解负载运行情况,并可实现监控每个PDU电源,多层报警设置预防潜在的电源故障,便于用户及早发现安全隐患,规避配电风险。报警全面,实现精密配电,减少用户因误操作引起的局部断电事故。系统本地可保存历史记录与故障信息,数据采集有较强的实时性,提供关键数据分析,便于用户分析故障原因。

    (4)高精度、宽量程。提供精确的计量数据的同时满足多方面需求,满足对机架式和刀片式服务器电源的监测,多种馈线CT量程选择将测量误差降到最低。

    (5)高性能、高集成化。良好的性能及高集成化产品,能够很好地保证设备运行更加稳定、安全,通过集中处理分支测量的方式提高产品的集成度高。电源监测采集装置尺寸小,可以在列头柜相对狭小的空间内自由安装,极大地提高柜内安装能力及整体运行的稳定性,更加方便用户进行后期维护。

    1.6 环境监控系统

    电科院的云数据中心环境监控系统除了传统的机房动力、环境及安防监控外,还具备能效管理及运维管理功能,管理平台采用网络数字技术,对各监控子系统信息数据进行集中监测,对设备进行集中管理。云数据中心环境监控系统通过客户端管理软件或IE浏览器,使获得授权的相关管理人员通过网络管理机房内的运行状况,系统加强了数据中心运维管理,提高了运维效率,降低了复杂性和风险,有利于数据中心能效可视化,为实现全方位绿色IDC提供可靠保障。

    1.6.1 环境监控

    机房环境监控系统包括机房动力、环境及安防的监控系统,主要监控对象包括温湿度、消防主机、精密空调、配电柜电量仪、开关、机房门禁和机房视频监控,能够实现7×24小时的全面集中监控和管理,保障机房环境及设备安全高效运行,以最大限度提高机房的可用率,并不断提高运营管理水平。平台告警方式包括电话拨号报警和短信报警。

    1.6.2 能效管理功能

    1.6.2.1 能耗实时展示

    机房环境监控系统可以通过计算与测量的办法,能够计算出每个关键测点的能耗值,从而能够更方便地掌握能效的实时变化状况。

    同时,展示的内容还包括:①能耗的各项分类情况、监测情况以及建筑的基本信息;②各个监测支路的逐时原始读数的列表;③各个监测支路的逐年能耗值和逐月、逐日情况;④相关能耗指标的表与图。能耗实时展示如图4所示。

    1.6.2.2 能耗统计分析

    能耗报表:通过能耗统计监测,提供精细到机架上每个设备对应的PDU端口在不同时期的耗电量列表,对比分析出低效、高功耗的设备,以优化设备布局,降低能耗,并为IT设备购买提供决策支持。能耗分布状况分析图表:可以显现出总耗电量、IT设备耗电量和其他设备耗电量的分布和变化情况,了解能耗分布是否合理,能耗分布的发展趋势状况。趋势报表:通过对能耗趋势报表(高峰时段与低谷时段、按不同季节)的分析,及时发现问题或能耗上升趋势,产生预/告警信息。

    1.6.2.3 PUE实时展示

    目前,如果想更科学地测量出数据中心的能耗指标,最适合的方法就是PUE,不但可以节能,并且可以详细了解数据中心的能耗情况,因此要实时监测数据中心的用电数值。

    1.6.2.4 PUE分析

    系统提供PUE趋势分析、对比分析图表展示及报表,可对比自定义目标参数及理想模型。

    1.6.2.5 趋势分析

    系统提供PUE值的记录与统计,并对趋势进行分析,呈现数据中心的运行状况。数据分析图表:PUE的测算分成楼层总PUE和分别记录机房单独的PUE值变化情况,生成机房/数据中心楼层的周、月、年PUE统计报表。趋势报表:通过对PUE趋势报表(高峰时段与低谷时段、按不同季节)的分析,及时发现问题或能耗上升趋势,产生预/告警信息。

    1.6.2.6 对标分析

    将实际数据与设定的当年各月或各时段各功能机房相对应的能耗及PUE目标值进行比较,以验核是否达标。确定可以提高能耗的业界同类最佳实践及平均值,建立持续改进目标,将实际相关能效及PUE指标与同类参考值(如标杆值、平均值等)进行比较(列表和图),经找出差距,探讨改进措施。图表的展现方法分为好几个方式,比如比较常用的如:区域图、分布图、线图、混合图等几种,因为图表展示也是数据展示的一个主要方法,它在表现手法上更显得简单易懂,可以直观地反映出统计数据的数值与采集的数据情况。

    1.6.3 运维管理功能

    系統的运维管理主要包括工单管理、排班管理、知识库管理和事件处理功能,这些功能共同为系统的应用功能提供支撑,使整个系统更加安全、高效地运行。

    (1)工单管理。工单管理是运维管理系统的重要组成部分,也是运维管理系统的核心。工单包括故障单、保养单、事件异常单、资产库存提醒单、库存备件提醒单、自定义任务单、资源低容量告警单和能效调节处理单8种工单。每一个工单模块都是相互独立的,记录各自的内容信息,有各自相应的工单流转规则。

    (2)排班管理。排班功能包括8个常用功能:基本排班、自动排班、排班换岗、排班查询、假期管理、休假/请假管理、值班事件规则设置和打印排班图表。系统根据管理人员作息时间选择排班日期段和需要排班的工作人员列表,自动排出岗位值班表。

    (3)知识库管理。知识库是指为方便和有效地使用与管理大量的知识而把人类已经具有的知识以一定的形式存储在计算机中所构建的系统。用户可将能效调节、故障处理等的处理方式、效果或经验集中在此平台上,为后续相似问题的处理分享经验,避免进入误区或者重复无效工作。知识库适用于知识积累型企业,可以有效地积累、管理和共享知识,成为企业提升核心竞争力的重要环节。

    2 结 语

    电科院的新一代云计算模块化数据中心在绿色节能、高效、可靠、运维可控4个方面较传统数据中心具有无可比拟的优势,在云时代数据中心趋向高密化的驱使下,模块化数据中心建设方式成为必然的选择。

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/2/6 11:46:54