园区网的灾备和优化研究
钟文基
摘 要:随着企业信息化程度的提高,对信息化系统的依赖也越来越大,数据安全也显得至关重要,作为数据和业务保护的最后屏障,园区网的容灾备份及优化建设迫在眉睫。文章对数据中心灾备系统的建设及优化进行了简单的分析和研究。
关键词:园区网;容灾备份;数据安全
随着信息化程度的加快,园区网的数据安全性和可靠性越来越受到重视,很多企业都建立了自己的数据中心,在中心机房对现有重要业务的数据和应用部署了高可靠服务,确保不会因为本地的软硬件或系统故障导致应用失效或数据丢失。但是,本地容灾方案无法解决因地震、洪水、火灾等灾害对系统和数据造成的破坏。仅依赖本地数据中心的数据备份和设备冗余是不够的,如果数据中心出现区域性灾难,将对系统造成的重大影响。据互联网数据中心(Internet Data Center, IDC)统计,美国在2000年以前的10年间发生过灾难的公司中,有55%当时倒闭,剩下的45%中,因为数据丢失,有29%也在两年内倒闭,生存下来的仅占16%。因此应该采用本地备份和异地应用容灾相结合的保护措施,确保数据中心即使遭遇整体性故障,容灾备份中心能在很短的时间内恢复数据和接管服务,确保业务的整体高可用性。
1 灾备中心概述
一般意义上,备份指的是本地的数据或系统备份,通常指在数据中心内,将全部或部分数据从应用主机的硬盘或阵列复制到其他存储介质的过程,备份时是容灾的基础;容灾指的是在相隔较远的异地,建立两套或多套功能相同的It系统,相互进行健康状态监视和功能切换,当一处系统发生意外,例如地震、火灾的时候,整个应用系统切换到另一处,保证系统功能的正常运行。要达到真正意义上的灾备是将容灾与备份相结合,本地备份结合远程数据复制实现完善的数据保护。灾备中心的关键指标主要有两个:数据恢复时间点和应用恢复时间,如图1所示。
数据恢复时间点以数据为出发点,指灾难发生后,系统和数据必须恢复到得时间点要求,主要衡量能够容忍的数据丢失量,数值越小表明丢失的数据越少;应用恢复时间主要以应用为出发点,指的是灾难发生后,信息系统或业务功能从停顿到必须恢复得时间要求,主要衡量能够容忍的应用系统恢复时间段,数值越小表明业务中断时间越小。
2 灾备系统组成
容灾中心系统包括网络容灾和应用、数据的容灾。
2.1 网络容灾
容灾机房的建设要充分考虑系统整体网络结构和配置的容错和容灾能力,通过采取全面的容灾部署,来满足业务系统的稳定性、有效性及不间断的需求。通过在数据中心配置路由器、交换机、防火墙,能实现在單一链路失效的情况下实现备份链路的网络畅通。
2.2 应用、数据的容灾
应用、数据的容灾基于磁盘的数据复制技术来实现。磁盘的数据复制技术指的是主备系统的磁盘系统通过磁盘镜像技术进行数据复制。系统需要把主数据中心的数据复制到备份数据中心。一般来讲,物理级数据复制技术包括两种方式:同步方式以及异步方式。
3 灾备方案设计
3.1 同城灾备
对于建筑物灾难,如建筑物内外部火灾、机房内部火灾、长时间停电、光缆中断等,采用应用级的同城异地容灾系统,是比较理想的防范手段。容灾备份系统由于生产中心与容灾中心同在同一城市内,数据复制的距离不是很远(在10~30公里之内),采用同步数据复制方式,能保证数据的零丢失,同时为了保证主要核心业务系统能最快的得到接管。容灾技术对于业务性能的影响也可以降低到最低(5%之内),能对业务影响程度和数据的保护程度达到最佳。
为了确保数据中心出现紧急事件(如大面积停电、自然灾害等)发生时,确保所有业务能第一时间切换到容灾中心,必须确保数据中心和容灾中心的数据实时的同步,而且确保这些数据能被容灾中心的业务在很短的时间内使用,只有这样,切换到容灾中心的客户端连接才可以正常地处理业务。
3.2 异地灾备
对于区域性灾难,机房所在区域或有紧密联系的地区交通、电信、能源及其他关键基础设施遭到严重破坏,或大规模人口疏散的事件发生,例如地震、大规模卫生事件、恐怖袭击、电网故障等,异地灾备是较为理想的选择。异地灾备设计,服务器之间采用3层互联,存储采用同步数字体系(Synchronous Digital Hierarchy,SDH)专线或 IP/MPLS专线互联,FC/IP SAN定期远程复制数据,实现广域网应用级容灾,应用级保护,如图2所示。
3.3 灾备的优化
在灾备的优化设计中,通过高复制对比技术,基于内存时间戳的全增量数据复制技术,大大减少容灾数据量和容灾间隔时间,采用先进的数据压缩技术,提高压缩比,提升链路传输效率。灾备的设计优化国内有不少厂商做得比较好,例如华为,其ALL IN ONE容灾统一管理,实现生产中心和容灾中心的统一监控管理,使得容灾管理更简单高效。
[参考文献]
[1]邓裕东.灾备系统建设及运维[J].电力信息化,2011(11):44-46.
[2]郭可,王庆福.数据中心灾备系统建设研究[J].电子测试,2016(15):110,136.
[3]张艳.基于IP-SAN远程灾备系统结构研究[J].湖南人文科技学院学报,2011(5):138-141.