网站首页  词典首页

请输入您要查询的论文:

 

标题 小议空管自研信息化系统的应急备份恢复
范文 黄传辉
【摘 要】目前空管自研信息化系统在管制部门中得到了广泛的应用,论文对空管自研信息化系统的运维现状进行了介绍,结合空管业务的运行情况对空管自研信息化系统应急备份恢复架构进行了探讨,分别分析了空管自研信息化系统应急备份恢复架构的异地容灾和应急备份恢复能力,最后对空管自研信息化系统应急备份恢复性能进行了评测解释。
【Abstract】At present, ATC self-developed information system has been widely used in the control department. This paper introduces the operation and maintenance status of ATC self-developed information system. Combined with the operation of ATC, the emergency backup recovery of ATC self-developed information system is discussed. Also the remote disaster-tolerant and emergency backup recovery capability of ATC self-developed information system are analyzed respectively. The performance of emergency backup recovery capability of ATC self-developed information system is evaluated and explained in the last chapter.
【关键词】空管自研信息化系统;应急备份;异地容灾
【Keywords】ATC self-developed information system; emergency backup; remote disaster-tolerant
【中图分类号】TP301 【文献标志码】A 【文章编号】1673-1069(2017)07-0142-02
1 引言
随着中国民航业的飞速发展,对空中交通指挥的安全性与效率提出了更高的要求。根据管制部门的不同需求,通过空管自主研发各类专用性强的信息化系统,能够进一步提高管制部门的运行效率,为相关的管制业务提供了可靠高效的技术支持。但是管制员的工作与各空管自研信息化系统的耦合程度越来越高,对现有系统安全、可靠运行带来了新的挑战。本文结合空管自研信息化系统的现状,探讨应对系统级故障等重大故障时提供有效的应急备份和系统恢复手段,从而确保系统应急处置的及时有效,为管制用户提供更优质的服务质量。
2 空管自研信息化系统运维现状
目前中南空管局已上线运行了多套空管自研信息化系统,管制部门对这些空管自研信息化系统的中断容忍时长较短,对空管自研信息化系统的运维保障提出了较高的要求。但目前各空管自研信息化系统之间的耦合程度较高,其系统内某一部分故障会影响其承载的所有信息系统的运行,且短期内也不具备配置完整独立备份系统的技术条件。此外,空管研发部门经常需要对某一在线的自研信息化系统进行软硬件升级、功能试用等工作,从而造成了运维部门与研发部门共同在在线系统上操作的现象将在较长时间内存在。在此背景下,迫切需要建立对各空管自研信息化系统的系统级、数据库级别的应急备份恢复机制。
3 空管自研信息化系统应急备份恢复架构
根据空管自研信息化系统的系统状况和业务承载情况,提出空管自研信息化系统应急备份恢复架构,如图1所示
目前中南空管局的各空管自研信息化系统基本通过刀框服务器运算集群和高性能光存储的硬件架构予以承载,在此硬件架构上通过虚拟化平台为各空管自研信息化系统提供虚拟化运算环境,从而为空管自研信息化系统的虚拟化服务器提供运算资源的支撑,同时通过高性能光存储为其数据存储提供存储能力的支撑。
各空管自研信息化系统的架构可以归纳为“3+2”结构,即3个数据库服务器和2个应用服务器的结构。其中数据库服务器通过微软的AlwaysOn技术,实现了数据库的高可用性[1]。此外,通过将主、备数据库实例和主用应用服务器部署在航管楼的刀框服务器运算集群,应急数据库实例和备用应用服务器部署在管制中心的刀框服务器运算集群中,实现了空管自研信息化系统的异地容灾。再者,通过部署专用的独立应急备份恢复服务器,并在高性能光存储等存储设备中设置虚拟化服务器和数据库的实时数据备份节点,构建起既能应付单个地点全部硬件设备故障的数据库级别的回滚应急架构,也能应对系统级故障的应急备份恢复架构。
4 空管自研信息化系统应急备份恢复性能评测
为了验证空管自研信息化系统应急备份恢复架构的恢复能力,结合现有系统的运行环境和业务承载情况,进行了完备的性能评测,其评测项目如下:①备份与恢复设备独立于生产系统,在生产系统发生灾难时能够迅速恢复,支撑业务系统。②数据可通过同步或者异步的方式,采用连续数据保护技术,从生产端复制到容灾端。③验证容灾端数据库的完整一致性。④测试验证目前空管自研信息化系统中采用的多种VMDK数据,哪些类型是可以受到有效保护的。⑤验证SQL Server、Oracle等数据库的兼容性。
圖2所示为空管自研信息化系统应急备份恢复性能评测的拓扑,采用EMC的VxRail超融合一体机和RP4VM软件搭配的解决方案。这一解决方案可以作为独立于现有生产环境的一份容灾与测试系统。对于使用Datastore的VMDK、非共享RDM的虚机,可以通过RP4VM实时同步或异步的方式,利用网络复制到作为容灾设备的VxRail超融合一体机上。其测试结果如下:①利用Test Copy方式,可以实现在容灾端的实时数据验证,也可将容灾端的虚拟机作为培训、测试等其它用途。②利用Fail Over方式,可以实现生产到容灾的切换。③无论那种方式,应用及数据库是与生产一致,并且保证数据的完整一致性。
经过测试评估,空管自研信息化系统应急备份恢复架构对VMware虚拟机的备份功能有显著优势,能对虚拟服务器的源文件进行消重后再进行备份,可显著提升备份速度,降低存储空间,单次备份其文件占用的存储空间仅有其他同类型应急备份恢复架构的25%。数据越大,已备份的虚拟服务器越多,备份速度及存储容量的相对优势就越明显。自2016年以来,空管自研信息化系统应急备份恢复架构已承担起各空管自研信息化系统的应急备份和系统恢复的角色,通过定期利用周期维护对各类在线虚拟机业务进行了备份配置和恢复测试,很好地证明了其有效性与可靠性。
5 结论
本文对空管自研信息化系统运维现状进行了简介,并以此为基础结合系统状况和业务承载情况,分析了空管自研信息化系统应急备份恢复架构,详细解释了其异地容灾性能和应急备份恢复性能。最后结合现有的空管自研信息化系统的运行环境和业务承载情况,对空管自研信息化系统应急备份恢复架构进行了功能性和兼容性测试,并就测试结果进行了解释说明,为今后进一步提升空管自研信息化系统的运维保障水平,提供了一定的探索方向和理论支持。
【参考文献】
【1】Microsoft Crop. Overview of Always On Availability Groups (SQL Server) [EB/OL].2016-5-17. https://docs.microsoft.com/zh-cn/sql/database-engine/availability-groups/windows/overview-of-always-on-availability-groups-sql-server.
随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/2/10 23:26:45