一种高可靠集群在档案数字化管理中的应用
王越+孟粉霞+郑江玲
摘 要:为提高西北核技术研究所档案数字化管理和服务的高可靠性,研究分析集群及其关键技术原理,提出一种运用集群模式规划基于OA平台的档案数字化管理系统的架构, 采用集群热备及镜像关键技术提高系统和数据的冗余能力。应用实例验证了体系架构在实际应用中的安全性、可靠性及有效性,对今后内部应用服务的可靠性设计有一定的参考价值。
关键词:集群技术;档案管理;OA平台
1 引言
目前,信息系统在日常办公和业务信息管理中的重要性不断加强,同时,信息安全等级保护规范针对涉密信息系统提出更高的要求,如要求应用服务器和数据库服务器分离,系统需要有不间断服务和容灾的能力等[1]。如何提高安全性和可靠性,保证信息系统的高可用性,是目前信息化系统建设中的主要问题之一。
由于本单位在线归档数量较多,均通过流程审批校验归档及时处理和查阅,要求在线服务不能间断,且档案的存储安全级别较高,需要有完善的机制保证系统高可靠性和数据的安全性。
本文探讨了双机热备及冗余技术,重点阐述集群的概念和实现方法,特别针对西北核技术研究所数字化档案在线管理具体应用环境下的设计和实现方法。
2 需求分析和集群技术
档案管理系统基于OA平台开发,办公流程和业务管理系统依靠OA开发平台的智能代码产生,而应用服务不间断、数据可靠性、涉密资源的保护十分重要,所以方案设计重点考虑系统的稳定性和数据存储安全性。
档案资料定位为涉密内容,而涉密信息系统要求Web应用服务器和数据库服务器相互分离,并且采用双台Web、双台数据库服务器的热备配置,而且为保证应用服务不间断,每对服务器向外提供虚拟IP,相互之间采用监控应用服务和心跳线的方法进行监控系统和应用程序的运行状态。其次,要求服务器之间的切换不能影响数据的实时存储,而且数据存储应该保证可靠性和冗余性。
根据需求分析,重点在实现实时切换和数据存储之间相互关系。目前,较为流行的实现方式应该为集群模式。集群( Cluster)是指一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。集群中的服务器(或称节点服务器)不管从物理上讲,还是从程序上讲都是彼此相连的,均通过响应客户端请求时协调通信,重要的是节点服务器可以在硬件或应用程序出现故障时提供冗余操作。因此,应用集群增强了信息系统应用服务器及存储的可用性、可伸缩性和可管理性。
传统双机热备模式通常需要开发程序在不同的服务器之间手动或自动切换,本地有自己的应用程序或数据库,切换时需要人工进行程序更新或数据库同步,加之需要虚拟IP和程序切换,导致应用服务切换时数据一致性程度不高或切换间隔较长[2]。
集群技术目前通常采用封装软件HA(High Availability,高可用性)实现。相比传统的双机热备模式,其集成了虚拟IP、监控心跳和应用、磁盘阵列柜等双机热备要素。集群中每台服务器的操作系统存储在其各自的本地储存空间上,本机运行计算,成为节点服务器,所有节点服务器运行的服务均可以以虚拟IP地址提供服务,多台节点服务器拥有共享数据存储空间,保存应用程序及数据。任何服务器运行应用程序时,应用数据被存储在共享的数据空间内,保证节点任何时刻的应用和存储数据一致[3]。
3 高可用服务器集群设计
根据以上需求和技术路线分析,档案数字化管理系统采用集群方式进行设计。该方案的双机与磁盘阵列柜互联结构不采用内存镜像技术,可以有效避免由于应用程序自身的缺陷导致系统全部宕机,同时由于所有的数据实时存贮在镜像磁盘阵列柜中,当监控到主服务器节点出现故障时,备份节点接替任务,直接从镜像磁盘阵列中读取数据,所以不会产生数据不同步的问题,不需要网络镜像同步,因此这种集群方案服务器的性能要比镜像服务器结构高出很多[3]。
其中节点服务器只安装应用系统,数据都保存在磁盘阵列的镜像分区内。为避免当磁盘阵列柜出现逻辑或物理故障时,所有存贮的数据会全部丢失,将磁盘阵列通过RAID技术配置为分区并相互镜像的模式:通过磁盘阵列控制卡将阵列柜中的硬盘配置成为逻辑盘阵,根据数据存储量需要将磁盘阵列分为两个逻辑分区(A分区和B分区),将A分区分给Web服务器操作系统,将B分区分给数据库服务器,在服务器系统分区直接指向磁盘阵列,保证主机节点和备机节点根据任务切换时,准确指向自己的分区,同时,两台存储阵列配置成相互镜像的存储空间。集群体系设计结构图如图1所示。
集群发布虚拟IP地址,并将该IP地址连接转移到主服务器实际物理IP地址。 如主服务器发生故障, 虚拟IP的连接将转移到备服务器上, 因此任意一台服务器故障都不会导致连接虚拟IP地址的失效, 实现了从主服务器到备服务器切换不影响用户访问[4]。集群服务器节点之间通过串口进行通讯,程序实现逻辑主要有两部分:监控和切换。
程序首先进入基于串口的心跳信号的循环监视。此时,程序处于活跃状态,每隔指定的时间从串口读入数据,如果读取成功,则进入下一次循环,如果不成功,程序先检测主备服务器之间的网络连接状况,串口链路出现故障,可以执行切换程序;在备服务器连续监测到指定数量的来自主服务器的接管请求,则删除备服务器上绑定的虚拟IP,之后通知主服务器可以接管服务,并由结束过渡状态进入活跃状态。
通过热备切换和数据镜像存储的冗余设计,节点服务器的热备切换都不会影响用户访问的数据,保证节点切换时间短、数据一致性,进而提高数据和应用服务的安全性。
4 实现效果分析
在系统实施中,充分利用已有信息安全管理体系,使档案在线管理系统符合涉密计算机系统联网的保密要求:将开发的档案在线管理系统服务器部署在防火墙和认证网关之后,利用信息安全管理体系集中完成用户身份认证、访问控制以及网络加密传输。
各热备子系统的服务器通过心跳信号、HBA与光纤网络交换机连接成内部网,以SAN方式完成服务器和磁盘阵列相连,在各自系统上建立具有容错功能的共享磁盘。集群的心跳信号和内部网用于数据交换,各节点服务器通过内部局域网相互通讯,不影响服务器和用户访问之间的数据流通,不占用服务器和客户机、服务器与磁盘阵列的通信资源,降低服务器节点的网络负荷,大大提高了利用率。实现的集群结构图如图2所示。
相比传统的双机热备方法,集群技术有效保证两方面的可靠性,即应用服务和数据的安全性。集群技术通过冗余设计,将故障点任务分散到内部其他节点上,有效保证整个系统应用服务的稳定性;通过数据在磁盘阵列上镜像的方式,保证数据在任意节点切换时数据的一致性。
形成统一基础数据之后,需要建立数据应用的安全管理和备份恢复机制,通过定时备份任务将镜像磁盘的重要数据定时备份在其他分区。数据的集中管理也考虑了三员管理、日志审计和数据加密存储的安全管理策略,符合系统安全等级评估的要求。
5 结语
本方案在设计和实现过程中,充分考虑了系统现有需求和可持续发展能力。该系统在西北核技术研究所运行两年以来,大大提高了归档的数量和质量,且热备切换和数据存储管理均不需要人工干预,不但提高系统稳定性和可用性,也减少管理和数据备份的复杂度。
目前,系统还存在的不足是,系统没有应用负载均衡(LB)机制。在大量并发访问时期,如果能利用上备份节点资源应该更加完善。同时,应该考虑远程异地备份策略,以进一步提高数据的安全级别[5]。