医院信息机房搬迁的实施与经验总结

    盛国昕 阿尔达克·吾拉力别克

    根据各医院的发展现状来看,信息系统在医院的应用越来越复杂,医院业务对信息系统的依赖程度也越来越高,我院也不例外,随着现代科技技术的不断完善,为了顺应时代的发展,更好的人民大众服务,所以本院趁着搬迁的这个机会,对新机房的构建有了一个全新的规划,建设新的模块化机房,统一网络规划,完善医院自身信息系统的架构,为医院信息系统未来的容灾、备份、信息安全、身份管理、远程维护等奠定坚实基础,从而更有力地支持医院医疗业务的进一步发展。

    一、机房搬迁前的准备工作

    机房搬迁工作开始前,由医院分管医疗业务的副院长召集各相关部门组成机房搬迁项目组,并召开专题会议,明确各部门分工,相关责任人明确具体职责,每名工作人员对整个机房设备及搬迁业务要求熟悉,组织多次讨论分析,预想出可能出现的各种风险情况,制定相关应急补救措施。为保证机房搬迁的平稳、可靠,在机房搬迁前一天召开机房搬迁工作会议,具体落实和确定涉及的网络设备、服务器设备、综合前端、通用网关、集中存储、数据库、业务软件等相关设备的搬迁要求和计划。确定搬迁前最终方案。

    二、机房搬迁步骤

    (一)新机房的建设

    此次机房搬迁需要将旧机房从老医疗楼搬迁至新医疗楼内一层新建机房。新机房环境保证了温度、湿度、防尘、静电防护、接地、布线及外部各环境符合《电子信息系统机房设计规范》(GB 50174)及 B 级电子信息系统机房的有关规定,并完成必要的防鼠、防虫等措施。动力系统严格按照医院信息机房建设要求:

    1.应接入两路外电,其中一路宜为专线;当一路外电发生故障时,另一路外电不应同时受到损坏。

    2.总负荷供电应设两个以上引自不同变压器的独立低压回路,单母线分段供电并具备自动或手动互投功能;重要服务器、存储和核心交换机等负荷应采用 UPS 供电,UPS 电池组后备时间应满足实际负荷工作 30 分钟以上;应配置自备电源或与供电部门签订应急供电协议,自备电源应在外电中断后 20 分钟内启用,保证主要负荷、机房空调等相关负荷持续运行;主服务器、备用服务器及存储设备应分别接入不同的供电回路,进行安装调测。

    新机房采用空调下送风模式,有源与无源区域分开,强电与弱电分离等手段以保障机房的安全。

    (二)通信传输线路准备工作

    新机房在建设初期考虑后期医院业务增长及扩容,核心交换为一主一备,分别通过光纤与服务器相连,达到最高24口同时万兆数据传输需求;搬迁前对网络进行详细测试,与建设图纸比对,若发现存在丢包或线路不同情况及时进行线路检修,并将核心交换与服务器对接的光纤进行标记检查,确保线路通,标记对。

    (三)搬迁设备准备工作

    此次搬迁需要搬迁主服务器、备用服务器、各业务服务器、存储设备共计100余件,对所有设备进行编号,绘制图纸,提前规划各个服务器、网络设备、存储设备、UPS设备等机房设备在新机房的摆放位置,确定相关的辅助设备配件等,在搬迁之前做出相应的表格记录文档。并对所有设备和设备上的线缆进行统一标识。并填入登记表中,提前将综合布线的数据信息打在每一个接头上。反复检查资料完整性,并且可多人多次进行复查,一定要保证准确无误。

    (四)数据备份

    机房工作人员首先要对各服务器存储的所有数据进行一次重新再备份。并且要多次验证所备份内容真实有效。备份数据尽量要使用多种介质进行多份备份。以保证所有数据绝对安全。

    (五)搬迁过程

    在前期工作准备充分并检查无误,即选定周末夜晚数据业务较少时间进行搬迁,我院搬迁时间定为周六凌晨0点开始作业。

    搬迁将严格按照计划进度表的时间来确定设备的拆卸时间和顺序,严格遵守规范化操作,保证设备没有物理性的损坏。在对设备进行统一的标记后,才能进行各种线缆和设备的拆除。要严格按照设备拆卸的操作步骤进行。

    在设备下架、設备打包、设备运输、设备上架的过程中要采取轻拿轻放等措施尽量将设备因搬迁造成损坏的可能性降到最低,高度重视设备打包,设备打包可以降低设备在搬迁过程因震动而造成损坏的可能性。为了加快网络恢复的时间,可以考虑分批次进行设备搬迁,同时要合理安排人力,配合分批次进行搬迁的各个工作项目。可以考虑分以下批次:主服务器,核心交换,主要业务系统服务器,次要业务系统服务器。

    若设备加电,测试电源电压正常,进行加电后系统的软硬件检查,数据检查。要进行的工作大致包括如下的几项:

    1.服务器状态的恢复,查看是否出现了数据的丢失或损坏。这里由于我们之前对系统数据作了备份,所以,一旦出现了这种数据的损坏等,我们应该把搬迁前的数据重新恢复过来。

    2.进行设备网络连通性的测试。搬迁后网络检查可对照搬迁前通过同样命令收集的网络信息进行检查;使用常见的工具如ping、traceroute等工具进行故障定位排除,对于TCP端口的通讯问题可以使用telnet进行简单测试;配合各个业务系统进行业务恢复的网络部分测试。

    3.进行应用测试,确保系统的正常运行。科学的信息机房搬迁工作是全面保证综合信息系统的完整性、连续性。通过较短的时间便可将处于生产运行状态的重要IT设备由原机房细心拆除并迅速转移、安装于新机房。

    在确定各个系统、各项业务运行正常后,我们再整理机房线缆,完成设备标签,做好业务资料更新、整理。

    三、机房搬迁应急预案

    在严格按照搬迁实施步骤进行机房搬迁的同时,为防止搬迁过程中遇到紧急突发情况,我们制订了机房搬迁应急预案,在必要时候启动应急预案,以保障问题的快速和有效解决,确保各系统及网络运行稳定。

    (一)风险分析

    1.因网络为新建网络,可能存在网络不通或丢包严重等现象,造成无法正常傳输业务数据。

    2.设备长期使用,且使用年限已久,在正常断电后设备不能正常启动,造成业务无法恢复。

    3.本次搬迁为冬季搬迁,在搬迁过程中,由于振动、抖动等不可预计因素可能对设备产生意外损坏,从而造成设备搬迁就位后无法使用。

    (二)回避风险措施

    1.风险分离,搬迁采用分阶段、分系统、模块化搬迁。

    2.在搬迁前,对当晚需搬迁的设备再次进行核查确认。如有故障,先处理故障再进行搬迁。

    3.统一指挥,搬迁现场所有参与人员听从总指挥,避免搬迁现场的混乱。

    4.替代式搬迁的设备在搬迁前提前安装测试完毕。

    (三)应急处理

    在系统搬迁后出现异常情况时,现场技术人员立即检查设备,与各负责人配合检查故障,确认故障位置。

    1.主服务器系统在搬迁当日凌晨 5:00 前无法恢复,应尽快完成系统回退,避免系统由于搬迁无法恢复而导致其他系统无法恢复。

    2.设备硬件故障,在有备件的情况下,立即更换。

    3.部分设备没有备件的,通过其他有类似功能的设备暂时替代,先保证业务恢复,待拿到新备件后再进行业务割接。

    四、结语

    医院信息机房搬迁时间为夜间作业,由于工作量大、强度高且又是通宵工作,实施人员长时间处于疲劳工作的状态,反应迟钝,特别到凌晨四点以后更加明显,很容易出错。目前使用替代式搬迁和迁移式搬迁结合的方式比较适合现阶段医院信息机房搬迁。替代式搬迁既保障了医院业务正常开展,又大大减少业务中断时长,有效降低搬迁出错率,且替换下的设备可以在其他新建机房搬迁中继续使用;夜间可停止业务的设备采用迁移式搬迁,这样在不影响诊疗业务开展的情况下节省了因搬迁重新购置替换设备的成本,减少了搬迁的费用。机房搬迁项目是一项大工程,涉及医院业务的发展,而且搬迁过程中要求业务的中断时长尽量短。因此,搬迁前的准备工作是关键,要充分考虑到各个环节的细节,实施过程中严格按照搬迁方案进行,同时制定相应的应急方案,保证机房搬迁工作能顺利完成。(作者单位:解放军第949医院)