标题 | 科研机构自建机房的日常管理 |
范文 | 任竹 刘楠楠 鲁广宇 陈磊 摘要:计算机网络数据机房是企事业单位信息数据汇集、转发的重要场所。企事业单位的协同办公系统、财务系统、互联网链接等重要系统的服务器交换设备都集中在机房,所以对计算机机房的稳定性、可靠性、安全性要求较高。本文从科研机构自建机房多方面的日常管理经验给出安全管理方案。 关键词:科研机构 自建机房 日常管理 管理方案 中图分类号:TP308 文献标识码:A 机房又称为网络数据中心、数据处理和交换中心。机房里通常放置各类服务器、核心交换机、网络安全设备等,机房的温度、湿度以及防水防潮、防静电、防火、防雷、防鼠害等措施都有严格的管理要求,非专业工作人员一般不能进入,机房里的刀片服务器运行着诸多核心业务和其它通信业务、互联网接入等。由此可见机房对企事业单位信息化建设的重要性。一旦电力系统、网络系统、服务器、空调系统等设备出现故障,都会造成业务终端不能正常访问,造成的损失是不可估计的。本文针对科研机构自建机房的日常管理进行了相关探讨。 1 机房关键活动的授权和审批制度 外来人员出入机房必须预先报机房管理员,得到批准方可进入施工,出入情况和工作内容由机房管理员记录在案。外来人员需在机房相关责任人的陪同下进入机房工作,离开时由陪同人员登记离开时间。外来人员进入机房时,除必要工具外,不得带入与工作无关的物品。未经机房负责领导同意,任何单位和个人不得擅自移动、拆卸、带出或带入设备,如需进行有关施工,必须经领导同意后方可实施,实施时责任人应在场。 严禁无关人员和手续不全者接触机房相关设备。设备维护必须由相关系统维保单位专业人员实施并保留操作记录。设备登录和配置密码,由网络管理员保管,不得向无关人员泄露。 新购设备或临时迁入机房的设备需经机房管理员确认,按《设备迁入(出)机房登记表》的相关要求详细填写登记。 2 机房日常管理 2.1机房远程监控巡检 机房管理人员要定期登陆机房动力环境监控设备,远程实时查看数据中心机房内部环境和设备运转信息,主要包括机房环境参数、设备运行参数、设备状态指示灯、视频监控图像,精密空调、UPS不间断电源、消防等设备的运转情况,值班人员每天做一次监控情况记录。 2.2机房日常监控巡检 机房每日至少巡检一次,控制合适的温、湿度,保证稳定的电力供应,保持环境整洁,清除废弃物品及易燃易爆物。机房环境温度应控制在20℃ ~24℃,湿度控制在40% ~ 60%。做好机房各类设施、设备的维护工作,工作内容要有记录。具体维护如下内容。 机房IT设备维护管理:计算机服务器(包括刀片服务器及数据存储、备份服务器等);网络设备(核心交换机、光纤转换器、网络安全设备等)。 机房监控设备维护管理:机房动力环境监控平台、温湿度监测设备、门禁安防设备、视频监控设备等。 机房空调与配电设备维护管理:精密空调室内主机和室外风扇设备、新风系统、UPS电池柜组、主配电柜等。 机房消防设备维护管理:烟雾热感探测器、消防报警控制管理设备、七氟丙烷灭火罐体等。 机房水、电路及照明维护管理:水、电路管线及接口的检查维护,应急照明设备维护等。 机房基础维护管理:机柜桥架线路的收纳捆扎整理、设备标签检查更换,机房门窗、防火地板、防火棉、墙面、吊顶及相关配套设施的维护管理等。 2.3机房系统维保单位维护管理 相关系统维保单位在日常维护和例行巡检过程中需要检查、维护机房环境情况和系统运行情况,包括清除机房内垃圾积灰、报废物品;对相关设备、线缆进行卫生保洁和整理;对系统的运行状况进行分析;对配置信息收集和更新;更换易耗件;更新标贴和机柜布置图等。维护和巡检完成后由机房管理员审核并确认结果。此项工作完成情况需作为考核维保单位工作质量的标准之一。 2.4机房设备日常管理 应统一将IT设备编号、操作系统、应用系统、负责人、IP地址、出厂序号、切换器编号等信息以标签方式张贴在服务器前面板明显位置,未经许可,任何人不得撕毁、篡改。 刀片服务器、核心交换机、防火墙等设备是机房的重要IT设备,必须按规定放置在机房指定机柜机架内,不得擅自更改配置、移动、更换。设备物理位置一经确定,不得随意变更。如需变更,经网络中心负责人(管理员)确认后方可变更。 对IT设备必须建立维护档案,机房管理员是维护档案的第一责任人,项目开发人员、安全服务人员、机房运维人员、值班人员对机房内部设备的任何更改操作均要报机房管理员进行记录。机房管理员对日常的设备调试操作以及设备所发生的故障、处理过程和结果等做好详细登记。严格按照相关规定处理故障,及时与上级管理人员沟通,并对有关故障做出书面报告。 3 网络安全管理 3.1网络接入控制 各部门对涉及到网络变更方面的需求(如网络结构变更)、终端网络需求变更(如Hub、路由器的接入)、非常规性网络访问(如外来人员临时性访问),需向机房管理部门提出书面申请,经确认后方可进行操作。无线网络由网络中心统一管理,统一分配地址段和覆盖区域,设定外来访客账号。 网络中心负责网络与其他外部单位网络的安全防护,在网络边界处采取安全措施进行有效隔离防护,并对违规行为进行检查和阻断。网络中心负责网络的VLAN和安全域划分,不同业务应用系统尽量安排在不同的安全域中,各VLAN和安全域间应采取有效的访问控制措施。网络中心对网络设备、网络设备之间的连接线缆进行标识,重要网络端口也须进行详细标识。应保证所有与外部系统的连接均得到授权和批准。 3.2信息网络安全审计 网络中心采取开启网络设备日志,记录与网络安全相关的操作与活动,定期分析并对结果进行记录。日志保存时间应至少保证在一个月以上。网络中心在网络关键位置采取网络日志审计手段,对网络访问操作行为进行记录,对安全风險访问采取限制手段,定期对记录进行分析并对结果进行记录。 3.3网络安全检查和防范 网络中心制定详细的网络检查项目,负责进行网络系统运行的日常检查工作,将检查结果进行记录。网络中心定期对网络设备配置进行检查和升级,确保网络配置与安全策略保持一致,并对检查结果进行记录。定期对网络设备、业务系统进行漏洞扫描,对发现的网络安全漏洞进行及时的修补更新。制定网络访问控制策略,启用上网行为管理安全设备,并做好相应风险管控。根据业务、管理等情况,对不同的部门接入进行划分。对于外部访问内部网络,规定各部门使用VPN软件进行接入访问。如有部门需要接入网络,由网络中心审核开通,确保网络用户的访问权限符合网络访问控制策略。 4 网络和信息安全应急预案 4.1网络与信息安全事件分类 根据网络与信息安全事件发生的起因、表现和结果,主要分为有害程序事件、网络攻击事件、信息破坏安全事件、设备设施故障和灾害性事件五类。可能造成的后果是设备损坏、业务中断、系统宕机、网络瘫痪、信息破坏等。 4.2网络与信息安全事件的预防和通报 网络中心应根据事件发生可能造成的危害、损失,组织制定不同级别的应急预案,并对应急预案的可靠性进行评价。应急预案应当受控和备案,并发放至直接相关层次和岗位,保存相关记录。应急预案应定期进行演练和培训,必要时组织修订。 突发事件具有突發性、不可预测性和紧急性,信息系统及运行环境遇突发事件时应及时通报,可通过电话、短信、邮箱等通知形式,向网络中心负责人及时通报,提高突发事件的预警管理水平。 业务系统恢复正常后,网络中心通过纸质“事故报告”方式将突发事件上报上级信息化管理领导小组及相关业务部门。 4.3网络与信息安全事件的应对 事件发生时,网络中心应立即启动应急预案或采取有效措施,组织相关人员全力而有序地组织抢救抢修,防止事件扩大,消除各种危险,尽快恢复系统或设备故障,将损失减到最低程度。 相关人员应在事发或接到事发报告后尽快到达事发现场,开展事件处理工作。发生重大网络信息安全事件时,应当迅速进行现场处理或者请求其他技术力量支援进行应急处理,同时尽可能保存好原始证据,保护好事发现场;若涉及违法犯罪的,还应当同时依法报告公安、安全等相关部门。 在应急处理过程中,应当采取书面记录、系统截屏、文件日志备份和视频设备拍摄记录等多种手段,对应急处理的过程和处理结果进行详细记录存档。 4.4网络与信息安全事件的事后处理 对于信息安全事件,在故障排除或采取必要措施后,网络中心应做出事故报告,存档备案。必要时可邀请托维护单位以外有能力的机构做出技术鉴定。 网络技术中心应在事后了解事件发生经过,收集相关资料,查明事件发生的原因、危害程度及造成的损失等情况,检查预防和控制事件发生的措施以及事件发生后应急预案是否得当并得到落实,确定事件的级别和性质,查明相关责任并提出处理建议,提出防止类似事件再次发生的措施和建议。 5 结束语 信息化是企事业单位办公的发展趋势,计算机网络数据机房是办公信息化的核心场所,是信息数据汇集、转发的核心。所以机房管理工作是重中之重,一旦电力系统、网络系统、服务器等发生故障,都会对日常工作造成影响。本文对科研机构自建机房的日常管理做出了相关探讨,总结了一些管理经验,如建立机房关键活动的授权和审批制度,未经允许,无关人员禁止入内;加强机房的远程监控管理和日常巡查工作,及时了解机房的环境和设备的运行情况;加强网络安全管理,提高自建机房网络安全性;建立机房设备管理责任制,明确相关人员的职责;制定网络和信息安全应急预案,加强应急处理能力,提高自建机房管理水平,确保机房稳定运行,保证科研机构办公信息化系统的稳定。 参考文献: [1] 程小丹,李崇辉,曹洁,等.从运维菜鸟到大咖,你还有多远:数据中心设施运维指南[M].北京:电子工业出版社,2018. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。