标题 | 网络与专业网管远程统管与排障方案分析 |
范文 | 欧阳钦 王宏斌 摘要:本文提出跨平台带外通信网管系统(SOCAN)解决方案,主要实现远程对网络及专业网管的单座席远程集中监控功能、远程实时查询功能和远程故障诊断与数据配置功能,有效地解决了原网管难统管和必须到现场排除故障的问题,极大地降低了维护成本,提高了维护效率,增强了系统的稳定性与可靠性,具有很高的实用价值。 关键词:带外通信;网管;SOCAN;远程访问;集中统管;故障排除 中图分类号:TP393.07 文献标识码:A DOI:10.3969/j.issn.1003-6970.2015.05.026 0 引言 随着网络技术的发展,以及信息化需求的增加,企业建成的IP网络系统或专业系统越来越大,也越来越多,一般每套系统都配置了相应设备厂家的专业网管系统。这种部署主要带来了三个方面的不足:一是由于各网管系统设备厂家、型号、接口定义各不相同,无法在一个网段内实时自动上报性能、告警数据,实现单一席位的统一集中管理,随着网管系统的增加,维护座席不断增加,机房空间、维护人员与成本自然也增加。二是由于目前绝大部分单位的专业网管均采用“带内”模式,网管信息与业务信息通过同一逻辑信道传送,一旦网管服务器、网络交换机、路由器、防火墙或专业设备(简称网管关键设备)等发生故障,就会影响专业网管的运行。三是由于现有的网络管理多采用“带内”系统,一旦出现设备级故障,很多情况下已经无法通过网络远程访问故障对象,维护人员必须到现场排查故障,排障时间受技术人员到达现场的响应速度影响,故障时间长,效率低下,特别是对于地处地形或气候条件不佳、出车又不方便的单位影响更大。 1 解决方案 1.1 实现原理 解决方案采用跨平台带外通信网管系统(SOCAN),SOCAN部署在单位内网上,如图1所示。在远端专业机房或网络机房部署串口交换机(cs)与键盘鼠标显示器交换机(KVMS),CS完成网络设备RS232标准格式数据与TCP/IP标准格式数据的加密转换通讯,KVMS完成专业网管服务器键盘、鼠标、显示器标准格式数据与TCP/IP标准格式数据的加密转换通讯,通过“带外”通道(网络管理控制信息与用户业务信息不在同一逻辑信道上传输)组网上传数据。远端机房的关键设备的串口通过CS接人单位内网,延伸至控制中心;网管服务器的键盘、鼠标、显示器信号通过KVMS接入内网,模拟键盘、鼠标、显示器信号延长至控制中心。在控制中心部署主、备服务器和SOCAN软件,通过单位内网实现专业网管系统与SOCAN的数据交互:通过“网管组”模块(如图2)实现专业网管运行正常时的远程集中监控管理功能,主要用于查询性能和告警;通过“网络管理”模块(如图2)实现关键设备异常时的故障远程诊断与处理功能,可对关键设备故障进行远程串口级诊断、定位、配置和修复;通过“系统管理”模块(如图2)实现“病例库”功能和记录历史操作,便于日后审计和排障经验积累。 1.2 模块分析 根据实现原理,SOCAN主要包括网络管理、系统管理和网管组3个一级模块,告警信息、操作连接、拓扑管理、设备管理、日志管理、系统信息、权限管理、任务管理、更新缓存数据、操作员自服务、按网系查询、按功能查询共13个二级模块,以及最新告警、按区域呈现、按类型呈现、按厂商呈现、模块管理、网元管理、批量导入网元信息、批量导人模块信息、系统日志、操作日志、病例库生成、病例库管理、配置信息、统计信息、在线用户、功能权限维护、功能角色维护、业务角色维护、操作员维护、任务分类、任务维护、性能查询、告警查询共26个三级模块的架构,如图2所示。 2 功效分析 2.1 功能分析 SOCAN采用带外管理技术,其业务承载也在带外通道上,与专业网管“双轨”运行,既互不影响,又共享数据,还提高了专业网管维护管理的可靠性。在控制中心,可以通过KVMS或CS的带外通道显示和查看系统的告警和性能数据,也可以双击系统“网管组”的网管列表信息或“网络管理”的网元列表信息,通过KVMS或CS的带外通道连接相应网元(网络设备或服务器),主要实现了以下五大方面的功能: (1)专业网管远程集中监控功能:可在一个网段上进行集中统一管理,远程实时查询网管关键设备运行的状态与性能数据,方便管理。 (2)关键设备远程故障诊断与数据配置功能:大多数情况维护人员通过串口级的设备连接访问,可以进行故障诊断与排除;个别情况如需去现场处理,维护人员通过这种方式进行故障诊断与定位,方便做好备件和器材准备。 (3)操作记录与统计功能:SOCAN系统自动记录所有操作,形成详细的“原始性”日志文件,便于事后管理审计;并能记录故障处理全过程,形成一个“病例库”,为后续日常故障处理提供素材,经验积累。 (4)核心数据审计与加密通信功能:SOCAN全程采用基于Web的端到端SSL-VPN128位加密,通过“系统管理”模块实现安全可靠的分级管理,保证了账户信息、日志信息等核心数据的安全可靠。 (5)SOCAN状态监控功能:能管理不同厂家、型号和接口的大部分现有关键设备(带串口),并自动上报SOCAN的性能与告警数据,实时反映SOCAN运行状态,告警响应时间一般<60秒。 2.2 效益分析 SOCAN可以统一管理多套不同的专业网管系统,极大的提高了值勤效率;可以大大缩短故障排除的时间,提高运维效率,降低运维成本,减少断机损失,具有较大的推广应用效益,主要体现在以下三个方面: (1)SOCAN实现在一个座席上统一管理分散在不同地点的网管关键设备,可有效减少网管值勤人数,提高值勤效率,有效的解决专业网系杂、维护人员压力大的问题。 (2)SOCAN是一个带外系统,与专业网管“双轨”并行运行,可以作为现有维护体系很好的补充:在专业网管运行正常时,提供了一个统一的管理平台,其管理各种关键设备的行为不受专业网管系统运行状况(功能是否正常,运行是否稳定等)的影响,是一个“敬业的守护者”;同时,在专业网管失效的情况下,也提供了一个备份的状态监控手段,可谓真正的“全时段的守护者”。 (3)SOCAN主要定位于对关键设备故障的远程处理,维护人员在控制中心即可对远端设备通过Console口登录的方式进行维护配置,模拟现场维护场景,大大缩短了排除故障的时间,提高运维及故障恢复效率,降低运维工作负荷,减少断机断网带来的损失;对于无法远程解决的问题,通过SOCAN系统,也可以初步判断故障可能,为现场排障提供必要信息。 3 功能应用 某总公司通过路由器与各分公司建立了企业内网,由于公司业务逐渐拓展,网络也不断扩大,设备厂家、型号不统一,主要部署有eiseo、华为、H3C、TP-Link、中兴等厂家的路由器、交换机、防火墙、服务器等。为了便于总公司对分公司的集中统管与及时排除分公司的设备级故障,公司部署了SOCAN系统,分公司1通过24口的串口交换机将分公司l的各网络交换机接人公司内网,通过单端口的KVM交换机将分公司1专业网管接入公司内网,如图3所示。由于分公司1网络管理经验不足,经常出现员工更改IP访问外网的情况,某天总公司网管员小张通过SOCAN系统发现分公司1某二层eiseo交换机数据访问流量短时间内大幅增加,15端口出现了阻塞。为了不影响公司业务,小张决定通过SOCAN系统远程对分公司1的故障进行处理,并决定将分公司终端的MAC地址(有资料)在网络交换机上与相应端口绑定,以便从根本上解决问题。步骤如下: (1)在PCI地址栏上输入https:∥SOCAN主服务器ip后,输入用户名,密码登录到SOCAN系统上,进入“网络管理”一“操作连接”界面,双击如图4所示的圈内信息即可进入cisco2960交换机默认界面。 (2)进入第15端口,使用no shut命令远程启用;然后使用如图5所示命令,将15端口与相应的MAC地址绑定;其他端口作同样操作。 (3)回到switch#状态,输入“copy run start”保存以上数据,输入“ping网络设备网管服务器ip”显示可ping通,至此,问题已从远程得到解决。 (4)输入病例名称,通过“病例库”功能生成“病例库”。 4 结束语 针对各单位网络与专业网管无法在一个网段内单席位统管、故障诊断与排除必须到现场的弊病,提出SOCAN解决方案。一方面,与专业网管“双轨”并行运行,既能方便管理,互不影响,又能在专业网管失效时提供监控手段,实现“全时段的守护”,利于设备的稳定运行;另一方面,通过将关键设备的串口接入系统,实现远程串口级的操作,解决了由于管理、特殊地形或气候条件出车不方便导致无法及时排除故障的问题,大大缩短了排障时间,提高了运维效率,降低了断机带来的损失,节省了车程费用。 |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。