学生机房网络同传故障分析与解决
王海荣
摘要:本文基于网络同传的工作架构及工作原理,就网络同传中涉及的各个故障节点逐一进行分析,并结合日常工作中遇到的若干故障提出解决问题的方案,供机房管理员遇到网络同传故障时,更快更好地从正确的角度发现、分析并解决问题,提高机房管理工作效率。
关键词:学生机房;网络同传
中图分类号:G434 ?文献标识码:A ?论文编号:1674-2117(2021)02-0080-04
随着教育信息化程度的快速提升,计算机房从以前单一的计算机类课程教学使用,逐步扩展到各类网络整合课程、学生实践活动、网络阅卷、教师继续教育等多场景运用。不同的运用场景,需要多系统、多软件、多硬盘保护策略,多安全控制措施来加以配合。本文基于网络同传系统的工作原理,就同传过程中可能出现的问题进行技术分析并提出解决方案。
● 网络同传的工作架构与原理
网络同传技术是指发射端电脑通过二层或三层交换机,在局域网内将数据包以广播发送形式,推送到各接收端电脑上。网络同传技术可以在多主机之间实现高速数据共享,可以高效完成各终端机操作系统及软件配置,同步完成部署各终端的安全保护策略。
网络同传架构主要由发射端(接收端)、交换机、网线、同传系统四个角色构成(如图1)。
若在同传过程中出现设备掉线、同传速度缓慢等问题,就需要机房管理员对针对架构中的四个角色进行针对性分析,从而发现并解决问题。
● 故障节点分析与解决
1.同传系统
(1)硬件版同传系统
目前,市场上主要流行的网络同传系统分为硬件和软件两种模式。采用硬件模式的主要有联想的EDU教育版及增霸卡,这两款硬件系统均为成熟方案,数据传输稳定,效率高。其中,联想EDU出厂时已经集成在主板上,极少出现状况,但是务必要保证发射端和接收端的EDU版本的一致性,以免出现不兼容的情况。部分品牌的增霸卡采用PCI接口,工作过程中可能会由于PCI口接触不良等情况,出现终端设备掉线、传输速度慢等情况。这种情况下需要管理员拆开机箱,重新安装增霸卡,确保其工作状态正常。
(2)软件版同传系统
另外还有一类采用软件模式来实现网络同传功能,如科大讯飞、育林卫等。软件版本优势在于可以节省项目建设投资,且适用于各种老机型,但是其工作稳定性不及硬件版本。另外,一定要注意同传系统软件版本的兼容性问题。笔者在工作期间,曾使用某软件来进行网络同传,初次同传过程中网络传输速率仅有4M/s,在确认交换机、网线等均没有问题的基础上,对该软件进行版本升级后传输速率基本稳定在120M/s。此处,建议采用软件系统完成同传的机房管理员一定要选择较高版本的同传软件。
2.网线
目前主流的机房布线主要采用超五类线及六类线,这两类线理论传输速度都可以达到1Gbps。五类线由于技术标准较低,仅支持百兆速度,因此建议机房管理员在机房建设时优先选择这两类网线。另外,建设施工时注意走线规范,强弱电要分开布放;要注意两端水晶头制作的规范性,优先选择成品线,避免因接触不良或者跳线的线序错乱造成数据链路信号不稳定的情况。
例如,某新建机房,设计方案中网卡、网线、交换机采用全千兆模式,但是网络同传时一直只能达到百兆模式。技术人员逐个排查,首先排除网卡与同传系统的问题,在检查交换机过程中,发现一接口工作状态灯一直提示在百兆模式。经施工人员再次检查,发现该接口的配线架跳线不规范,使得该接口不能正常运行在千兆模式,从而影响了整个机房的传输速度。经重新完成规范跳线,机房同传速度达到千兆的技术标准,问题解决。
3.发射端与接收端
角色设定为发射端的计算机在同传开始之前需要完整地做好相应的配置工作,如安装所需要的各个版本的操作系统、安装各类应用软件、配置硬盘各个分区的保护策略、设定各接收端的IP地址与机器名等。完成发射端计算机全部设置后,逐个启动接收端计算机,确保每台接收端都能成功接入发射端后进行网络同传。传输过程中管理员不需要全程值守,只需关注网络同传速度及传输所需要的时间。若传输过程中出现意外中断等情况,可以选择断点续传,继续完成同传。
网络同传中选择发射端与接收端计算机时,需要注意两个角色的网卡传输速度要保持一致。不要出现百兆网卡与千兆网卡混用的情况,以免降低传输速度。使用外接网卡的机器,需保证外接网卡与主板接口的接触良好。
4.交换机
交换机主要完成电(光)信号转发工作,为接入数据口的网络节点提供独享的信号通路。
按照其转发性能指标区分,交换机可分为百兆、千兆、万兆交换机。百兆交换机目前已经逐渐被淘汰,万兆交换机由于价格昂贵,一般布设于网络核心层。当前机房建设中优先选择千兆交换机。
按照工作原理区分目前在机房中使用的主要有二层交换机和三层交换机。
(1)二层交换机
二层交换机是以数据帧为处理对象,工作在OSI第二层数据链路层的网络设备。在工作过程中,可以抓取或分析数据包内的MAC地址,通过建立地址数据表,完成数据的交換。二代交换机由于数据部线较宽,且不会对网络中的广播包进行约束,因此可以很好地完成同传数据转发。
采用二层交换机无需进行参数配置,无技术门槛,完成网络同传出现问题概率较低,只要能达到千兆网卡、超五类或六类线、千兆交换机,完成发射端100G的数据对50台接收端的数据传输,约需耗时15至20分钟。因此,如机房网络结构简单且无路由功能需求,推荐在机房中选用二层交换机。
(2)三层交换机
三层以太网交换机是以数据包为处理对象,工作在第三层网络层的网络设备。三层交换机的主要功能除了具备二层交换机具备的数据转发功能外还具备跨网段的路由功能。三层交换机可以为局域网中划分的多网段进行跨网段的数据转发服务,从而减少了对路由的依赖,避免了一个网络故障节点影响整个网络数据的转发。因此,学生机房应优先选择安装三层交换机。三层交换机的内部程序配置有一定的技术要求,不恰当或者错误的配置会导致同传过程出现各类故障。以某品牌的三层交换机为例,对可能出现的错误配置问题进行逐一检查。
①查看交换机工作状态。首先通过telnet终端连接到该三层交换机,进入全局配置模式后,执行show interface status命令,对各端口工作状态进行查看,确保每个端口正常连接(status up),工作模式为全双工(duplex full),速度匹配正常(1000M)(如图2)。
此处需重点检查SPEED和DUPLEX两项,如果交换机支持千兆,一定要通过执行(config-if)#speed 1000命令把速度项设置成1000M,达到最大的传输效率。
②关闭风暴抑制功能。网络同传实现的工作原理是发射端在局域网内以广播报文洪泛的方式,通过数据广播的形式对各接收端进行数据发送。三层交换机出于对可能出现网络风暴的安全考虑,均具备网络风暴抑制功能,该抑制功能开启会对网络同传过程产生较大影响。
因此,需要通过执行(config-if)#no storm-control broadcast、(config-if)#no storm-control multicast、(config-if)#no storm-control unicast命令,关闭三层交换机中的广播、组播、单播的抑制功能(如图3)。
③调整缓冲区工作方式。交换机缓冲区是用来协调各类网络设备间的速度匹配问题,一些突发数据可以暂存在缓冲区内。过大的数据量会撑满整个缓冲区造成数据包丢失现象,尤其是当网络中出现大批广播包时,丢包现象更为严重。单个交换机缓冲区大小是固定的,因此,选择合适的缓冲区管理方式是解决此类问题的关键。
例如,某校新建的学生机房在网络同传中,出现数据传输极慢、部分接收端无法连接发射端、接收端频繁掉线等问题。在排除同传系统(联想EDU)、网线(超五类线)、计算机硬件(新购)等问题后,技术人员首先更换了一台同品牌的二层千兆交换机,同传顺利完成,且速度达到设计标准。因此,将解决问题的关键放在三层交换机的配置上。
通过TELNET进入交换机配置界面,查看发射端接口的运行状态,发现大部分数据包被丢弃(dropped),交换机缓存区全部撑满(no buffer)。该三层交换机交换容量达到156G,因此排除交换机性能不足的问题,问题进一步集中到交换机缓存区的工作方式调整。
经查找该品牌交换机的技术配置资料,发现该交换机的缓冲区有流控方式(FC)和服务质量方式(QOS)两种。当启用流控方式时,缓冲区被均分给各数据端口,各端口分得的缓冲区较小。网络同传过程中发出的大量的广播数据包会快速撑满缓冲区,造成数据丢包;一旦网络中出现丢包现象,各数据接口只能通过降速来应对缓冲区溢出的问题,造成超出缓冲区的数据包新的丢失,如此形成恶性循环。当启用服务质量方式时,各端口将共享整个缓冲区资源,缓冲区资源相对增大,可以容纳更多的数据包,保证数据的传输质量。
查阅资料后,通过telnet登录该交换机后,进入配置模式,首先执行(config)show buffer management,发现该交换机缓存工作方式为FC,继续执行如下命令(config)buffer management qos,变更缓存区工作方式(如上页图4)。
通过变更缓冲区工作方式为QOS,使整个缓冲区为各端口共享,解决了缓冲区容量不足的问题,避免了网络同传中大批广播数据包被丢弃的问题。经过此次配置调整,同传工作顺利完成。
● 结语
网络同传的顺利进行,有利于各机房管理员高速、有效、安全地配置与管理机房。在机房建设方案设计阶段,机房管理员应深度参与技术方案设计,关注计算机、交换机、同传系统、网线的选择,在达到要求的技术参数的同时尽可能选择成熟稳定的产品;在施工阶段应严把施工质量关,保证施工规范有序的进行,减少问题隐患。当同传过程中遇到问题时,应冷静分析,针对各故障节点逐一分析排除,有的放矢,进而提高机房管理工作的整体效率。
参考文献:
[1]孔智.基于三层交换机服务质量的研究[D].南京:南京邮电大学,2016.
[2]石峰.基于三層以太网交换机的机房网络同传故障解析[J].太原学院学报,2017(12).
[3]华为S系列交换机安全加固指南[Z].深圳:华为技术有限公司,2020.