标题 | 浅谈Experion PKS系统SERVER服务器事故分析及处理 |
范文 | 王伟华 摘 ?要:本文介绍了Honeywell PKS系统控制器的硬件结构及功能,阐述了SERVER服务器有关的故障现象及产生的后果,并针对故障原因进行分析、判断和处理。结合工作实际提出了有效的防范措施,从而减少和避免SERVER服务器故障的发生,保证PKS系统可靠运行。 关键词:PKS系统;自诊断功能;SERVER服务器 1 ?选题理由 第二丁苯装置自2009年投用以来,Experion PKS系统一直运行较为平稳。但是,SERVER服务器曾经出现过2次挂起脱离控制网络的现象,由于处理及时生产虽有短时波动,但均没有造成停车。具体现象是:工艺反映所有趋势都无法调用,画面刷新速度过慢,甚至操作站死机。导致了工艺操作人员无法正常操作,也无法实时监测装置各仪表的数据和状态。所以,我们深入研究导致SERVER服务器故障原因,并提出合理有效地解决方案是十分有必要的。 2 ?系统概述及组成 橡胶厂第二丁苯装置采用的控制系统就是Honeywell的主推Experion PKS系统。Experion PKS系统是一种综合性的网络结构,各个网络节点之间通过FTE冗余以太网进行通讯,主要设备包括一对冗余的SERVER服务器,一个OPC服务器,一个FDM服务器,四对冗余的控制器,还有若干I/O(AI,AO,DI,DO)卡件。所有过程控制数据都从SERVER服务器上获取,网络搭建必须在SERVER服务器上完成。 3 ?系统重要节点功能介绍 操作站:主要完成过程数据的实时监视和控制,是装置的"眼睛"。采用基于Honeywell HMIWeb技术的人机界面,二丁苯装置采用的是C站-CE站的组合模式。 C300控制器:每套C300控制器最多支持64个IO Uints。主要完成点对点通讯,IOLINK1 IO通讯,确定性控制执行环境,实现与SERVER服务器之间的数据传递。 SERVER服务器:负责从控制器读取数据后送给操作站(含工程师站)。主要完成初始的网络架构搭建,控制系统组态,历史数据采集与存储,顺序事件记录存储,实现C300控制器及FTE网络中其他节点的状态进行实时监测等工作。 I/O卡件: ?支持冗余、上电和运行自诊断功能,带故障指示,上连(Uplink)信息控制,广播信息风暴抑制,控制器不受上层IP网络通讯量的影响。 交换机:本系统交换机是思科公司专门为Honeywell公司研发的专用交换机,突破以太网瓶颈实现优先级选择。负责整个控制网络中的数据交换,使操作站等上位机完成监视和控制指令下达和反馈功能。 FTE网络:全称为Fault Tolerant Ethernet即容错以太网,是Experion PKS系统控制网络。具有容错的特点,提供快速网络支持和工业以太网控制应用的安全性。 4 ?SERVER服务器挂起脱离控制网络的处理 第二丁苯装置PKS系统一台SERVER服务器(SERVER A)通讯电缆双根故障。即通讯A、B缆同时故障,FTE诊断网络中,状态测试信息"A→A"、"A→B"、"B→A"、"B→B"均显示"SILENT",且网络图标为红色。 处理措施:先检查交换机A和B的SERVER A的A与B缆状态显示灯和SERVER A主机上的通讯A与B缆指示灯状态是否属实。经检查,两者的指示灯都为"黄色"且闪烁,确认SERVER A通讯A、B缆故障。其中通讯A缆接头接触不良,重新拔插后恢复正常;B缆重新更换电缆后恢复正常。 5 ?其他环节引起SERVER服务器挂起(故障)原因分析 虽然PKS控制系统采用了冗余结构的SERVER服务器及其他冗余配置,但在运行过程中由于各种内在和外在因素的影响,仍有可能引发SERVER服务器故障。可能导致SERVER服务器故障的几点原因:应用软件故障、系统软件故障、感染病毒、IOP故障、通讯故障、交换机故障、供电故障、接地不规范。 6 ?事故判断及处理 (1)软件故障及处理 系统软件故障要进行重装和杀毒处理。应用软件故障需修改相应组态使其与与硬件相匹配,然后下装。 (2)SERVER服务器故障及处理: 一般情况下,SERVER A为主服务器,SERVER B为备服务器。其中,SERVER A服务器中的实时的RTDB数据库(动态)是主的,SERVER B服务器中的EMDB、ERDB数据库(静态)是主的(相对主)。故障处理方法:首先,检查网络状态,看FTE接口是否松动,网线有没有破损。若存在这两种现象,则需要停掉故障服务器,重新插拔网线并固定好,若是网线破损则更换新的,处理好之后,重新启动服务器,并做好EMDB、ERDB、 RTDB数据库的同步与覆盖工作。其次,若确定不是外部原因,那么对软件进行测试。若是软件方面的原因,则需要停掉服务器,断掉网线,对服务器进行重装。处理好之后,插上网线,启动服务器,并做好EMDB、ERDB、 RTDB数据库的同步与覆盖工作。 注意问题:若是主服务器坏,做EMDB、ERDB数据库的覆盖,必须是"覆盖主"。若是备服务器坏,必须是"覆盖备"。如果选择错了,两个数据库就都成了空的了,系统就不能运行,造成装置停车。 (3)IOP故障及处理 IOP发生故障时,在控制策略组态的Mornitoring画面中,故障卡件出现小红叉的标志,从中查找故障卡件的具体通道,卡件正常时,状态灯为绿,故障时为红。再到Station中,查看"报警汇总"或"事件汇总"中找到故障卡件的故障原因。根据已知信息,到机柜侧察看卡件的连接是否正确或松动,保险是否被击穿,如果完好则对卡件进行带电拔插处理;如若不行,有可能是卡件或者是卡件背板损坏,需更换备件。若更换卡件后,还不正常,则更换卡件背板。 (4)通信故障及处理 如果某个节点通信不畅,先检查当前这个节点的FTE端口的指示灯是否为黄绿色并且不停闪烁,若不闪烁,对网线进行拔插处理,若不行,更换网线或网卡。 若是整个网络通讯不畅,检查一对冗余的交换机是否处于正常工作状态,各个端口的指示灯是否亮起。若是某些端口指示灯不亮,对其进行拔插处理或更换新网线,如不能解决,更换交换机。 若是单条网络通讯不畅,则需检查极连线是否完好。 (5)接地故障及处理 若是接地有问题,就会造成模件上的静电积累,产生电磁感应从而干扰模件的正常运行。当发生接地故障时,要及时排除,使其接地符合规范。 7 ?事故的防范措施 为了预防SERVER服务器事故的发生,我们应做好几项工作:加强日常巡检力度;做好应用程序软件备份;保障系统供电;危险信号隔离;加强学习培训。 参考文献: [1]殷得和.PKS系统在蜡油加氢装置中的应用.石油化工自动化[J].2010,1:31-33,56. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。