标题 | 一种基于决策树的ONU故障诊断算法 |
范文 | 郑波+花纯征+花磊+杨勇 摘要:PON技术可以提高光纤资源的利用率,但是在上行链路中容易受到干扰,影响PON系统的稳定运行。为解决这个问题,该文基于决策树理论,提出了基于决策树的ONU故障诊断算法。该算法提取ONU故障中丰富的OLT和ONU运行相关信息,按照特征和规则进行组合构建决策树,然后将决策树进行存储,应用于ONU的故障诊断。通过仿真实验,证明了该文提出的故障诊断算法可用于代替人工故障诊断方法,提高了故障诊断的效率,而且取得了较高的准确率、较低的误报率。 关键词:无源光网络;光网络单元;干扰;故障诊断 中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2017)34-0253-03 Abstract: PON technology can improve the utilization of fiber resources, but PON uplink is susceptible to be interfered, which affects the stable operation of PON system. In order to solve this problem, this paper proposes an ONU fault diagnosis algorithm Based on decision tree. The algorithm extracts the abundant OLT and ONU operation information related to the ONU fault, and combines the characteristics and rules to form the decision tree. Then the decision tree is stored and applied to the ONU fault diagnosis. Through the simulation experiment, it is proved that the fault diagnosis algorithm proposed in this paper can be used to replace the artificial fault diagnosis method, improve the efficiency of fault diagnosis, and obtain high accuracy and low false alarm rate. Key words: PON; ONU; Interference; fault diagnosis 1 背景 PON技术可以提高光纤资源的利用率,但是在上行链路中容易受到干扰,影响PON系统的稳定运行[1,2]。另外,PON系统传输距离延伸环境下,增加了相关光信号延伸设备,使这个问题更加复杂[3]。一般来说,产生干扰的原因主要包括:长发光、发光超出或偏离授权窗口、消光比不达标、随机突发式乱发光等几种。从已有研究成果可知,长发光对业务的影响最为严重[1,2]。所以,解决长发光问题,是当前的研究重点。已有相关研究提出了一些长发光告警诊断方法,包括信号扫描法、虚拟ONU法[4-5]。但是,在这些算法中,需要人工积累判断规则,然后基于判断规则和告警信息,通过人工打开和关闭发光器、电源开关等措施,进行故障诊断,这种故障诊断的效率较低。 为了提高ONU故障诊断的效率,本文提出了基于决策树的ONU故障诊断算法。该算法基于决策树理论[6-7],将人工积累的ONU故障诊断判断规则进行预处理,提取特征和故障的关联关系,生成故障诊断的决策树,然后将决策树进行存储,应用于ONU的故障诊断。通过仿真实验,证明了本文提出的故障诊断算法可用于代替人工故障诊断方法,不但提高了故障诊断的效率,而且取得了较高的准确率,较低的误报率。 2 问题分析与故障诊断模型构建 2.1 问题描述与分析 为了便于对问题进行分析,下面首先对长发光的特征进行分析。长发光是指ONU的发光不是在OLT允许的时限范围内进行发光,而是发光的时间较长,严重影响其他ONU的数据发送。出现长发光故障的原因主要是由于ONU出现硬件或软件故障,导致ONU的光发射机不受控制。为便于进行故障诊断,现对长发光业务特征进行分析,从而建立症状和故障的关联关系。 2.2 故障诊断模型构建 故障诊断模型构建,即建立特征(也叫症状)与故障的关联关系。所以,构建故障诊断模型首先需要定义特征与故障的关联规则。下面根据突发式长发光干扰时相关ONU及链路的特征信息,来设置故障ONU 的特征与故障的关联规则。 考虑到特征与故障所在场景的不同,可以将特征与故障的关联规则分为:状态特征与故障、告警特征与故障、性能特征与故障等3种。其中,状态特征与故障主要指ONU出现的状态与ONU发生故障之间的关系,例如,同时在线的ONU个数、离线的ONU个数等状态与发生故障的ONU之间的关系。告警特征与故障主要指发生光路干扰时,ONU告警的特征与故障的关系,包括ONU 离线发生的时间间隔、ONU离线发生的次数间隔、部分ONU 离线与某ONU 上线时间间隔等。性能特征与故障主要指ONU性能的变化与ONU发生故障之间的关联关系。例如,ONU的光功率变化、误码率变化与故障之间的关系。 3 基于决策树的ONU故障诊断算法 3.1 基于决策树的ONU故障诊断流程 基于决策树的ONU故障诊断流程如下图1所示。主要包括生成决策树、存储决策树、应用决策树、性能分析四个子过程。下面进行详细介绍。 生成决策树子过程包括数据采集和特征识别、数据存储和預处理、构造决策树3个模块。其中,数据采集和特征识别模块采集一段时间内ONU的状态特征与故障、告警特征与故障、性能特征与故障等数据,并进行特征识别。数据存储和预处理模块将采集的数据进行存储、规范化处理,获得特征数据及结果数据。构造决策树模块采用Hunt算法构建决策树。 存储决策树子过程将决策树存储为文件,便于快速方便应用于故障诊断。 应用决策树子过程包括数据采集和特征识别、数据预处理、应用决策树3个模块。 其中,数据采集和特征识别模块实时采集ONU的状态特征与故障、告警特征与故障、性能特征与故障等数据,并进行特征识别。数据预处理模块按照规则特征,对数据进行处理。应用决策树模块采用决策树,判断当前数据是否可判断出当前ONU是否正常运行。 性能分析子过程包括结果分析、是否满足性能要求判断2个模块。其中,结果分析模块从准确率和误判率两个维度,进行分析。是否满足性能要求判断模块对检测结果进行判断,如满足预设的阈值,输出诊断结果,程序结束。如不满足,需进行重新构造决策树。 3.2 生成决策树的过程 从基于决策树的ONU故障诊断流程可知,生成决策树的过程是故障诊断流程中最重要的过程。下面对此过程进行详细介绍。 3.2.1 数据采集和特征识别 通过OLT、ONU的OAM模块获取运行、维护等数据,从EPON系统的MPCP模块获取协议消息数据,抽取出状态特征与故障、告警特征与故障、性能特征与故障等数据。然后基于维护经验,挖掘出关键特征,以及关键特征组合下的故障诊断结果。例如:当诊断发现部分ONU满足以下特征的相关组合时,则可将其列为疑似故障ONU。特征包括:特征1:多个ONU发生告警的时间与单个ONU告警修复的时间间隔小于N分钟;特征2:同一时间内,多于1个ONU在线;特殊3:多个ONU发生告警的时间间隔小于M分钟;特征4:多个ONU误码率超过K比特;特征5:出现长发光的ONU数量发生变化;特征6:ONU与OLT之间的通信时间超出正常阈值。 3.2.2 数据储存和预处理 数据的存储方面,为提高数据存储的实时性,以及便于数据字段的调整,采用HBase新型数据库存储采集到的数据。 数据预处理中心首先对不同来源的数据做时间和空间的对准,然后对数据进行清洗和整理。其中使用的处理算法主要包括数据整合算法、数据抽样算法、缺失值处理算法、行内去重算法、数据修改算法等。其中,各个特征的最优参数不是本文的研究重点,此部分基于已有研究成果,也可以根据PON网络运行过程中的实际数据进行调整。所以,特征4中的M取值1 分钟;特征5中的N取值1分钟;特征6中的K取值10比特。基于已有研究成果,以及PON网络运行过程中的实际数据,整理训练数据集,用于模型构建。基于决策树的ONU故障诊断训练数据举例见下表1。 3.2.3 构造决策树 创建决策树的递归算法如下:1)判断数据集[D]中的数据是否属于同一个类别,如果是,标记为[yt];2)采用信息熵理论,选择一个合适的特征,将数据集划分为较小的数据子集;3)将未划分的数据划分到新的数据子集中;4)递归调用该算法,直到所有子集中的数据都属于同一类别。 在该算法中,选择最好的数据特征来划分数据集,是构造决策树的关键。下一节进行详细介绍。 3.2.4 选择最好的数据特征来划分数据集 4 性能分析 4.1 比较方法 为了分析本文算法的性能,本文使用准确率和误报率来分析算法的性能,计算方法见公式(2)和公式(3)。 [准确率=|诊断算法得到的故障集?真实的故障集||真实的故障集|] (2)[误报率=|诊断算法得到的故障集?无故障节点被诊断为故障||真实的故障集|] (3) 4.2 性能分析 采用Python语言编写决策树算法。基于已有研究成果和实际运行环境结果,模拟1000条到10000条数据进行试验。取总数据量的90%作为训练数据;取总数据量的10%作为测试数据。 从图2算法的准确率可知,算法的准确率在85%左右。从图3算法的误报率可知,算法的误报率在15%左右。所以,相对于人工故障诊断,本文提出的ONU诊断模型能够准确地进行各种ONU故障的诊断预警,系统运行性能稳定,具有较高的实用价值。 5 结束语 PON技术可以提高光纤资源的利用率,但是在上行链路中容易受到干扰,影响PON系统的稳定运行。为解决这个问题,本文提出一种基于优化决策树的ONU故障诊断方法,提取ONU故障中丰富的OLT和ONU运行相关信息,采用决策树构造ONU故障诊断模型。实验证明,本文提出的ONU的故障预测与诊断模型,相对于目前大都采用依靠人工经验与定期巡检,具有较高的准确率,具有较强的实用价值。 参考文献: [1] 董伟, 叶宪军. 对光缆线路故障原因及处理方法的分析[J]. 中国新通信, 2014(13):25. [2] 张欧.光缆线路的故障分析及障碍处理[J].中国管理信息化, 2015(18):84-85. [3] 程洪. GEPON系统的长距离传输技术方案探讨[J]. 电子世界, 2015(23):160-161. [4] 于金辉, 余辰东. PON网络中的ONU 干扰问题研究[J]. 光通信研究, 2015(4):19-21. [5] 余辰东. PON网络中的ONU 干扰问题研究[J]. 光通信研究, 2017(1):23-26. [6] 江书荣, 刘月. 基于粗糙集与决策樹的配电网故障诊断研究[J].中国高新技术企业,2016(2):22-23. [7] 范庚, 马登武, 张继军, 等. 基于决策树和相关向量机的智能故障诊断方法[J]. 计算机工程与应用, 2013, 49(14):267-270. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。