滚动轴承多状态特征信息的改进型卷积神经网络故障诊断方法

2022.06.15

周陈林董绍江李玲

摘要：针对现有滚动轴承故障诊断模型中人工选取特征的不确定性，诊断模型不具有针对性的难题，提出一种针对滚动轴承多状态特征信息的改进型卷积神经网络故障诊断方法。首先，该方法针对滚动轴承故障的多状态特征信息，提出一种改进型卷积神经网络设计基本准则（BPDICNN）;再次，利用提出的BPDICNN設计了卷积神经网络模型，直接在滚动轴承原始振动信号上进行“端到端”的学习训练，从原始信号中挖掘出包括故障类型、故障位置、故障损伤程度、故障检测时负载状态等多个特征;最后，利用实验数据进行了验证，实现了30个滚动轴承故障状态的有效诊断，准确率为100%，实验结果验证了方法的有效性。

关键词：故障诊断; 滚动轴承; 改进型卷积神经网络; 多状态

中图分类号： TH165+.3; TH133.33 ?文献标志码： A ?文章编号： 1004-4523（2020）04-0854-07

DOI：10.16385/j.cnki.issn.1004-4523.2020.04.024

引言

滚动轴承作为旋转机械的重要零部件之一，其健康状态影响着整个机械设备的正常运行。由于现代化机电装备规模大，检测点多，传感器采样频率高，设备服役周期长，检测系统将获得海量的数据，机电装备的状态检测正迈入“大数据”的时代[1]。如何从海量数据中自动挖掘特征，构建针对性的故障诊断模型，对轴承等重要零件进行实时监测，并保障机械系统的安全运行具有重要意义。

目前对于滚动轴承故障检测的传统诊断算法大都预先经过小波变换、傅里叶变换等复杂的信号特征提取，然后通过PCA、自编码器等方式约简数据，最后使用SVM等分类器分类。这种人工特征选取方式耗时、不确定，并且容易在数学上割裂轴承信号的原始物理属性。

近几年，将深度神经网络应用在轴承智能诊断领域已经成为热门课题。Tan等[2]利用小波变换对轴承时域振动信号进行降噪，然后使用堆叠式的稀疏自编码器构建深度神经网络，对滚动轴承进行故障诊断。Gan等[3]利用深度置信网络，提出了分层诊断网络（Hierarchical Diagnosis Network，HDN），对滚动轴承的10类故障达到了 99.03%的诊断准确率。Sun等[4]利用降噪稀疏自编码器构建了一个3层的深度神经网络，达到了 97.61%的轴承故障识别率。He 等[5]提出了大内存存储检索网络（Large Memory Storage Retrieval，LAMSTAR），实现了在不同转速下故障诊断率达到96%以上。Jia等[6]对轴承原始数据进行快速傅里叶变换，然后使用一个4层深度神经网络进行故障诊断，识别率达到99.68%±0.22%。袁建虎等[7]提取滚动轴承信号的时频图作为卷积神经网络（Convolutional Neural Network，CNN）输入，实现对4类轴承故障诊断，平均正确识别率为97%。曲建岭等[8]提出了“端到端”自适应一维卷积神经网络，对10类轴承故障状态达到99%诊断准确率。

以上包括CNN在内的深度神经网络算法大多仍然使用人工提取的特征作为网络输入，少数研究也使用CNN对原始振动数据直接“端到端”训练，进而实现诊断。但是由于在轴承故障诊断领域中，CNN模型设计没有合适的设计准则，导致没能最大限度地利用CNN的提取特征自学习特点，限制了模型对轴承多状态特征信息的提取和表征能力，进而导致轴承故障状态能够被有效诊断的数量较少。

本文提出一种针对滚动轴承多状态特征信息的改进型卷积神经网络故障诊断方法。首先针对滚动轴承的多状态特征信息提出改进型卷积神经网络设计基本准则（Basic Principles for Designing Improved Convolutional Neural Network，BPDICNN），其次按照BPDICNN设计了卷积神经网络诊断模型，对西储大学轴承数据库的原始数据进行“端到端”学习训练，然后进行故障诊断，实验结果验证了本文方法的有效性。

1 针对轴承多状态信息的CNN构建[*2]1.1 BPDICNN设计准则 ?CNN由 Yann Le Cun在1989年提出，在模式分类领域有着广泛的应用，CNN中卷积运算具有稀疏连接、权值共享的特性，可以在 CNN 的输入端直接输入原始信号，在输出端输出结果。CNN这种“端到端”的特点，可以让CNN完成特征提取、数据约简与分类器分类整套过程。但是如何针对多状态的轴承特征信息进行诊断，最大限度的利用CNN的提取特征自学习特点，还需要对现有的CNN模型进一步改进，构建合理的CNN模型设计准则。

为了实现CNN模型设计准则的构建，张伟[9]提出了在轴承时域信号设计CNN时，第一层应采用大卷积核[9]，目的是为了提取短时特征，其作用与短时傅里叶变换类似，只不过将短时傅里叶变换的正弦函数更改为第一层的大卷积核。Krizhevsky等[10]提出了在图像识别领域深度卷积神经网络AlexNet，该模型设计为步长比池化层的尺寸小，使得池化层的输出之间有重叠和覆盖，提升特征表达的丰富性，为了实现对多状态轴承特征信息的表征，这种模型设计方式可以应用到轴承故障诊断领域的CNN设计中。轴承的时域故障信号是一维信号，在设计模型卷积层时，保证有效提取特征的同时，应适当缩小数据尺寸。这样设计可以有效防止模型结构变得复杂冗长，减小模型训练难度。

基于以上分析，针对多状态特征信息的滚动轴承故障诊断，本文提出一种改进型卷积神经网络设计基本准则（BPDICNN），具体原则描述如下：

1）第一层卷积层使用大卷积核，以便有效提取滚动轴承时域信号短时特征。

2）池化核的尺寸大于池化步长，增加对滚动轴承特征信息表达的丰富性，以便对多状态特征信息的滚动轴承故障诊断。

3）卷积层移动步长大于1，以便卷积层提取特征的同时适当缩小尺寸，避免模型复杂冗长。

1.2 卷积神经网络模型

按照BPDICNN设计了如图1所示的CNN结构。输入层的尺寸为1×4096;在图像识别领域大多采用尺寸为3×3或者5×5的卷积核，该层相当于获取9或25像素的感受野，為了更好地提取原始信号的特征，此处模型第1层卷积层的大卷积核尺寸设计为1×32，同时使用步长为1×4，让卷积层在提取特征的同时适当缩小尺寸，加速网络学习训练过程;第2层池化层尺寸为1×10，移动步长为1×4，交叉采样可以使得模型表达的特征更加丰富;第3层卷积层的卷积核尺寸为1×5，步长为1×3; 第4层池化层尺寸为1×10，步长为1×4;第5层卷积层的卷积核尺寸为1×5，步长为1×3;第6层为全连接层有120节点;经过第7层Softmax层后完成30个故障状态分类。模型结构参数如表1所示。

1.3 模型的训练

模型采用Adam优化器，动态调整每一个参数的学习率，增强模型对超参数的鲁棒性。为防止训练过拟合，模型采用Dropout正则化。CNN能够实现对输入的滚动轴承时域信号和输出的诊断结果之间的高维非线性映射，能够在不需要任何输入输出之间的精确表达式的前提下，利用已经标记的数据进行训练，提取特征，建立输入输出的映射关系。模型训练流程如图2所示。

2 轴承诊断结果与分析

2.1 数据集和数据增强 ?本文的试验数据来自于美国凯斯西储大学（CWRU）滚动轴承数据中心[11]。本试验的对象为驱动端轴承，被诊断的轴承型号为深沟球轴承SKF6205，有故障的轴承由电火花加工制作而成，系统的采样频率为12 kHz。试验中有3种故障类型：滚动体故障、内圈故障、外圈故障。其中外圈故障有3处位置，分别是：外圈3点钟部位、外圈6点钟部位、外圈12点钟部位。同时每一处故障分别对应不同损伤程度：0.007，0.014，0.021，0.028 inch。每一处故障对应不同的负载状态：1HP，3HP。一共有30种待诊断的故障状态。包含故障的类型、外圈故障的具体位置、故障的损伤程度、故障检测时的负载状态。30种故障状态如表2所示，其中B表示滚动体故障，IR表示轴承内圈故障，OR@3表示轴承外圈3点钟部位故障。

增强机器学习模型泛化能力最好的办法是使用更多的训练样本[12]，数据集增强技术即通过增加训练样本，以达到增强深度神经网络泛化性能的目的。在计算机视觉领域中对图片进行镜像、旋转、平移、修剪缩放等操作实现数据集增强。对于一维故障诊断信号，由于其特有的时变性和周期性，图片的数据集增强技术并不完全适用，这里使用如图3所示的重叠采样方法。

2.2 模型测试结果

采用表3中数据集生成算法，得到训练集样本数为4288，测试集样本数为200。实验采用Google公司的Tensorflow深度学习框架，运行环境为Windows10，设备配置为Intel公司的Core i3-5010U CPU。设计的CNN模型对滚动轴承故障30类状态进行4000轮迭代训练，训练过程的损失和测试准确率如图4所示。

模型4000轮迭代一共训练0.95 h。如图4（a）中A点是在训练时间为0.096 h时，第一次达到测试准确率100%。测试准确率曲线在训练时间0.3 h后逐渐稳定。实验结果表明：按照BPDICNN设计的CNN模型能够从原始信号中挖掘出包括故障类型、故障位置、故障损伤程度、故障检测时负载状态等多个特征，实现对滚动轴承故障多状态信息精准诊断。

卷积层使用随机正态分布初始化，经过4000次训练迭代，各卷积层权值分布随着时间的变化如图5所示。结果表明，卷积层1的卷积核的权重分布随着迭代次数的增加改变最明显，学到的特征最多，卷积层2、卷积层3学到的特征逐层减少。

卷积层1使用32个尺寸为1×32的卷积核，图6为第1层卷积核的时频域特征。卷积层1的卷积核中存在频域特征相似的卷积核，学到了重复的特征。可以通过去掉相似的卷积核使模型结构得到优化。

2.3 卷积核数量分析

图7为卷积层1不同数量的卷积核对模型训练速度的影响。

实验中的损失为一个批次的平均交叉熵。如图7所示，48个卷积核的模型收敛得最慢，训练时间最长，其次是32个卷积核，4，8和16个卷积核的曲线收敛速度相差不大。经过4000次迭代后，8，16，32个卷积核的测试准确率均为100%，4个卷积核的测试准确率为96.5%，48个卷积核的测试准确率为96.98%。对比训练时间、收敛速度以及测试准确率，第1层卷积核选取8个或者16个。

2.4 不同训练量分析

对于10%，20%，40%，60%，80%，100%的训练集数据量进行4000轮迭代训练，诊断表2中的30类故障状态。图8为不同的数据量经过4000轮迭代训练，测试准确率随着时间的变化。

60%，80%，100%的数据量迭代4000轮中都出现了100%最好测试准确率。20%数据量最好测试准确率为99.5%;10%数据量的最好测试准确率为86.66%。20% ，40%，60%，80%，100%的数据量测试准确率曲线差距很小，只有10%数据量的曲线相差较大，结果表明：按照BPDICNN设计的CNN模型在滚动轴承故障信号诊断中，数据增强对训练的准确率会有所提升。20%数据量和100%数据量的测试结果差距不大，此模型能很好地提取滚动轴承故障的有效特征，对训练数据量有很好的鲁棒性。

2.5 模型训练结果对比验证

在相同的数据集下，不经过任何特征预处理，进行“端到端”的故障诊断，对比全连接深度神经网络（DNN）和基于BPDICNN的CNN分别经过4000次迭代训练，对不同数目的滚动轴承故障状态进行故障诊断。其中设计的DNN含有3个隐藏层，每层结点为500个，输出层的结点分别为5，10，20，30个，使用ReLU函数作为激活函数。例如诊断数目10对应着表2中的编号1-10的故障状态。实验结果如表4所示。

[10] Krizhevsky A，Sutskever I，Hinton G E.ImageNet classification with deep convolutional neural networks [C].Proceedings of the 25th International Conference on Neural Information Processing System，2012： 1097-1105.

[11] http：//csegroups.case.edu/bearingdatacenter/pages/welco me-case-western-reserve-university-bearing-data-center-website[EB/OL].

[12] Goodfellow I， Bengio Y， Courville A. Deep Learning [M]. Cambridge：MIT Press， 2016.

Abstract： An improved fault diagnosis model for multi-state faulty bearings by using convolutional neural network is proposed in this paper， aiming at the problems of the uncertainty in manual feature selection and the unspecific of existed fault diagnosis models. At first， according to the multi-state feature of the faulty bearings， a basic principle for designing an improved convolutional neural network （BPDICNN） is proposed by taking advantage of the sparse connection and weight sharing of convolutional neural network. Secondly， a convolutional neural network model is designed by using the BPDICNN design principle， and the “end-to-end” learning and training is carried out directly on the original vibration signal of faulty bearing. Multiple features including fault types， fault positions， fault damage degree and load state are extracted from the original signals. Finally， test data are used to verify the fault diagnosis of 30 types of faulty bearings with 100% accuracy. Test results verified the effectiveness of the proposed method.

Key words：fault diagnosis; rolling bearing; improved convolutional neural network; multi-state