基于残差网络多尺度特征融合的滚动轴承故障诊断

樊立萍, 张晗

樊立萍, 张晗. 基于残差网络多尺度特征融合的滚动轴承故障诊断[J]. 制造技术与机床, 2024, (6): 52-57. DOI: 10.19287/j.mtmt.1005-2402.2024.06.008
引用本文: 樊立萍, 张晗. 基于残差网络多尺度特征融合的滚动轴承故障诊断[J]. 制造技术与机床, 2024, (6): 52-57. DOI: 10.19287/j.mtmt.1005-2402.2024.06.008
FAN Liping, ZHANG Han. Rolling bearing fault diagnosis based on residual network and multi-scale feature fusion[J]. Manufacturing Technology & Machine Tool, 2024, (6): 52-57. DOI: 10.19287/j.mtmt.1005-2402.2024.06.008
Citation: FAN Liping, ZHANG Han. Rolling bearing fault diagnosis based on residual network and multi-scale feature fusion[J]. Manufacturing Technology & Machine Tool, 2024, (6): 52-57. DOI: 10.19287/j.mtmt.1005-2402.2024.06.008

基于残差网络多尺度特征融合的滚动轴承故障诊断

基金项目: 国家外专项目(国科发专[2021]49号);辽宁省校际合作重点研发项目(辽教发[2020]28号);辽宁省重点研发项目(LJKZZ20220057)
详细信息
    作者简介:

    樊立萍,女,1965年生,博士,教授,主要研究方向为工业过程优化。E-mail:flpsd@163.com

    通讯作者:

    张晗,男,1999年生,硕士研究生,研究方向为故障诊断。E-mail:z18690413762@163.com

  • 中图分类号: TH133.33

Rolling bearing fault diagnosis based on residual network and multi-scale feature fusion

  • 摘要:

    针对传统故障诊断方法在面临复杂工况时出现的特征提取不足、分类器选取困难、诊断精度不高等问题,提出了一种基于残差神经元网络多尺度特征融合的滚动轴承故障诊断模型并用于电机轴承的故障诊断。首先,采用小波变换将轴承振动信号转换为二维时频图作为输入数据集;然后,在残差网络中构建多尺度特征融合模块,提取故障样本不同尺度下的特征;最后,将轴承数据集输入到网络中,实现特征提取及故障诊断。实验结果表明,基于残差网络多尺度特征融合的故障诊断模型可以有效提取信号特征,提高了故障诊断的准确性。

    Abstract:

    Aiming at the problems of insufficient feature extraction, difficult classifier selection and low diagnostic accuracy in traditional bearing fault diagnosis under complex working conditions, a rolling bearing fault diagnosis model based on multi-scale feature fusion of residual neural network is proposed and used for fault diagnosis of motor bearings. Firstly, the wavelet transform is used to transform the bearing vibration signal into a two-dimensional time-frequency diagram as the input data set. Then, a multi-scale feature fusion module is constructed in the residual network to extract the features of fault samples at different scales. Finally, the bearing data set is input into the network to realize feature extraction and fault diagnosis. Experiment results show that the proposed fault diagnosis model based on multi-scale feature fusion of residual network can fully extract signal features and improve the accuracy of fault diagnosis.

  • 滚动轴承是各类机电设备中最常见的传动部件,使用条件苛刻,容易出现疲劳、过载、错位、污染、腐蚀和不正确的润滑等问题。轴承故障也是造成电机故障的主要原因,占所有电机故障的50%以上[1]。为保障工业生产安全、降低经济损失,开展轴承故障诊断研究是必要的。

    常用的轴承故障检测一般为振动信号分析方法,如小波变换 (wavelet transform,WT)[2]、经验模态分解 (empirical mode decomposition,EMD)[3]等,以上几种时频分析法均在故障特征提取方面取得了一定的成果。采用机器学习算法,如支持向量机(support vector machine,SVM) [4]、随机森林 (random forest) [5]、K最近邻算法 (K-nearest neighbor,KNN) [6]等,可以将故障数据按照不同的故障类型分类。上述方法虽取得了一定的成果,但也存在着一些明显缺点:一是特征提取算法需要依赖于先验的领域知识和人工参与;二是基于浅层网络结构的机器学习模型不能够准确表示信息特征与健康状态之间复杂映射关系。

    近年来,基于深度学习的故障诊断方法已成为热点。与传统的人工提取特征相比,深度学习技术具有表示能力强、无需考虑数据背景信息等特点,可直接从原始数据中自适应地提取出具有良好表示数据的特征信息,应用于轴承故障诊断可获得良好的效果。周陈林等[7]提出了一种针对滚动轴承多状态复合特征信息所设计的改进型卷积神经网络故障诊断方法,该方法能够直接对采集到的滚动轴承原始信号进行训练学习,并且可以有效地解决滚动轴承的复合故障问题。Hoang D T等[8]在对一维振动信号进行预处理的基础上,建立二维卷积神经元网络(convolutional neural network,CNN)模型用于滚动轴承故障诊断。Zhao M H等[9]在传统残差神经网络(residual neural network,ResNet)中加入了可变的动态权重层,提高了残差网络的诊断准确度。韩争杰等[10]提出了基于注意力机制改进残差神经网络的轴承故障诊断方法,提高了模型的准确率和泛化率。刘飞等[11]提出了一种基于迁移学习与深度残差网络的快速故障诊断算法,以ResNet18模型作为预训练模型,通过迁移学习的方法,应用到滚动轴承故障诊断领域。随着系统运行状况的不断变化,在进行特征提取时会产生特征缺失或冗余等问题。而采用多尺度特征融合提取方法获得多尺度故障特征可以更好地表示出故障的特征信息。

    本文以网络基本架构为ResNet、网络深度为18层的ResNet18为基础模型,提出多尺度特征融合(multi-scale feature fusion,MSFF)的故障诊断模型,构建基于残差神经元网络与多尺度特征融合(ResNet-MSFF)故障诊断方法,利用卷积神经网络在图像处理上的优势,将一维信号转换成二维时频图作为输入,充分提取多尺度特征信息,进一步提高轴承故障诊断的准确度。

    目前,轴承振动信号的处理方法主要为时域分析法、频域分析法和时频域分析法[12]。由于轴承运行环境的复杂性,时域和频域分析方法仅能对其中一方面进行特征信息提取,而采用时频域分析方法对振动信号进行处理则更为有效。采用小波变换将一维振动信号转换为二维时频图像,小波变换的公式如下:

    $$ WT\left( {a,\tau } \right) = \frac{1}{{\sqrt a }}\int\limits_{ - \infty }^{ + \infty } {f(t)\psi \left(\frac{{t - \tau }}{a}\right)} {\text{d}}t $$ (1)

    式中:ψ表示小波函数;a表示控制小波函数伸缩的尺度因子(对应频率),且满足a>0;τ表示平移量(对应时间),用于控制小波函数的平移。小波变换可以用于时频分析,得到信号的时频谱,能够更好地体现出问题某些方面的特征,是一种很好的信号时频分析与处理方法。

    卷积神经网络是一种基于深度学习的神经网络。它主要由卷积层、池化层和全连接层组成多层神经网络结构,对输入数据进行特征提取和分类识别[13]

    在卷积层中,前一层的特征输出与本层的卷积核进行卷积运算,并通过激活函数形成新的特征,作为下一层的输入,其过程表示为

    $$ y = f({\boldsymbol{W}} * x + b) $$ (2)

    式中:x表示卷积层的输入;y表示卷积层的输出;W为当前层的权重矩阵;$* $表示卷积运算;b为卷积核的偏置;f表示激活函数。激活函数用于激活网络的神经单元,加强网络对非线性信号的表征能力。目前,使用最为广泛的激活函数是ReLU非线性映射函数。

    池化层夹在连续的卷积层中间,其主要作用是进行降采样,从而减少特征维度和运算量。目前,主要的池化操作方式有最大值池化(max pooling)、平均值池化(average pooling)、L2范数池化(L2-norm pooling)、随机池化(stochastic pooling)、反向最大池化(fractional max pooling)等[1415]

    全连接层将多个特征图进行连接,采用softmax函数将输入转化为和为1的概率分布[16],从而进行有效的分类识别。softmax函数表达式为

    $$ f({x_i}) = \frac{{{{\mathrm{e}}^{{x_i}}}}}{{\displaystyle \sum\limits_{i = 1}^{{N_{{\text{class}}}}} {{{\mathrm{e}}^{{x_i}}}} }} $$ (3)

    式中:xi为输入; Nclass为分类个数。

    与传统的卷积神经网络结构相比,残差神经网络(ResNet)增加了“短路”连接(shortcut connection)或称为跳跃连接(skip connection),如图1所示。由图1可以看出,残差神经元网络增加了一个从第一层连接至第二层激活函数前的跳跃连接,激活函数的输入就由传统网络的输出H(x)=F(x)变换为H(x)=F(x)+ x。为保证x可以和F(x)进行相加运算,需要两个张量形状一致,通常使用1×1的卷积操作从而使得输出维度与输入维度达到一致。这种跨层间的恒等映射有效解决了网络深度增加时带来的梯度爆炸或消失等问题,加快了网络的训练速度,可以有效提升网络性能[17]

    图  1  常规卷积神经网络与残差神经网络对比

    旋转机械的故障信号具有典型的非线性、非平稳性,且在运行过程中轴承易受到诸多因素的影响,使其振动信号中包含了多种不同的特征信息[18]。在残差神经网络中,由于残差块的卷积核尺寸通常是不变的,因此仅能从特定尺度下提取特征信息。卷积核定义了卷积的大小范围,在网络中代表感受野的大小。感受野是指卷积神经网络每一层输出的特征图上的像素点在输入图片上映射的区域大小,网络的浅层是小感受野,捕获小尺寸目标,网络的深层是大感受野,捕获大目标尺寸。感受野是影响深度神经网络性能的重要因素之一。因此,将空洞卷积引入到ResNet模型中进行学习,通过增大卷积核尺寸来增加感受野的范围,并采用不同大小的扩张系数(dilation rate)提取多尺度特征信息,从而实现对故障特征的更精确表达。

    空洞卷积(dilation convolution)的主要思想是在卷积核的像素之间插入“孔”(零)[1920],以提高图像分辨率,从而实现深层CNN中的密集特征提取。相比原来的普通卷积操作,空洞卷积增加了一个新的参数,即扩张系数。空洞卷积的卷积核大小计算公式为

    $$ S = d \times (k - 1) + 1 $$ (4)

    式中:k为原卷积核大小;S为空洞卷积核大小;d为扩张系数,指的是卷积核的点的间隔数量。

    由于空洞卷积是一种稀疏的采样方法,尽管它可以在保持特征图的分辨率不变的情况下增大感受野,但当多个空洞卷积叠加时,部分像素未被充分利用上,造成了局部信息的缺失,使得数据的连续性与完整性受到影响。为了提取更加全面的特征图信息,本文提出了一种新的多尺度融合特征模块结构,如图2所示。

    图  2  多尺度特征融合模块

    分别采用1×1、3×3、5×5、7×7等4种尺寸不同的卷积核来提取不同尺度的特征信息,扩张系数分别选取1、12、24、36;之后可以得到4个不同感受野的卷积核下的特征图,对其进行像素融合,形成一个多尺度特征融合模块添加到残差神经网络中。为了提高网络的泛化能力,加速网络收敛速度,在所提出的模块中,卷积层后均使用批标准化层和ReLU激活层。

    同一输入经过不同大小卷积核的像素融合使图像特征信息量增加,但图像本身通道数并没有变化,只是每一通道下的信息量增加。特征融合方法通常有两种:add和concat[21]。同add相比,concat只是在特征图数量上增加,通道数增多,而每一通道下的信息量没有改变。在特征图较多的情况下,add可认为是特殊的concat形式,但是concat的计算量要远远大于add,故方案中采用add特征融合方法。

    本文所提出的基于残差网络多尺度特征融合(ResNet-MSFF)的故障诊断模型如图3所示,主要由小波变换、多尺度特征融合、1×1卷积、全局平均池化(global average pooling,GAP)操作、批标准化(batch normalization,BN)层和修正线性单元(rectified linear unit,ReLU)激活层等主要功能模块组成。首先采用小波变换将一维轴承振动信号转换为二维时频图作为输入数据集,通过ResNet18网络进行特征图降维并提取;然后通过本文中所提出的多尺度特征融合模块进一步提取多尺度信息;随后进行1×1卷积,增加网络的非线性,使得网络可以表达更复杂的特征,同时也可以起到模型优化和减少参数量的作用;接着对每一个输出特征图进行全局平均池化操作,进行网络降维,减少网络参数;最后,使用全连接层并进行softmax分类输出,实现对滚动轴承不同故障状态的识别诊断,有效解决传统提取方法过于依赖先验知识和提取信息不充分的问题。

    图  3  ResNet-MSFF故障诊断模型

    为验证本文所提出的故障诊断模型的有效性,将其应用于电机轴承故障诊断,并在MATLAB仿真环境下进行运行验证。实验所采用的数据集来自美国凯斯西储大学(case western reserve university,CWRU)电机轴承工作振动信号数据集。该数据集分别含有48 kHz和12 kHz采样频率下的驱动端轴承故障数据,并以此两组数据进行实验。

    在采样频率为48 kHz、电机转速为1 797 r/min、电机负载为0 HP的数据中,选取10种轴承数据文件,其轴承故障分别为固定损伤大小为0.007 英寸、0.014英寸、0.021英寸下的滚动体故障、内圈故障、外圈故障。实验所涉及的轴承健康状况类别信息见表1

    表  1  轴承健康状况类别信息
    故障类型 固定损伤/英寸 标签
    滚动体 0.007 1
    滚动体 0.014 2
    滚动体 0.021 3
    内圈 0.007 4
    内圈 0.014 5
    内圈 0.021 6
    外圈 0.007 7
    外圈 0.014 8
    外圈 0.021 9
    正常 10
    下载: 导出CSV 
    | 显示表格

    对实验数据集的处理步骤如下:

    (1)对于每一种故障类型,收集200个样本,其中每个样本包含1 024个原始时间信号点,最后共收集到2 000个样本。

    (2)按照7∶1∶2的比例分配训练集、验证集和测试集。

    (3)对分配完成后的数据集进行标签转换,one-hot编码,再标准化得到均值为0、标准差为1的服从正态分布的数据。

    (4)将处理完成后的数据打乱顺序。

    利用小波变换对原始一维信号进行变化,得到二维时频图像。部分故障状态的二维图像分别如图4图6所示。

    图  4  滚动体损伤的时域图与时频图

    图4图6可以看到,在信号时域波形中,时间与幅值分布无规律。通过小波变换后得到的时频图可以从能量值出发反映不同时间与频率下的信号特征,所以用时频图的形式可以更好地表示各类故障的信号特征,同时对于网络特征学习能力和模型诊断效率的提升有一定帮助。

    输入数据集在输入网络模型前,统一进行了归一化处理。实验过程采用了Adam求解器更新网络参数。在网络训练过程中,设置最大轮数为15,学习率为0.001,最小批量大小为32,同时加入L2正则化降低网络过拟合程度,10类轴承样本输入本文所提模型后训练的分类准确率和损失值曲线,如图7所示。

    图  5  内圈损伤的时域图与时频图
    图  6  外圈损伤的时域图与时频图
    图  7  分类准确率曲线和损失值曲线

    图7的准确率曲线和损失值曲线可以看出,经过约360次的迭代后,训练集准确率达到100%,损失值由2.4下降至0之后,准确率和损失值均得以收敛并趋于稳定。

    将测试集输入至训练完成后的网络上进行验证,得到诊断结果混淆矩阵如图8所示。从混淆矩阵中可以看出,经过本文所提出的ResNet-MSFF故障诊断模型输出后,每一类轴承故障都能够被准确分类。

    图  8  测试集的混淆矩阵

    基于ResNet-MSFF故障诊断模型的测试集与其他几种传统诊断算法的准确率测试结果见表2。对比表中的数据可以看出,ResNet-MSFF诊断模型的诊断准确率可达到100%,分别较采用BP神经网络、粒子群优化BP神经元网络(PSO-BP)时提高了20.3%和14.4%。其他4种诊断方法均无法达到100%的准确率。

    表  2  传统算法与ResNet-MSFF模型准确率对比表
    诊断模型 准确率/(%)
    BP 83.1
    PSO-BP 87.4
    AlexNet 98.5
    ResNet18 99.5
    ResNet-MSFF 100
    下载: 导出CSV 
    | 显示表格

    为了进一步验证本文方法的优势以及泛化性,实验选取了12 kHz故障数据集,电机转速为1 772 r/min、电机负载为1 HP,同样选取10种轴承数据文件,将数据集按照7∶1∶2的比例分配训练集、验证集和测试集,每种故障选择200个样本。故障诊断结果如图9所示。

    图  9  分类准确率和损失值曲线

    从图中可以看出,训练集的准确率达到100%,损失值下降为0并趋于稳定。为了更直观地看出分类结果,将测试集结果同样做了混淆矩阵,如图10所示。上述实验结果表明,对于ResNet-MSFF故障诊断模型,合理选择控制模型结构和训练过程的超参数,能够优化网络训练过程,准确识别10种轴承故障类型。

    图  10  测试集的混淆矩阵

    本文提出了一种ResNet-MSFF诊断模型,并应用于滚动轴承的故障诊断。该模型通过将一维信号转换成二维时频图作为输入,在残差网络中构建多尺度特征融合模块,选择合适的扩张系数来增大感受野并进行像素融合,从而充分提取多尺度特征信息,提高网络的利用率,进一步提高轴承故障诊断的准确度。基于ResNet-MSFF诊断模型的故障诊断准确率较常规BP神经网络和粒子群优化BP神经网络分别提高了20.3%和14.4%,同时该网络模型具有较强的灵活性,可根据实际情况进行扩展。基于ResNet-MSFF的故障诊断方法是提高滚动轴承故障诊断准确率的一种有效方法。在下阶段的工作中,将进一步优化诊断模型,并将优化诊断方法用于实际电机系统。

  • 图  1   常规卷积神经网络与残差神经网络对比

    图  2   多尺度特征融合模块

    图  3   ResNet-MSFF故障诊断模型

    图  4   滚动体损伤的时域图与时频图

    图  5   内圈损伤的时域图与时频图

    图  6   外圈损伤的时域图与时频图

    图  7   分类准确率曲线和损失值曲线

    图  8   测试集的混淆矩阵

    图  9   分类准确率和损失值曲线

    图  10   测试集的混淆矩阵

    表  1   轴承健康状况类别信息

    故障类型 固定损伤/英寸 标签
    滚动体 0.007 1
    滚动体 0.014 2
    滚动体 0.021 3
    内圈 0.007 4
    内圈 0.014 5
    内圈 0.021 6
    外圈 0.007 7
    外圈 0.014 8
    外圈 0.021 9
    正常 10
    下载: 导出CSV

    表  2   传统算法与ResNet-MSFF模型准确率对比表

    诊断模型 准确率/(%)
    BP 83.1
    PSO-BP 87.4
    AlexNet 98.5
    ResNet18 99.5
    ResNet-MSFF 100
    下载: 导出CSV
  • [1]

    Choudhary A,Goyal D,Shimi L S,et al. Condition monitoring and fault diagnosis of induction motors:a review[J]. Archives of Computational Methods in Engineering,2019,26(4):1221-1238. DOI: 10.1007/s11831-018-9286-z

    [2] 王正,文传博,董逸凡. 基于小波变换和Involution卷积神经网络的滚动轴承故障诊断方法[J]. 轴承,2022(11):61-67.
    [3]

    Liu X F,Bo L,Luo H L. Bearing faults diagnostics based on hybrid LS-SVM and EMD method[J]. Measurement,2015,59:145-166.

    [4] 吕明珠,苏晓明,刘世勋,等. 基于VMD-SVM的滚动轴承退化状态识别[J]. 机械设计与制造,2020(1):96-100.
    [5]

    Cerrada M,Zurita G,Cabrera D,et al. Fault diagnosis in spur gears based on genetic algorithm and random forest[J]. Mechanical Systems and Signal Processing,2015,71/72:87-103.

    [6]

    Dong S J,Luo T H,Zhong L,et al. Fault diagnosis of bearing based on the kernel principal component analysis and optimized k-nearest neighbor model[J]. Journal of Low Frequency Noise Vibration & Active Control,2017,36(4):354-365.

    [7] 周陈林,董绍江,李玲,等. 滚动轴承多状态特征信息的改进型卷积神经网络故障诊断方法[J]. 振动工程学报,2020,33(4):854-860.
    [8]

    Hoang D T,Kang H J. Rolling element bearing fault diagnosis using convolution neural network and vibration image[J]. Cognitive Systems Research,2019,53:42-50. DOI: 10.1016/j.cogsys.2018.03.002

    [9]

    Zhao M H,Kang M,Tang B P,et al. Deep residual networks with dynamically weighted wavelet coefficients for fault diagnosis of planetary gearboxes[J]. IEEE Transactions on Industrial Electronics,2018,65(5):4290-4300. DOI: 10.1109/TIE.2017.2762639

    [10] 韩争杰,牛荣军,马子魁,等. 基于注意力机制改进残差神经网络的轴承故障诊断方法[J]. 振动与冲击,2023,42(16):82-91.
    [11] 刘飞,陈仁文,邢凯玲,等. 基于迁移学习与深度残差网络的滚动轴承快速故障诊断算法[J]. 振动与冲击,2022,41(3):154-164.
    [12] 王金福,李富才. 机械故障诊断技术中的信号处理方法:时域分析[J]. 噪声与振动控制,2013,33(2):128-132.
    [13] 王妮妮,马萍,张宏立,等. 基于多尺度深度卷积网络特征融合的滚动轴承故障诊断[J]. 太阳能学报,2022,43(4):351-358.
    [14]

    Shi J L,Sun Y H,Bai S Q,et al. A self-supervisedmethod of single-image depth estimation by feeding forward information usingmax-pooling layers[J]. The Visual Computer,2021,37:815-829. DOI: 10.1007/s00371-020-01832-6

    [15]

    Hu Z P,Zhang R X,Qiu Y,et al. 3D convolutional networks with multi-layer-pooling selection fusion for video classification[J]. Multimedia Tools and Applications,2021,80:33179-33192. DOI: 10.1007/s11042-021-11403-z

    [16] 朱丹宸,张永祥,潘洋洋,等. 基于多传感器信号和卷积神经网络的滚动轴承故障诊断[J]. 振动与冲击,2020,39(4):172-178.
    [17]

    Siddan G,Palraj P. Foetal neurodegenerative disease classification using improved deep ResNet classification based VGG-19 feature extraction network[J]. Multimedia Tools and Applications,2022,81(2):2393-2408. DOI: 10.1007/s11042-021-11543-2

    [18] 邓飞跃,丁浩,郝如江. 基于多尺度特征融合残差神经网络的旋转机械故障诊断[J]. 振动与冲击,2021,40(24):22-28,35.
    [19]

    Wang Z Y,Ji S W. Smoothed dilated convolutions for improved dense prediction[J]. Data Mining and Knowledge Discovery,2021,35(4):1470-1496. DOI: 10.1007/s10618-021-00765-5

    [20]

    Garg R,Dorff M,Jahangiri J. Directional convexity of convolutions of harmonic functions with certain dilatations[J]. Computational Methods and Function Theory,2022,22(3):519-534. DOI: 10.1007/s40315-021-00399-0

    [21]

    Zhang Z,Feng Y,LI Y,et al. Prediction of obstructive sleep apnea using deep learning in 3D craniofacial reconstruction[J]. Journal of Thoracic Disease,2023,15(1):90-100. DOI: 10.21037/jtd-22-734

  • 期刊类型引用(1)

    1. 梁山,齐兵,李浩,刘俊,王锴,王军. 基于LCLSABO-KELM滚动轴承故障诊断方法研究. 制造技术与机床. 2025(02): 17-22 . 本站查看

    其他类型引用(0)

图(10)  /  表(2)
计量
  • 文章访问数:  94
  • HTML全文浏览量:  12
  • PDF下载量:  32
  • 被引次数: 1
出版历程
  • 修回日期:  2023-12-05
  • 录用日期:  2024-04-11
  • 网络出版日期:  2024-05-29
  • 刊出日期:  2024-06-01

目录

/

返回文章
返回