基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法

未命名 09-17 阅读：120 评论：0

for rolling bearing fault diagnosis》，构建了一种集成了条件变分自编码器和条件瓦瑟斯坦生成对抗网络与自调制的新模型将数据扩充为平衡数据集。针对一维机械振动信号在输入卷积神经网络时无法充分提取相对位置关系的问题，提出一种基于格拉姆角场(gaf)和小尺寸卷积的胶囊网络的轴承故障诊断分类方法。
8.滚动轴承在几乎所有的旋转机械中都会被使用到。轴承故障影响范围大，维修成本高，因此对其做出精准快速的异常检测及故障分类是提高机械设备经济效益的有效措施。滚动轴承存在原始振动信号含有噪声和干扰过大、标签样本过少和负载迁移等问题，使得轴承故障样本数量在各种故障中占比较低，为基于大量训练数据的网络模型带来困难。
9.综上，现有技术虽然分别在轴承异常检测和轴承故障诊断有一定的研究成果，但是没有网络模型能够一起实现轴承的异常检测和故障诊断，并且异常检测和故障诊断精度都没有特别高。因此，本技术领域亟需一种既可实现对轴承异常检测，也可实现对轴承故障的诊断分类模型，并且利用生成对抗网络强大的数据生成能力进行生成数据，使用生成的数据对原始数据集进行数据扩充，提高异常检测和故障诊断准确率。

技术实现要素：

10.针对现有技术的问题，本发明公开一种基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法，构建dc-ganomaly异常检测和故障诊断网络模型，对轴承数据实现精准高效的异常检测和故障诊断。
11.本发明详细的技术内容如下：
12.一种基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法，其特征在于，包括：
13.(1)构建基于深度卷积生成对抗网络的模型
14.构建一种由cnn和生成对抗网络组成的深度卷积网络模型dc-ganomaly，结合了ganomaly和cgan的特点，在判别器添加了由四层全连接层构成的辅助分类器用于故障类别分类，此设计使用训练好的模型生成逼真数据进行数据扩充并训练分类器，优化损失函数实现轴承故障诊断，和上文连在一起是有监督故障分类模型；
15.(2)对深度卷积网络模型dc-ganomaly的训练
16.在异常检测训练阶段，输入轴承的正常一维振动信号及人为标注正常标签进行模型训练，直到整个网络模型达到纳什平衡状态，得到异常检测阶段训练好的深度卷积网络模型dc-ganomaly；
17.在故障诊断训练阶段，输入轴承的故障一维振动信号及人为标注故障类别标签进行模型训练，直到整个模型达到纳什平衡状态，使用深度卷积网络模型dc-ganomaly生成故障数据并加入初始训练集中，使用扩充后的训练集进行训练分类器，直到损失函数收敛即停止，得到故障诊断阶段训练好的分类器；
18.(3)对轴承异常检测和故障诊断
19.将实时采集到的轴承一维振动信号输入至得到异常检测阶段训练好的深度卷积网络模型dc-ganomaly，得到是否发生异常的检测结果；
20.再将异常的检测结果输入故障诊断阶段训练好的分类器，输出对应的故障类别标签类别。
21.根据本发明优选的，所述深度卷积网络模型dc-ganomaly包括：生成器、生成样本、编码器和判别器；
22.所述生成器为蝴蝶结卷积自编码神经网络架构；所述判别器后添加由四层全连接层构成的辅助分类器用于轴承故障诊断，本设计为在原ganomaly网络框架的基础上，使用蝴蝶结卷积自编码器和dcgan的卷积神经网络架构作为网络主体结构，并于判别器后添加由四层全连接层构成的辅助分类器用于故障诊断，深度卷积网络模型dc-ganomaly如图1所示；深度卷积网络模型dc-ganomaly既能实现对轴承数据的异常检测，也能进行轴承故障类别分类，同时实现gan生成数据对训练集的数据增强，补充不平衡的样本集，提高轴承故障诊断精度；深度卷积网络模型dc-ganomaly的生成器有两个输入，一个是真实样本，一个是真实样本对应的标注故障类别标签，得到生成样本，通过编码器将输入数据与正常一维振动信号数据进行特征比较，与设置的阈值比较后检测是否发生异常，判别器产生轴承故障分类诊断结果作为输出，根据场景设置所述阈值，判断大于所述阈值时发生异常。
23.根据本发明优选的，异常检测阶段训练好的深度卷积网络模型dc-ganomaly具体包括：
24.将全部正常数据的原始一维振动信号经过小波变换转为1*32*32时频图样本将嵌入人为标注正常标签的时频图输入到生成器，映射到低维重构图，由生成器生成的新样本生成相应的人为标注的正常异常标签
25.新样本被标记为0，并且时频图样本被标记为类别标签1；
26.然后将样本组合装载，鉴定和分类真实性，即将时频图样本和新样本一起输入判别器，由判别器判断样本是真实的原始样本还是由生成器生成的新样本；
27.此后，时频图样本标签记为l
real
，新样本标签记为l
fake
；对时频图样本的预测记为p
real
，对新样本的预测记为p
fake
；
28.通过最小化训练模型的损失函数，完成对判别器的训练；所述判别器的交叉熵损失函数的计算公式如下：
29.l
d-real
＝f
bce
(p
real
，l
real
)
ꢀꢀ(i)30.l
a-fake
＝f
bce
(p
fake
，l
fake
)
ꢀꢀ
(ii)
31.ld＝(l
d-real
+l
d-fake
)*0.5
ꢀꢀ
(iii)
32.在公式(i)、公式(ii)和公式(iii)中，l
d-real
为时频图样本输入判别器后得到的对时频图样本的预测标签和真实标签之间的损失函数；f
bce
指二分类交叉熵损失函数(binary crossentropy loss)；l
d-fake
为新样本输入判别器后得到的对生成样本的预测标签和生成样本的生成标签之间的损失函数；ld判别器的交叉熵损失函数；
33.新样本的标签被设置为1并发送到判别器，判别器通过标签为非0的新样本；通过最小化ld来调整和完成生成器的训练，即通过反向更新梯度参数实现最小化；原始一维振动信号经判别器提取的特征记为z
d-real
，新样本经判别器提取的特征记为z
d-fake
；原始一维振动信号经生成器产生的瓶颈特征记为z
g-raal
，新样本经生成器提取的编码特征记
为z
g-fake
；所述生成器的交叉熵损失函数的计算公式如下：
34.l
adv
＝f
adv
(z
d-real
，z
d-fake
)
ꢀꢀ
(iv)
35.l
con
＝f
con
(x，x
fake
)
ꢀꢀ
(v)
36.l
enc
＝f
enc
(z
g-real
，z
g-fake
)
ꢀꢀ
(vi)
37.lg＝w
adv
l
adv
+w
con
l
con
+w
enc
l
enc
ꢀꢀ
(vii)
38.在公式(iv)、(v)、(vi)和(vii)中，l
adv
、f
adv
表示特征匹配损失，计算原始一维振动信号经判别器提取的特征和新样本经判别器提取的特征的特征表示之间的l2距离，降低gan训练的不稳定性，基于判别器的内部来更新生成器，即通过反向更新梯度参数和激活函数降低gan训练的不稳定性；l
con
、f
con
表示上下文损失，计算原始一维振动信号和新样本之间的l1距离；l
enc
、f
enc
表示编码器损失，最小化输入的瓶颈特征和新样本经生成器提取的编码特征之间的距离；
39.所述判别器用于：当时频图样本被输入到深度卷积网络模型dc-ganomaly中时，使输出值对时频图样本的预测p
real
尽可能接近1，其中基于交叉熵损失函数更新网络梯度参数，使得损失函数越来越收敛，便能使得判别器对样本的判断越来越接近1；当输入生成的新样本时，判别器试图使对时频图样本的预测p
real
尽可能接近0，其中基于交叉熵损失函数更新网络梯度参数使得损失函数越来越收敛，就可以试图更准确的判断，即判断新样本数据为假；同时，使对时频图样本的预测p
real
尽可能接近1，其中，通过设置一个阈值将特征距离打分，大于所述阈值的输出1，小于等于所述阈值的输出0，以使生成器成功通过判别器；
40.零和博弈发生在判别器和生成器之间，其中最优化目标被转换为最小最大化问题；判别器和生成器在训练期间顺序旋转以被优化：首先固定生成器，然后优化判别器，使其最大化诊断准确率；接下来，与前一步骤相反，固定判别器，然后优化生成器；重复上述过程，直到判别器和生成器达到纳什平衡，完成dc-ganomaly的训练。
41.根据本发明优选的，在所述步骤(3)对轴承故障诊断的具体方法包括：
42.全部轴承故障原始一维振动信号经过小波变换转为1*32*32时频图，将嵌入人为标注故障类别标签的时频图样本输入到生成器，映射到低维重构图，由新样本生成相应的类别标签
43.新样本被标记为0，并且时频图样本被标记为类别标签1，然后将样本组合装载，鉴定和分类真实性，即将时频图样本和新样本一起输入判别器，由判别器判断样本是真实的原始样本还是由生成器生成的新样本；
44.通过最小化训练模型的损失函数，完成对判别器的训练，所述判别器的交叉熵损失函数的计算公式如下：
45.ld＝f
bce
(p
real
，l
real
)
ꢀꢀ
(x)
46.在公式(ix)中，f
bce
指二分类交叉熵损失函数(binary crossentropy loss)；ld是指判别器的损失函数；
47.的标签被设置为1并发送到判别器，判别器不能通过真实性标签为0的新生成样本，通过最小化ld来调整和完成生成器的训练，基于交叉熵损失函数更新网络梯度参数，使得损失函数越来越收敛，就可以最小化ld,深度卷积网络模型dc-ganomaly中的生成器的交叉熵损失函数的计算公式如下：
48.lg＝f
adv
(z
d-real
，z
d-fake
)
ꢀꢀ
(xi)
49.在公式(xi)中，lg、f
adv
表示特征匹配损失，计算原始一维振动信号和新样本经判别器的特征表示之间的l2距离；原始一维振动信号经判别器提取的特征记为z
d-real
，新样本经判别器提取的特征记为z
d-fake
；
50.所述判别器用于：当时频图样本被输入到深度卷积网络模型dc-ganomaly中时，使输出值对时频图样本的预测p
real
尽可能接近1，其中基于交叉熵损失函数更新网络梯度参数，使得损失函数越来越收敛，便能使得判别器对样本的判断越来越接近1；当输入生成的新样本时，判别器试图使对时频图样本的预测p
real
尽可能接近0，其中基于交叉熵损失函数更新网络梯度参数使得损失函数越来越收敛，就可以试图更准确的判断，即判断新样本数据为假；同时，使对时频图样本的预测p
real
尽可能接近1，其中，通过设置一个阈值将特征距离打分，大于所述阈值的输出1，小于等于所述阈值的输出0，以使生成器成功通过判别器；
51.零和博弈发生在判别器和生成器之间，其中最优化目标被转换为最小最大化问题；判别器和生成器在训练期间顺序旋转以被优化：首先固定生成器，然后优化判别器，使其最大化诊断准确率；接下来，与前一步骤相反，固定判别器，然后优化生成器；重复上述过程，直到判别器和生成器达到纳什平衡，完成dc-ganomaly的训练。
52.根据本发明优选的，在步骤(2)中，所述扩充后的训练集对应的扩充方法包括：
53.深度卷积网络模型dc-ganomaly训练完成后，所述生成器根据给定的标签生成不同故障类型的轴承振动信号数据，以对原始不平衡样本集进行扩充，进而实现数据增强的效果，扩充后的数据集记为扩充后的数据标签记为l
ehance
，分类器产生的分类标签记为lc。
54.根据本发明优选的，在步骤(2)中，使用扩充后的训练集进行训练分类器的方法，包括：
55.使用扩充平衡样本集训练分类器，如图5所示；
56.分类器的交叉墒损失函数的计算公式如下：
57.lc＝f
crossentropyloss
l
enhance
，lc)
ꢀꢀ
(xii)
58.在公式(xii)中，lc、f
crossentropyloss
指多分类交叉熵损失函数。
59.离线数据增强完成后，能够解决数据不平衡的问题，从而提高故障诊断精度；故障诊断测试阶段，直接使用离线数据增强阶段中训练好的分类器便可对轴承故障数据产生精准、快速的诊断结果作为输出，故障诊断如图3、图4。
60.本发明的有益技术效果：
61.本发明所述的一种基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法，既可以实现对轴承类部件的异常检测，也可以实现对轴承的故障类别分类。
62.当利用本发明进行异常检测时，使用采集到的正常轴承振动信号转化的时频图进行训练本发明中的模型，模型便学会了正常轴承振动信号数据的特征分布。在测试阶段时输入正常轴承振动数据和异常轴承振动数据，模型提取学习数据的特征分布，通过蝴蝶结自编码器和自解码器后，模型能够减少数据中的噪声干扰，更好的学习数据振动分布，将测试的数据特征分布与训练时期学习到的正常数据的特征分布进行比较，超过设置的阈值便认为发生异常。
63.在异常检测后，将进入故障诊断阶段：将轴承故障数据集输入模型进行训练，所述生成器判别器交替训练完成后达到纳什平衡状态，使用训练好的模型生成故障数据，生成的数据与原始数据具有较强的相似性，将生成的数据加入到训练集中进行数据扩充。使用扩充的数据集重新训练判别器。测试阶段时，将故障数据输入判别器，辅助分类器的最后一层linear层对故障数据做出分类作为结果输出。
64.本发明所述的网络模型在结构上做出相应改进，以及在功能上实现了对轴承部件的异常检测和故障诊断功能融合，还可以使用模型生成数据进行数据扩充，并且在异常检测以及故障诊断达到了较高的准确率。
附图说明
65.图1是本发明深度卷积网络模型dc-ganomaly的框架图；
66.图2是图1具体网络结构示意图；
67.在图2中，在判别器同时具备判别与分类功能；深度卷积网络模型dc-ganomaly网络大体结构及超参数选择是在ganomaly原始文献的基础上进行实验的结果；深度卷积网络模型dc-ganomaly的生成器判别器优化选用adam算法；
68.在图2中，net g指生成器；net d指判别器；encoder和decoder是一对蝴蝶结自编码自解码器；encoder1是异常检测辅助编码器，encoder2是判别器中的编码器：“异常检测”是指基于深度卷积网络模型dc-ganomaly实现轴承异常检测；“特征值”是指通过encoder2图片潜在的特征表示；“对数据的预测标签”是指在异常检测阶段，判别器对数据做出的一个0-1的一个判别数值，用来判断数据是真实数据还是生成数据进而完成模型的训练；“故障诊断”是指训练分类器时产生故障诊断结果以及分类器训练完成后对故障数据进行测试产生的故障诊断分类结果。
69.图3是本发明中对轴承异常检测的示意图；
70.在图3中，initial data：原始一维振动信号；class：正常类别标签；generator：生成器；discriminator：判别器；convolution：卷积神经网络；relu：激活函数；batchnorm：归一化处理；auxilliary encoder：异常检测辅助编码器；sigmoid：二分类激活函数；parameter sharing：参数共享；anomaly detection：异常检测；score：分数；abnormal/normal：异常/正常；
71.图4是本发明针对轴承故障诊断中扩充数据的流程图；
72.在图4中，initial data：原始一维振动信号；class：类别故障标签；generator：生成器；discriminator：判别器；convolution：卷积神经网络；relu：激活函数；batchnorm：归一化处理；sigmoid：二分类激活函数；data enrichment：数据增强；
73.图5是本发明针对轴承故障诊断的流程图；
74.在图5中，fault diagnosis：故障诊断；fault classifier：故障分类；convolution：卷积神经网络；relu：激活函数；flatten：全连接层；linear：全连接层；diagnosis results：诊断结果；
75.图6是利用本发明所述方法对轴承异常检测第一阶段的示意图，即用训练集训练模型，交替训练生成器和判别器，训练完成后，用模型的生成器生成数据并加入训练集；
76.图7是利用本发明所述方法对轴承异常检测的示意图；
77.图8是利用本发明所述方法对轴承异常检测第二阶段的示意图，即用训练集(原始训练数据和生成数据)训练判别器，并用测试集进行验证；
78.图9是利用本发明所述方法对轴承故障诊断过程框架示意图；
79.轴承故障诊断过程分为两个阶段，如图4、图5所示：在迭代初始阶段，dc-ganomaly生成器损失较大，但之后快速收敛，与判别器损失形成纳什平衡；在迭代次数接近50次时，诊断精度达到99.375％；
80.图10本发明轴承异常检测过程框架示意图；
81.图11是增加故障数据类别的故障诊断准确率的示意图；
82.图12是本发明所述方法与其他模型准确率相比较的结果图。
具体实施方式
83.下面结合实施例和说明书附图对本发明做详细的说明，但不限于此。
84.实施例1、
85.一种基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法，包括：
86.(1)构建基于深度卷积生成对抗网络的模型
87.构建一种由cnn和生成对抗网络组成的深度卷积网络模型dc-ganomaly，结合了ganomaly和cgan的特点，在判别器添加了由四层全连接层构成的辅助分类器用于故障类别分类，此设计使用训练好的模型生成逼真数据进行数据扩充并训练分类器，优化损失函数实现轴承故障诊断，和上文连在一起是有监督故障分类模型；
88.(2)对深度卷积网络模型dc-ganomaly的训练
89.在异常检测训练阶段，输入轴承的正常一维振动信号及人为标注正常标签进行模型训练，直到整个网络模型达到纳什平衡状态，得到异常检测阶段训练好的深度卷积网络模型dc-ganomaly；
90.在故障诊断训练阶段，输入轴承的故障一维振动信号及人为标注故障类别标签进行模型训练，直到整个模型达到纳什平衡状态，使用深度卷积网络模型dc-ganomaly生成故障数据并加入初始训练集中，使用扩充后的训练集进行训练分类器，直到损失函数收敛即停止，得到故障诊断阶段训练好的分类器；
91.(3)对轴承异常检测和故障诊断
92.将实时采集到的轴承一维振动信号输入至得到异常检测阶段训练好的深度卷积网络模型dc-ganomaly，得到是否发生异常的检测结果；
93.再将异常的检测结果输入故障诊断阶段训练好的分类器，输出对应的故障类别标签类别。
94.所述深度卷积网络模型dc-ganomaly包括：生成器、生成样本、编码器和判别器；
95.所述生成器为蝴蝶结卷积自编码神经网络架构；所述判别器后添加由四层全连接层构成的辅助分类器用于轴承故障诊断，本设计为在原ganomaly网络框架的基础上，使用蝴蝶结卷积自编码器和dcgan的卷积神经网络架构作为网络主体结构，并于判别器后添加由四层全连接层构成的辅助分类器用于故障诊断，深度卷积网络模型dc-ganomaly如图1所示；深度卷积网络模型dc-ganomaly既能实现对轴承数据的异常检测，也能进行轴承故障类别分类，同时实现gan生成数据对训练集的数据增强，补充不平衡的样本集，提高轴承故障诊断精度；深度卷积网络模型dc-ganomaly的生成器有两个输入，一个是真实样本，一个是真实样本对应的标注故障类别标签，得到生成样本，通过编码器将输入数据与正常一维振动信号数据进行特征比较，与设置的阈值比较后检测是否发生异常，判别器产生轴承故障分类诊断结果作为输出，根据场景设置所述阈值，判断大于所述阈值时发生异常。
96.其中所述生成器属于现有技术，包括一对蝴蝶结自编码自解码器和异常检测辅助编码器，蝴蝶结自编码器共有四层卷积层，中间两个卷积层后加有batchnorm层，前三层后又都使用relu作为激活函数；蝴蝶结自解码器基本与蝴蝶结自编码器对称，第四层则使用tanh作为激活函数；异常检测辅助编码器也由四层卷积层组成，中间两层加有batchnorm层和relu层；
97.所述判别器包括编码器和辅助分类器，该判别器是对现有技术做了相应的改进以对故障数据做出诊断分类，即在判别器里面加了由四层全连接层构成的辅助分类器；
98.所述编码器的结构与蝴蝶结自编码器的结构相同，后使用sigmoid作为激活函数进行分类；
99.所述辅助分类器包括一层flatten层和四层linear层，并由最后一层linear层实现分类。
100.异常检测阶段训练好的深度卷积网络模型dc-ganomaly具体包括：
101.将全部正常数据的原始一维振动信号经过小波变换转为1*32*32时频图样本将嵌入人为标注正常标签的时频图输入到生成器，映射到低维重构图，由生成器生成的新样本生成相应的人为标注的正常异常标签
102.新样本被标记为0，并且时频图样本被标记为类别标签1；
103.然后将样本组合装载，鉴定和分类真实性，即将时频图样本和新样本一起输入判别器，由判别器判断样本是真实的原始样本还是由生成器生成的新样本；
104.此后，时频图样本标签记为l
real
，新样本标签记为l
fake
；对时频图样本的预测记为p
real
，对新样本的预测记为p
fake
；
105.通过最小化训练模型的损失函数，完成对判别器的训练；所述判别器的交叉熵损失函数的计算公式如下：
106.l
d-real
＝f
bce
(p
real
，l
real
)
ꢀꢀ(i)107.l
d-fake
＝f
bce
(p
fake
，l
fake
)
ꢀꢀ
(ii)
108.ld＝l
d-real
+l
d-fake
)*0.5
ꢀꢀ
(iii)
109.在公式(i)、公式(ii)和公式(iii)中，l
d-real
为时频图样本输入判别器后得到的对
时频图样本的预测标签和真实标签之间的损失函数；f
bce
指二分类交叉熵损失函数(binary crossentropy loss)；l
d-fake
为新样本输入判别器后得到的对生成样本的预测标签和生成样本的生成标签之间的损失函数；la判别器的交叉熵损失函数；
110.新样本的标签被设置为1并发送到判别器，判别器通过标签为非0的新样本；通过最小化ld来调整和完成生成器的训练，即通过反向更新梯度参数实现最小化；原始一维振动信号经判别器提取的特征记为z
d-read
，新样本经判别器提取的特征记为z
d-fake
；原始一维振动信号经生成器产生的瓶颈特征记为z
g-real
，新样本经生成器提取的编码特征记为z
g-fake
；所述生成器的交叉熵损失函数的计算公式如下：
111.l
adv
＝f
adv
(z
d-real
，z
d-fake
)
ꢀꢀ
(iv)
112.l
con
＝f
con
(x，x
fake
)
ꢀꢀ
(v)
113.l
enc
＝f
enc
(z
g-real
，z
g-fake
)
ꢀꢀ
(vi)
114.lg＝w
adv
l
adv
+w
con
l
con
+w
enc
l
enc
ꢀꢀ
(vii)
115.在公式(iv)、(v)、(vi)和(vii)中，l
adv
、f
adv
表示特征匹配损失，计算原始一维振动信号经判别器提取的特征和新样本经判别器提取的特征的特征表示之间的l2距离，降低gan训练的不稳定性，基于判别器的内部来更新生成器，即通过反向更新梯度参数和激活函数降低gan训练的不稳定性；l
con
、f
con
表示上下文损失，计算原始一维振动信号和新样本之间的l1距离；l
enc
、f
enc
表示编码器损失，最小化输入的瓶颈特征和新样本经生成器提取的编码特征之间的距离；
116.所述判别器用于：当时频图样本被输入到深度卷积网络模型dc-ganomaly中时，使输出值对时频图样本的预测p
real
尽可能接近1，其中基于交叉熵损失函数更新网络梯度参数，使得损失函数越来越收敛，便能使得判别器对样本的判断越来越接近1；当输入生成的新样本时，判别器试图使对时频图样本的预测p
real
尽可能接近0，其中基于交叉熵损失函数更新网络梯度参数使得损失函数越来越收敛，就可以试图更准确的判断，即判断新样本数据为假；同时，使对时频图样本的预测p
reat
尽可能接近1，其中，通过设置一个阈值将特征距离打分，大于所述阈值的输出1，小于等于所述阈值的输出0，以使生成器成功通过判别器：
117.零和博弈发生在判别器和生成器之间，其中最优化目标被转换为最小最大化问题；判别器和生成器在训练期间顺序旋转以被优化：首先固定生成器，然后优化判别器，使其最大化诊断准确率；接下来，与前一步骤相反，固定判别器，然后优化生成器；重复上述过程，直到判别器和生成器达到纳什平衡，完成dc-ganomaly的训练。
118.实施例2、
119.如实施例1所述一种基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法，在所述步骤(3)对轴承故障诊断的具体方法包括：
120.全部轴承故障原始一维振动信号经过小波变换转为1*32*32时频图，将嵌入人为标注故障类别标签的时频图样本输入到生成器，映射到低维重构图，由新样本
生成相应的类别标签
121.新样本被标记为0，并且时频图样本被标记为类别标签1，然后将样本组合装载，鉴定和分类真实性，即将时频图样本和新样本一起输入判别器，由判别器判断样本是真实的原始样本还是由生成器生成的新样本；
122.通过最小化训练模型的损失函数，完成对判别器的训练，所述判别器的交叉熵损失函数的计算公式如下：
123.ld＝f
bce
(p
real
，l
real
)
ꢀꢀ
(x)
124.在公式(ix)中，f
bce
指二分类交叉熵损失函数(binary crossentropy loss)；ld是指判别器的损失函数：
125.的标签被设置为1并发送到判别器，判别器不能通过真实性标签为0的新生成样本，通过最小化ld来调整和完成生成器的训练，基于交叉熵损失函数更新网络梯度参数，使得损失函数越来越收敛，就可以最小化ld，深度卷积网络模型dc-ganomaly中的生成器的交叉熵损失函数的计算公式如下：
126.lg＝f
adv
(z
d-real
，z
d-fake
)
ꢀꢀ
(xi)
127.在公式(xi)中，lg、f
adv
表示特征匹配损失，计算原始一维振动信号和新样本经判别器的特征表示之间的l2距离；原始一维振动信号经判别器提取的特征记为z
d-real
，新样本经判别器提取的特征记为z
d-fake
；
128.所述判别器用于：当时频图样本被输入到深度卷积网络模型dc-ganomaly中时，使输出值对时频图样本的预测p
real
尽可能接近1，其中基于交叉熵损失函数更新网络梯度参数，使得损失函数越来越收敛，便能使得判别器对样本的判断越来越接近1；当输入生成的新样本时，判别器试图使对时频图样本的预测p
real
尽可能接近0，其中基于交叉熵损失函数更新网络梯度参数使得损失函数越来越收敛，就可以试图更准确的判断，即判断新样本数据为假；同时，使对时频图样本的预测p
real
尽可能接近1，其中，通过设置一个阈值将特征距离打分，大于所述阈值的输出1，小于等于所述阈值的输出0，以使生成器成功通过判别器；
129.零和博弈发生在判别器和生成器之间，其中最优化目标被转换为最小最大化问题；判别器和生成器在训练期间顺序旋转以被优化：首先固定生成器，然后优化判别器，使其最大化诊断准确率；接下来，与前一步骤相反，固定判别器，然后优化生成器；重复上述过程，直到判别器和生成器达到纳什平衡，完成dc-ganomaly的训练。
130.实施例3、
131.如实施例1、2所述一种基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法，在步骤(2)中，所述扩充后的训练集对应的扩充方法包括：
132.深度卷积网络模型dc-ganomaly训练完成后，所述生成器根据给定的标签生成不同故障类型的轴承振动信号数据，以对原始不平衡样本集进行扩充，进而实现数据增强的效果，扩充后的数据集记为扩充后的数据标签记为l
enhance
，分类器产生的分类标
签记为lc。
133.在步骤(2)中，使用扩充后的训练集进行训练分类器的方法，包括：
134.使用扩充平衡样本集训练分类器，如图5所示；
135.分类器的交叉熵损失函数的计算公式如下：
136.lc＝f
crossentropyloss
(l
enhance
，lc)
ꢀꢀ
(xii)
137.在公式(xii)中，lc、f
crossentropyloss
指多分类交叉熵损失函数。
138.离线数据增强完成后，能够解决数据不平衡的问题，从而提高故障诊断精度；故障诊断测试阶段，直接使用离线数据增强阶段中训练好的分类器便可对轴承故障数据产生精准、快速的诊断结果作为输出，故障诊断如图4、图5。
139.根据上述实施例所记载的技术内容，以下具体说明：
140.一、采用离线模型训练，在线异常检测的模式，进行轴承异常检测过程如图10所示。
141.异常检测阶段在迭代次数接近45次时，检测精度达到92.6％。
142.1、离线模型训练
143.基于损失函数，对模型参数进行迭代更新。模型训练采用adam优化器，判别器与生成器的学习率均设置为0.0002。在每个训练单元中，依次分别交替训练判别器以及生成器。
144.训练过程可以分为两个步骤：
145.(1)正常训练样本中的原始一维振动信号经过小波变换转为时频图，将嵌入正常标签的时频图输入到生成器模型中，得到低维重构图；重构图与真实样本数据混合在一起传送至判别器进行训练，基于其损失函数计算出判别器网络的损失值，使用adam优化器更新网络参数。
146.(2)训练判别器后，组合结构开始训练。在这一阶段，模型保持判别器网络权重不变，同样根据损失函数计算模型生成器的损失值，使用adam优化器更新网络参数。在每次更新生成器网络参数之前，先执行判别器网络参数的更新，以提高模型训练速度。
147.在训练完这个组合结构后，也就是一个epoch已经结束，模型的训练过程会重新开始。经过足够次的迭代训练，判别器和生成器网络达到纳什平衡，模型训练完成。此时网络模型可检测输入振动信号是否发生异常。
148.2、在线异常检测
149.离线训练模型完成后，将测试集中的故障数据图像输入训练好的dc-ganomaly模型，编码器的异常重构导致异常检测辅助编码器得到异常特征向量，从而导致与原始输入数据瓶颈特征向量的不相似性，通过最小化特征差异得出是否发生异常的判断。
150.二、基于本发明轴承故障诊断实现过程，采用离线数据增强，在线故障诊断的模式，如图9所示。
151.故障诊断阶段在迭代次数接近50次时，诊断精度达到99.375％。
152.1、离线数据增强
153.基于损失函数，对模型参数进行迭代更新。模型训练采用adam优化器，判别器与生成器的学习率均设置为0.0007。在每个训练单元中，依次分别交替训练判别器以及生成器。训练过程可以分为两个步骤：
154.(1)全部原始一维振动信号(仅故障数据)经过小波变换转为时频图，将嵌入类别
标签的时频图输入到生成器模型，得到低维重构图；重构图与真实样本数据混合在一起传送至判别器进行训练，基于其损失函数计算出判别器网络的损失值，使用adam优化器更新网络参数。
155.(2)训练判别器后，组合结构开始训练。在这一阶段，模型保持判别器网络权重不变，同样根据损失函数计算模型生成器的损失值，使用adam优化器更新网络参数。在每次更新生成器网络参数之前，先执行判别器网络参数的更新，以提高模型训练速度。
156.在训练完这个组合结构后，也就是一个epoch已经结束，模型的训练过程会重新开始。经过足够次的迭代训练，判别器和生成器网络达到纳什平衡，模型训练完成。此时生成器可根据给定的标签生成不同故障类型的轴承振动信号数据，利用生成数据对原始不平衡样本集进行扩充，进而实现数据增强的效果。随后，使用扩充平衡样本集训练分类器。
157.2、在线故障诊断
158.离线数据增强完成后，能够解决数据不平衡的问题，从而提高故障诊断精度。在线故障诊断阶段，直接使用离线数据增强阶段中训练好的分类器便可对轴承故障数据做出精准、快速的诊断。
159.3、算例分析
160.仿真硬件为11th gen intel(r)core(tm)i5-1135g7@2.40ghz 2.42ghz，8gb运行内存、内存为462gb的laptop-qp4fbg28，改进网络模型基于深度学习框架pytorch和keras构建。
161.3.1实验样本构建
162.(1)基于dc-ganomaly的轴承异常检测实验样本构建
163.为方便模型训练，将所选的试验样本划分为两部分：训练集和测试集。使用训练集对改进dc-ganomaly进行训练，使用测试集对模型进行验证。选取正常试验样本的前三类作为训练集，第四类正常试验样本和三类异常样本作为测试集。epoch设定为100，batch size设定为64，w
adv
、w
con
、w
enc
分别设置为1、60、1。
164.(2)基于dc-ganomaly的轴承故障诊断实验样本构建
165.故障诊断实验样本构建如下：将三类故障数据集随机分开，80％和20％的样本分别作为训练集和测试集的一部分。epoch设定为100，batch size设定为64。使用训练集对改进dc-ganomaly进行训练，训练完成后，对轴承故障样本进行生成，得到dc-ganomaly生成的轴承故障样本。将生成的轴承故障样本加入训练集，扩充轴承故障不平衡样本集。使用测试集对模型进行验证。
166.3.2模型训练
167.(1)基于dc-ganomaly的轴承异常检测过程
168.基于dc-ganomaly的轴承异常检测过程如图3所示。在迭代初始阶段，dc-ganomaly生成器损失较大，但之后快速收敛，与判别器损失形成纳什平衡。在迭代次数接近45次时，检测精度达到92.6％。
169.综上所述，与原ganomaly相比，本发明深度卷积网络模型dc-ganomaly实现了对轴承振动信号的异常检测和故障分类，并在检测精度和诊断精度均表现更好。
170.另外，结合图11、图12可知，下面两图分别是增加故障数据类别的故障诊断准确率以及与其他模型准确率相比较的结果图，由图11实验结果可知，随着故障数据类别以及训
练次数的增加，模型的故障诊断准确率均有所提升，并接近100％，表明模型对轴承故障诊断的有效性；由图12可知，本文提出的模型相较于传统机器学习模型具有十分明显的优越性。
171.随着科学技术飞速发展，工业水平不断提高，越来越多机械设备投入使用。几乎所有的机械设备都会用到轴承部件，且轴承发挥着至关重要的作用。多数轴承运行环境恶劣，运行工况复杂多变，轴承发生故障的次数也就增多。因此对轴承故障做出精准的检测及分类可以提高机械设备的经济效益。但是轴承故障数据少，存在严重的数据不平衡问题，给基于大量训练数据的深度学习网络模型带来很大困难。
172.本发明结合实施例和附图从模型融合及数据增强的观点出发，利用生成对抗网络(gan)在目前表现出的强大的数据生成能力，基于深度卷积网络模型dc-ganomaly实现对轴承的异常检测以及数据增强后故障诊断，进一步提高检测和诊断精度。在工程实践中提高异常检测和故障诊断效率，节省人力物力资源，提升异常检测和故障诊断准确率，提升机械设备经济效益。

技术特征：
1.一种基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法，其特征在于，包括：(1)构建基于深度卷积生成对抗网络的模型构建一种由cnn和生成对抗网络组成的深度卷积网络模型dc-ganomaly，在判别器添加了由四层全连接层构成的辅助分类器用于故障类别分类；(2)对深度卷积网络模型dc-ganomaly的训练在异常检测训练阶段，输入轴承的正常一维振动信号及人为标注正常标签进行模型训练，直到整个网络模型达到纳什平衡状态，得到异常检测阶段训练好的深度卷积网络模型dc-ganomaly；在故障诊断训练阶段，输入轴承的故障一维振动信号及人为标注故障类别标签进行模型训练，直到整个模型达到纳什平衡状态，使用深度卷积网络模型dc-ganomaly生成故障数据并加入初始训练集中，使用扩充后的训练集进行训练分类器，直到损失函数收敛即停止，得到故障诊断阶段训练好的分类器；(3)对轴承异常检测和故障诊断将实时采集到的轴承一维振动信号输入至得到异常检测阶段训练好的深度卷积网络模型dc-ganomaly，得到是否发生异常的检测结果；再将异常的检测结果输入故障诊断阶段训练好的分类器，输出对应的故障类别标签类别。2.根据权利要求1所述一种基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法，其特征在于，所述深度卷积网络模型dc-ganomaly包括：生成器、生成样本、编码器和判别器；所述生成器为蝴蝶结卷积自编码神经网络架构；所述判别器后添加由四层全连接层构成的辅助分类器用于轴承故障诊断；深度卷积网络模型dc-ganomaly既能实现对轴承数据的异常检测，也能进行轴承故障类别分类，同时实现gan生成数据对训练集的数据增强，补充不平衡的样本集，提高轴承故障诊断精度；深度卷积网络模型dc-ganomaly的生成器有两个输入，一个是真实样本，一个是真实样本对应的标注故障类别标签，得到生成样本，通过编码器将输入数据与正常一维振动信号数据进行特征比较，与设置的阈值比较后检测是否发生异常，判别器产生轴承故障分类诊断结果作为输出，根据场景设置所述阈值，判断大于所述阈值时发生异常。3.根据权利要求1所述一种基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法，其特征在于，异常检测阶段训练好的深度卷积网络模型dc-ganomaly具体包括：将全部正常数据的原始一维振动信号经过小波变换转为时频图样本将嵌入人为标注正常标签的时频图输入到生成器，映射到低维重构图，由生成器生成的新样本生成相应的人为标注的正常异常标签新样本被标记为0，并且时频图样本被标记为类别标签1：然后将样本组合装载，鉴定和分类真实性；此后，时频图样本标签记为l
real
，新样本标签记为l
fake
；对时频图样本的预
测记为p
real
，对新样本的预测记为p
fake
；通过最小化训练模型的损失函数，完成对判别器的训练；所述判别器的交叉熵损失函数的计算公式如下：l
d-real
＝f
bce
(p
real
，l
real
)
ꢀꢀ
(i)l
d-fake
＝f
bce
(p
fake
，l
fake
)
ꢀꢀꢀ
(ii)l
d
＝(l
d-real
+l
d-fake
)*0.5
ꢀꢀꢀ
(iii)在公式(i)、公式(ii)和公式(iii)中，l
d-real
为时频图样本输入判别器后得到的对时频图样本的预测标签和真实标签之间的损失函数；f
bce
指二分类交叉熵损失函数；l
d-fake
为新样本输入判别器后得到的对生成样本的预测标签和生成样本的生成标签之间的损失函数；l
d
判别器的交叉熵损失函数；新样本的标签被设置为1并发送到判别器，判别器通过标签为非0的新样本；通过最小化l
d
来调整和完成生成器的训练；原始一维振动信号经判别器提取的特征记为z
d-eal
，新样本经判别器提取的特征记为z
d-fake
；原始一维振动信号经生成器产生的瓶颈特征记为z
g-real
，新样本经生成器提取的编码特征记为z
g-fake
；所述生成器的交叉熵损失函数的计算公式如下：l
adv
＝f
adv
(z
d-real
，z
d-fake
)
ꢀꢀ
(iv)l
con
＝f
con
(x，x
fake
)
ꢀꢀ
(v)l
enc
＝f
enc
(z
g-real
，z
g-fake
)
ꢀꢀꢀ
(vi)l
g
＝w
adv
l
adv
+w
con
l
con
+w
enc
l
enc
ꢀꢀꢀ
(vii)在公式(iv)、(v)、(vi)和(vii)中，l
adv
、f
adv
表示特征匹配损失，计算原始一维振动信号经判别器提取的特征和新样本经判别器提取的特征的特征表示之间的l2距离，降低gan训练的不稳定性，基于判别器的内部来更新生成器；l
con
、f
con
表示上下文损失，计算原始一维振动信号和新样本之间的l1距离；l
enc
、f
enc
表示编码器损失，最小化输入的瓶颈特征和新样本经生成器提取的编码特征之间的距离；所述判别器用于：当时频图样本被输入到深度卷积网络模型dc-ganomaly中时，使输出值对时频图样本的预测p
real
接近1；当输入生成的新样本时，判别器试图使对时频图样本的预测p
real
接近0，即判断新样本数据为假；同时，使对时频图样本的预测p
real
接近1，以使生成器成功通过判别器。4.根据权利要求1所述一种基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法，其特征在于，在所述步骤(3)对轴承故障诊断的具体方法包括：全部轴承故障原始一维振动信号经过小波变换转为1*32*32时频图，将嵌入人为标注故障类别标签的时频图样本输入到生成器，映射到低维重构图，由新样本生成相应的类别标签新样本被标记为0，并且时频图样本被标记为类别标签1，然后将样本组合装载，鉴定和分类真实性；通过最小化训练模型的损失函数，完成对判别器的训练，所述判别器的交叉熵损失函
数的计算公式如下：l
d
＝f
bce
(p
real
，l
real
)
ꢀꢀꢀ
(x)在公式(ix)中，f
bce
指二分类交叉熵损失函数；ld是指判别器的损失函数；的标签被设置为1并发送到判别器，判别器不能通过真实性标签为0的新生成样本，通过最小化ld来调整和完成生成器的训练，深度卷积网络模型dc-ganomaly中的生成器的交叉熵损失函数的计算公式如下：l
g
＝f
adv
(z
d-real
，z
d-fake
)
ꢀꢀꢀ
(xi)在公式(xi)中，l
g
、f
adv
表示特征匹配损失，计算原始一维振动信号和新样本经判别器的特征表示之间的l2距离；原始一维振动信号经判别器提取的特征记为z
d-real
，新样本经判别器提取的特征记为z
d-fake
；所述判别器用于：当时频图样本被输入到深度卷积网络模型dc-ganomaly中时，使输出值对时频图样本的预测p
real
接近1：当输入生成的新样本时，判别器试图使对时频图样本的预测p
real
接近0，即判断新样本数据为假；同时，使对时频图样本的预测p
real
接近1，以使生成器成功通过判别器。5.根据权利要求1所述一种基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法，其特征在于，在步骤(2)中，所述扩充后的训练集对应的扩充方法包括：深度卷积网络模型dc-ganomaly训练完成后，所述生成器根据给定的标签生成不同故障类型的轴承振动信号数据，扩充后的数据集记为扩充后的数据标签记为l
enhance
，分类器产生的分类标签记为l
c
。6.根据权利要求5所述一种基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法，其特征在于，在步骤(2)中，使用扩充后的训练集进行训练分类器的方法，包括：分类器的交叉熵损失函数的计算公式如下：l
c
＝f
crossentropyloss
(l
enhance
，l
c
) (xii)在公式(xii)中，l
c
、f
crossentropyloss
指多分类交叉熵损失函数。

技术总结
一种基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法，属于人工智能识别机械部件的技术领域，既可以实现对轴承类部件的异常检测，也可以实现对轴承的故障类别分类。本发明所述的网络模型在结构上做出相应改进，以及在功能上实现了对轴承部件的异常检测和故障诊断功能融合，还可以使用模型生成数据进行数据扩充，并且在异常检测以及故障诊断达到了较高的准确率。较高的准确率。较高的准确率。

技术研发人员：张羽郝慧娟赵媛媛陈宇袁慧苗
受保护的技术使用者：齐鲁工业大学（山东省科学院）
技术研发日：2023.04.25
技术公布日：2023/9/14

版权声明

本文仅代表作者观点，不代表航家之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

上一篇：一种面向光刻热点检测的模型分块聚合隐私保护方法 下一篇：一种塑料颗粒挤出机的制作方法

基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表