基于AICDA模型的机械故障多源混合迁移诊断方法

未命名 09-17 阅读:74 评论:0

基于aicda模型的机械故障多源混合迁移诊断方法
技术领域
1.本发明属于机械故障诊断技术领域,涉及一种基于自适应中间类级分布对齐(adaptive intermediate class-wise distribution alignment,aicda)模型的机械故障多源混合迁移诊断方法。


背景技术:

2.目前,已有许多迁移学习方法被提出去应用于机械故障智能诊断,他们的损失函数一般由健康状态分类损失、分布距离损失和相关正则化损失构成,但是三者之间的权衡参数和内在超参数是需要根据诊断任务的不同而个性化随机网格搜索,因此,这些方法在大多数诊断任务中的泛化能力较低。另一方面,由于绝大多数迁移诊断方法的分布对齐目标处于实时动态变化中,这将导致优化损失大幅震荡、收敛缓慢和鲁棒性差等问题。它们只考虑了单个源域的诊断先验知识,同时也仅仅服务于目标域和源域之间的一种特定诊断任务,但是,在实际工程应用中,本领域技术人员很难提前预知目标机械的健康状态种类。
3.为此,亟需一种简单且通用多源机械故障的迁移诊断方法。


技术实现要素:

4.有鉴于此,本发明的目的在于提供一种基于自适应中间类级分布对齐(aicda)模型的机械故障多源混合迁移诊断方法,该方法简单且通用于多源机械故障迁移诊断。
5.为达到上述目的,本发明提供如下技术方案:
6.一种基于aicda模型的机械故障多源混合迁移诊断方法,首先,在aicda中,动态中间对齐(dynamic intermediate alignment,dia)层是被设计去自适应减小源域和目标域的分布差异,同时它不需要分布距离损失和相关正则化损失;为了保证aicda的对目标机械设备健康状态的分类效果,一个自适应分类损失(adaptive softmax,adasoftmax)被构造去增加可分性,该损失也没有内在的超参数。该方法具体包括以下步骤:
7.s1:将加速度传感器安装在机械设备上,采集不同工况下的原始振动信号;然后,将采集到的原始振动信号利用滑动采样技术扩充故障样本数据集,并划分出训练样本集和测试样本集;
8.s2:构建aicda模型,该模型采用一维卷积神经网络作为主干网络,包括四个“conv1d”卷积块、两个fc卷积层、四个dia层、四个类级动态中间对齐(dynamic intermediate alignment,dia)层和一个adasoftmax分类损失。
9.s3:将划分好的的训练样本输入到构建好的aicda模型中,利用目标域样本的伪标签自监督学习函数和多个源域样本的真实标签学习函数构成的总体优化目标函数对aicda模型进行迭代优化训练;
10.s4:经过多次迭代训练,观察损失曲线是否趋于平稳收敛,如果曲线收敛则模型训练完成,训练好的aicda模型将用于不同工况下的机械多源混合迁移故障诊断。
11.进一步,步骤s2中,动态中间对齐的表达式为:
[0012][0013]
其中,γ和β是可梯度反向传播自动更新的训练参数;
[0014][0015]
其中,xs和x
t
分别表示源域特征和目标域特征,对应服从正态分布和和分别表示为源域和目标域的分布参数;zs和z
t
分别表示分布对齐后的源域特征和目标域特征。
[0016]
进一步,步骤s2中,adasoftmax分类损失ly的表达式为:
[0017][0018]
其中,fi(c)表示网络最后一个全连接层输出第i个样本特征fi的对应于标签索引位置的元素值,fi(j)表示除标签索引位置元素的其他元素,m表示样本数量;k是决策裕度。
[0019]
进一步,步骤s2中,决策裕度k的表达式为:
[0020]
k=e
(homogeneity+completeness+v-measure)-1
[0021]
其中,homogeneity、completeness、v-measure分别表示同质性、完整性和v测度;
[0022]
homogeneity=1-h(c|k)/h(c)
[0023]
completeness=1-h(k|c)/h(k)
[0024][0025]
其中,h(c|k)和h(k|c)分别表示在给定簇和类下的条件熵,h(c)和h(k)分别表示在类和簇下的信息熵。
[0026]
进一步,步骤s3中,优化训练aicda模型,具体包括:通过构建的adasoftmax分类损失和目标域伪标签,总体优化目标函数lw表示为:
[0027][0028]
其中,m
t
表示目标域的样本数量,表示第n个源域的样本数量,和分别表示目标域第i个样本的特征向量和伪标签,和分别表示第n个源域的第i个样本的特征向量和真实标签,l
t
(
·
)和分别表示作用在目标域样本和源域样本上的交叉熵损失;
[0029]
利用上式全局子模型θg和类级子模型θc的可训练参数被更新为:
[0030][0031][0032]
其中,ε是超参数,表示学习速率。
[0033]
本发明的有益效果在于:本发明提高了机械故障迁移诊断的精度和泛化能力,具体体现在以下方面:
[0034]
(1)本发明采用动态中间对齐(dia)层来自适应减小源域和目标域的分布差异,避免了在分布对齐过程中的损失震荡、收敛缓慢和鲁棒性弱等问题,避免了负迁移效果的出现,同时它不需要分布距离损失和相关正则化损失。
[0035]
(2)本发明采用的adasoftmax分类损失无需其他技巧和额外的计算复杂度可以直接通过梯度反向传播去优化网络参数,即在保证aicda的对目标机械设备健康状态的分类效果的同时,降低了整体网络模型的计算复杂度。
[0036]
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
[0037]
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
[0038]
图1为自适应中间类级分布对齐(aicda)模型结构图;
[0039]
图2为动态中间对齐(dia)层的工作原理图;
[0040]
图3为dds试验台示意图。
具体实施方式
[0041]
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
[0042]
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
[0043]
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
[0044]
请参阅图1~图3,本发明实施例提供一种基于自适应中间类级分布对齐(aicda)模型的行星齿轮箱多源混合迁移诊断方法,具体流程为:
[0045]
1、通过安装加速度传感器在机械设备上采集不同工况下的原始振动信号,以便于构建后续的迁移诊断任务。然后,将采集到的原始振动信号利用滑动采样技术扩充故障样本数据集,并划分出训练样本集和测试样本集。
[0046]
2、通过一维卷积神经网络搭建自适应类级分布对齐模型主干网络结构;然后,结合提出来的adasoftmax分类损失和dia层构建自适应中间类级分布对齐(aicda)模型。
[0047]
如图1所示,aicda模型采用一维卷积神经网络作为主干网络去自适应提取健康状态特征。该模型主要分为全局子模型和类级子模型两块,全局子模型为后续类级子模型的目标域样本提供伪标签。该模型具体网络结构包含五个“conv1d”卷积块、两个fc卷积层、五个dia层、五个类级dia层和一个adasoftmax分类损失,其中“conv1d”卷积块中由一个卷积层、一个非线性激活层和一个最大池化层构成。下面将详细介绍自适应中间类级分布对齐模型中的dia层、adasoftmax分类损失以及aicda的优化过程。
[0048]
1)动态中间对齐层(dynamic intermediate alignment,dia)
[0049]
dia层的工作原理如图2所示,假设源域特征xs和目标域特征x
t
分别服从正态分布和然后这两个正态可以通过下式被归一化到一个特定的中间分布n(0,1)。
[0050][0051]
其中,和分别表示为源域和目标域的分布参数(均值和方差)。
[0052]
即使通过式(1),源域和目标域之间的分布差异可以被消除。但是中间分布最好是从源域和目标域之间的公共属性去自适应学习得到。可以从图2看到,在式(1)中所用的固定中间分布是可能远离源域和目标域的特征分布,如果强行进行归一化分布对齐,将不可避免导致损失震荡、收敛缓慢和鲁棒性弱等问题甚至负迁移效果的出现。因此,一个自适应的中间分布对齐被设计去解决上述的问题。
[0053][0054]
其中,γ和β是可梯度反向传播自动更新的训练参数。通过式(2),动态中间对齐层将会在正态分布先验知识下自动学习适配出适用于源域和目标域的中间分布,从而能够有效的加速网络收敛和增强模型鲁棒性。
[0055]
2)adasoftmax分类损失
[0056]
自适应中间类级分布对齐模型是致力于学习到域不变且可分的健康状态特征。dia层仅确保了域不变特征的学习,因此,一个带有严格决策边界且可以自适应学习得到的分类损失需要去增强可分特征的学习。基于上述的分析,本发明构建了adasoftmax分类损失,其决策裕度可以依据模型训练过程中样本特征自身的属性变化而自适应学习,从而避免了网格随机搜索带来的计算资源浪费。adasoftmax分类损失ly如下式所示:
[0057][0058]
其中,fi(c)表示网络最后一个全连接层输出第i个样本特征fi的对应于标签索引位置的元素值,fi(j)表示除标签索引位置元素的其他元素,m表示样本数量;k是决策裕度,
其表达式如下:
[0059]
k=e
(homogeneity+completeness+v-measure)-1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0060]
其中,homogeneity、completeness、v-measure分别表示同质性、完整性和v测度。
[0061]
homogeneity=1-h(c|k)/h(c)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0062]
completeness=1-h(k|c)/h(k)
ꢀꢀꢀꢀꢀ
(6)
[0063][0064]
其中,h(c|k)和h(k|c)分别表示在给定簇和类下的条件熵,h(c)和h(k)分别表示在类和簇下的信息熵。
[0065]
假设p表示adasoftmax输出的向量,y是对应的独热编码向量,adasoftmax分类损失的梯度可以由下式计算得到:
[0066][0067]
其中,θ表示网络模型的可学习参数,则可以表示为:
[0068][0069]
通过式(8)和式(9),可以知道adasoftmax分类损失的梯度和原始softmax分类损失的梯度是相同的,这意味着adasoftmax分类损失无需其他技巧和额外的计算复杂度可以直接通过梯度反向传播去优化网络参数。
[0070]
3、将划分好的的训练样本输入到构建好的自适应中间类级分布对齐模型中,利用目标域样本的伪标签自监督学习函数和多个源域样本的真实标签学习函数构成的总体优化目标函数(式(10))对该迁移诊断模型进行迭代优化训练,如公式(11)和式(12)所示。
[0071]
模型优化过程:
[0072]
通过构建的adasoftmax分类损失和目标域伪标签,整个目标函数lw可以被表示为:
[0073][0074]
其中,m
t
表示目标域的样本数量,表示第n个源域的样本数量,和分别表示目标域第i个样本的特征向量和伪标签,和分别表示第n个源域的第i个样本的特征向量和真实标签,l
t
(
·
)和分别表示作用在目标域样本和源域样本上的交叉熵损失。利用式(10),图1中的全局子模型θg和类级子模型θc的可训练参数可以被更新:
[0075][0076][0077]
其中,ε是超参数,表示学习速率。
[0078]
4、经过多次迭代训练,观察损失曲线是否趋于平稳收敛,如果曲线收敛则诊断模型训练完成,训练好的迁移网络将用于不同工况下的行星齿轮箱多源混合迁移故障诊断。
[0079]
以上是提出的自适应中间类级分布对齐模型用于风机行星齿轮箱混合迁移故障诊断的流程步骤,下面的实验结果已说明方法的有效性。
[0080]
验证实验:本实验收集的齿轮原始振动信号来自dds试验台,如图3所示。dds试验台主要由电机、行星齿轮箱、平行齿轮箱及磁粉制动器五部分组成。不同工况信号可以通过磁粉制动器加载模拟获得。该行星齿轮箱共有五种健康信息:正常(nc)、表面磨损(sw)、齿根破裂(rc)、轮齿缺损(ct)、轮齿折断(mt)。加速度传感器a和b安装在行星齿轮箱上收集原始振动信号。通过控制磁粉制动器的电流大小,四种工况被模拟,其包含0n.m(l1)、1.4n.m(l2)、2.8n.m(l3)和25.2n.m(l4)。如表1所示,结合上述五种健康状态信息和四个工况,多源混合迁移诊断任务被构建,其中主要包含三种子类迁移诊断任务:多源闭集迁移、多源部分迁移和多源开集迁移。
[0081]
表1多源混合迁移诊断任务的详细信息
[0082][0083]
对比实验:
[0084]
为了证明本发明基于自适应中间类级分布对齐模型(aicda)的多源混合迁移诊断方法的优越性,对比于当前典型的单源边缘分布对齐的网络模型(ddc、dcoral、dann、mcd),经典的多源边缘分布对齐(msddc,mscoral)和知名的多源联合分布对齐(msjda)。为了保障实验结果的可靠性,每个多源混合迁移诊断任务重复五次,其12个多源混合迁移诊断任务的实验结果(包含准确率和标准差)分别如表2和表3所示。
[0085]
表2实验结果
[0086]
[0087]
表3实验结果
[0088][0089]
从表2和表3可以得出,本发明提出的自适应中间类级分布对齐模型具有更高的迁移诊断精度和更强的泛化能力(粗体表示在每一个迁移诊断任务下最高的诊断准确率)。aicda在12个多源混合迁移诊断任务上的平均诊断准确率达到了88.87%以上,在大多数诊断任务中相较于其他对比方法都有一个明显的提升;特别的,对于多源部分迁移诊断子类任务,aicda的平均诊断准确率达到了91.86%,相比于其他经典的迁移诊断任务提升了至少14.07%。
[0090]
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

技术特征:
1.一种基于aicda模型的机械故障多源混合迁移诊断方法,其特征在于,该方法具体包括以下步骤:s1:将加速度传感器安装在机械设备上,采集不同工况下的原始振动信号;然后,将采集到的原始振动信号利用滑动采样技术扩充故障样本数据集,并划分出训练样本集和测试样本集;s2:构建aicda模型,该模型采用一维卷积神经网络作为主干网络,包括四个“conv1d”卷积块、两个fc卷积层、四个dia层、四个类级dia层和一个adasoftmax分类损失;其中,aicda表示自适应中间类级分布对齐,dia表示动态中间对齐,adasoftmax分类损失表示自适应分类损失;s3:将划分好的的训练样本输入到构建好的aicda模型中,利用目标域样本的伪标签自监督学习函数和多个源域样本的真实标签学习函数构成的总体优化目标函数对aicda模型进行迭代优化训练;s4:经过多次迭代训练,观察损失曲线是否趋于平稳收敛,如果曲线收敛则模型训练完成,训练好的aicda模型将用于不同工况下的机械多源混合迁移故障诊断。2.根据权利要求1所述的机械故障多源混合迁移诊断方法,其特征在于,步骤s2中,动态中间对齐的表达式为:其中,γ和β是可梯度反向传播自动更新的训练参数;其中,x
s
和x
t
分别表示源域特征和目标域特征,对应服从正态分布和和和分别表示为源域和目标域的分布参数;z
s
和z
t
分别表示分布对齐后的源域特征和目标域特征。3.根据权利要求1所述的机械故障多源混合迁移诊断方法,其特征在于,步骤s2中,adasoftmax分类损失l
y
的表达式为:其中,f
i
(c)表示网络最后一个全连接层输出第i个样本特征f
i
的对应于标签索引位置的元素值,f
i
(j)表示除标签索引位置元素的其他元素,m表示样本数量;k是决策裕度。4.根据权利要求3所述的机械故障多源混合迁移诊断方法,其特征在于,步骤s2中,决策裕度k的表达式为:k=e
(homogeneity+completeness+v-measure)-1其中,homogeneity、completeness、v-measure分别表示同质性、完整性和v测度;homogeneity=1-h(c|k)/h(c)completeness=1-h(k|c)/h(k)
其中,h(c|k)和h(k|c)分别表示在给定簇和类下的条件熵,h(c)和h(k)分别表示在类和簇下的信息熵。5.根据权利要求1所述的机械故障多源混合迁移诊断方法,其特征在于,步骤s3中,优化训练aicda模型,具体包括:通过构建的adasoftmax分类损失和目标域伪标签,总体优化目标函数l
w
表示为:其中,m
t
表示目标域的样本数量,表示第n个源域的样本数量,和分别表示目标域第i个样本的特征向量和伪标签,和分别表示第n个源域的第i个样本的特征向量和真实标签,l
t
(
·
)和分别表示作用在目标域样本和源域样本上的交叉熵损失;利用上式全局子模型θ
g
和类级子模型θ
c
的可训练参数被更新为:的可训练参数被更新为:其中,ε是超参数,表示学习速率。

技术总结
本发明涉及一种基于AICDA模型的机械故障多源混合迁移诊断方法,属于机械故障诊断技术领域。该方法主要包括构建AICDA模型,采用一维卷积神经网络作为主干网络,包括四个“ConV1D”卷积块、两个FC卷积层、四个DIA层、四个类级DIA层和一个AdaSoftmax分类损失;然后将划分好的的训练样本输入到构建好的AICDA模型中,利用目标域样本的伪标签自监督学习函数和多个源域样本的真实标签学习函数构成的总体优化目标函数对AICDA模型进行迭代优化训练。本发明提高了迁移诊断的精度和泛化能力。提高了迁移诊断的精度和泛化能力。提高了迁移诊断的精度和泛化能力。


技术研发人员:秦毅 钱泉 罗均 毛永芳
受保护的技术使用者:重庆大学
技术研发日:2023.05.23
技术公布日:2023/9/14
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐