基于多通道联合迁移的高速列车轮对轴承故障诊断网络

未命名 09-22 阅读:61 评论:0


1.本发明涉及轴承故障诊断方法技术领域,尤其涉及一种基于多通道联合迁移的高速列车轮对轴承故障诊断网络。


背景技术:

2.轮对轴承是高速列车的关键部件之一。它在运行时容易受到高载荷和高转速的影响,而使得其产生局部磨损和损坏。轮对轴承发生故障会使列车产生巨大振动和噪声,甚至急停、脱轨等灾难性后果。因此高速列车轮对轴承故障诊断对保证列车安全可靠运行的至关重要。
3.随着人工智能技术的发展,基于深度学习的轴承故障诊断方法由于其可以自动对目标进行特征提取和故障分类,而不需要其他额外特征工程的支持,正越来越地受到关注。工业大数据和云计算能力的提升,也使得端到端的故障诊断算法在自动化、可靠性以及准确性方面有了较大提升。以卷积神经网络为代表的故障诊断模型,非常依赖大量的有标签数据。在现阶段,轮对轴承的故障数据还无法大量收集。这就使得这类模型很难达到预期的故障诊断精度。且深度学习模型进行故障诊断的前提是训练数据集与测试数据集具有相同的空间分布。而在实际的工业运用当中,由于轮对轴承的转速、载荷等工况的不同,使获取到的样本的分布空间差异很大,导致利用单一工况训练出来的模型不能很好的应用于其他工况。
4.为了解决上述问题,迁移学习方法被应用于轴承故障诊断领域,以解决上述深度学习中无法有效解决的问题。迁移学习在轴承故障诊断领域具有两个优势。首先迁移学习可以很好地解决无监督于适应问题。使得收集到的无标签样本可以被有效利用和诊断。第二是它可以拟合不同工况下的样本特征,使不同分布空间下的故障样本可以有效被诊断。现有的迁移学习方法虽然可以将一个源域学习到另一个目标域中。但在训练时,通常目标域样本的数量要与源域数量相当。然而在工业应用时源域样本通常是一次集中的跟踪试验,或实验室获取的数据。目标域数据通常是某次故障诊断工作开始后才开始进行收集。因此源域数据的工况、故障种类以及样本数量会远远大于目标域。同时,由于运行轮对轴承的运行工况会不断变化,迁移学习的训练不可避免地需要进行多次。因此这些问题限制了当前迁移学习模型的实用性。


技术实现要素:

5.本发明所要解决的技术问题是如何提供一种可以充分利用现有的故障样本,有效的提高轮对轴承故障诊断精度的高速列车轮对轴承故障诊断网络。
6.为解决上述技术问题,本发明所采取的技术方案是:一种基于多通道联合迁移的高速列车轮对轴承故障诊断网络,包括:多个子图网络以及一个多源域知识融合模块;
7.每个子图网络对应的是一种轴承的运行工况,用于分别提取多种源域的故障特征,从而自适应地迁移到目标域;
8.多源域知识融合模块用于对每个通道获得诊断知识进行最终融合与决策。
9.进一步的技术方案在于:子图网络主要包含4个部分,在进入各自通道前需要首先将原始振动信号处理为图样本,然后利用递归多头图注意力机制对其进行特征提取,最后利用mdd(动态)迁移方式,将源域特征迁移到目标域中。
10.进一步的技术方案在于:所述网络中,利用多个子图网络分别学习到目标域特征来补偿每个通道,实现多通道全局自适应:
[0011][0012]
其中,分别从第i个和第j个通道获取的目标域的输出之间的mdd;f1,f2分别表示不同通道下分类器f1和f2的输出;p为总的通道数量;如果其中一个通道较好地学习到了目标域的有效特征,那么这个通道学习到的目标域的分布就被看做其他通道的基础;从而可以在使用相同超参数和结构的情况下,提高每个子网络的分布自适应能力。
[0013]
进一步的技术方案在于:所述网络中,设计一个多通道诊断决策策略如下所示:
[0014][0015]
其中,表示第k个通道分类器f1的输出值,表示各通道训练正确率的占比,以此来降低错误分类通道对最终输出准确率的影响;在诊断网络训练完成后,被保存为最后一次训练时的数值;argmax(
·
)返回第i个目标域样本中加权概率的最大和的预测健康状态;使用多个诊断结果进行加权决策,使具有较大相似性的源域-目标域对,将对最终决策的贡献最大,而具有较小相似性的源域-目标域对提供的信息可信程度较低,降低其对决策的影响。
[0016]
进一步的技术方案在于:所述轴承故障诊断网络的训练方法包括如下步骤:
[0017]
训练主要分为三个阶段,在第一个阶段中,通过多个通道的递归多头图注意力残差网络(resganet)对不同工况下的类型样本特征提取,本阶段网络的优化目标如下:
[0018][0019]
其中,θk是每个通道中resganet的训练参数,通过优化上述目标,使用模型对源域进行拟合;
[0020]
第二阶段中,将目标域样本在多个通道中进行迁移训练;得到目标域在两个分类器f1和f2下的输出;利用mdd对目标域样本的分类损失和边缘距离进行优化,优化对象为:
[0021][0022]
最后,根据每个通道各自优化下面的损失,对多个通道的resganet进行联合训练;每个通道单独拟合各自通道源域样本的可迁移特征;但是在最后对目标域进行多通道的诊断决策;利用每个通道学习到的充足知识,提高故障诊断精度;
[0023]
[0024]
其中,β和γ是超参数;是各自通道下源域的标记样本训练的交叉熵损失;是各自通道目标域样本的mdd迁移损失;是针对不同通道之间针对目标域特征的补偿损失;使用adam优化算法对模型参数进行优化,参数优化如下:
[0025][0026]
其中,η为模型的学习率。
[0027]
采用上述技术方案所产生的有益效果在于:本技术所述网络使用mmd加权的递归多头图注意力残差网络(resganet),用于轮对轴承样本的特征提取。它可以显性地拟合样本间关系,提高了有效特征的提取效果。提出了多通道知识融合诊断策略,将多个resganet子网络的诊断结果进行决策。通过将多个源域与目标域之间进行联合训练,来降低不同分布空间之间带来的负面影响。所述网络用于高速列车轮对轴承的故障诊断任务,提高了多数据源域的利用效率和故障诊断精度。
附图说明
[0028]
下面结合附图和具体实施方式对本发明作进一步详细的说明。
[0029]
图1是本发明实施例所述高速列车轮对轴承故障诊断网络的原理图;
[0030]
图2是本发明实施例中滚动轴承实验台的实物图;
[0031]
图3是本发明实施例中实验轴承的实物图;
[0032]
图4是本发明实施例中实验台以及传感器示意图
[0033]
图5是本发明实施例中五次训练对比结果图;
[0034]
图6是本发明实施例中多种方法可视图。
具体实施方式
[0035]
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0036]
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
[0037]
迁移问题描述
[0038]
给出一个具有n个空间分布的源域他们中包含的诊断知识来自多个轮对轴承运行工况或其他类型的旋转机械。包含t个有标签样本其中i=1,2,

t。其中表示训练样本和对应的标签。给出只有一个空间分布的目标域d
t
,他是来自需要诊断的轮对轴承。目标域d
t
中包含t个无标签样本其中i=1,
2,

t,且t≤t。源域与目标域之间具有不同的概率分布p和q。所以除此之外,同样认为因此,本技术想建立一个尽可能使用现有数据的故障诊断方法,能够从源域ds向目标域d
t
来迁移知识。
[0039]
通过分析上述数据集可知,轮对轴承迁移故障诊断存在以下难点:1)源域ds与目标域d
t
之间可能会存在较大的空间分布差异;2)每个源域ds所在通道可能无法获得最好的分类效果。3)源域ds多出的样本无法有效利用。第一个挑战主要是由于轮对轴承不同工况下的信号差异会比较大。在没有足够的训练样本时,甚至可能会考虑使用其他类型的旋转机械作为源域样本。因此对特征提取精度和从样本中可获取到的信息的全面性提出了更高要求。令模型具有显性地获取样本间关系的能力,可以显著增加模型获取到的先验知识。第二个挑战主要来自源域具有较多的运行工况,而手动调整往往工作量会较大,甚至影响整体诊断效果。多个源域为模型提供了不同的诊断知识,多通道知识融合诊断策略可以自适应对不同通道的偏差进行补偿。最后一个挑战是由于源域样本的数量通常比目标域要多,采用循环训练的方法让更多样本的有效特征可以应用到模型当中。通过综合以上目标,来全面地利用现有样本,提高轮对轴承迁移模型的诊断效果。
[0040]
本发明实施例公开了一种基于多通道联合迁移的高速列车轮对轴承故障诊断网络,所述诊断网络可以在结构上划分为多个子图网络以及一个多源域知识融合模块。每个子图网络对应的是一种轴承的运行工况,可以分别提取多种源域的故障特征,从而自适应地迁移到目标域。在多源域知识融合部分中,对每个通道获得诊断知识进行最终融合与决策。
[0041]
子通道:
[0042]
子图网络包括递归图注意力残差网络(resganet),在进入各自通道前需要首先将原始振动信号处理为图样本,然后利用所提递归多头图注意力机制对其进行特征提取。然后针对轮对轴承目标域样本数量较少的问题,利用mdd迁移方式,将源域特征迁移到目标域中。
[0043]
多通道:
[0044]
由于高速列车轮对轴承振动信号作为目标域时,由于不同工况下的源域样本间可能存在分布差异,导致迁移效果不同的。为了能够充分利用现有工况下的数据,设计了多通道的故障诊断模型,如图1所示。
[0045]
在采用相同的子网络进行训练时,由于源域样本的分布不同也会导致单独通道下的迁移效果无法达到最佳。从而需要每个子网络单独配置超参数和模型结构。为了解决这一问题,利用多个子网络分别学习到目标域特征来补偿每个通道,从而实现多通道全局自适应,如下所示。
[0046][0047]
其中,分别从第i个和第j个通道获取的目标域的输出之间的mdd。f1,f2分别表示不同通道下分类器f1和f2的输出。p为总的通道数量。如果其中一个通道较好地学习到的目标域的有效特征,那么这个通道学习到的目标域的分布就可以被看做其
他通道的基础。从而可以在使用相同超参数和结构的情况下,提高每个子网络的分布自适应能力。
[0048]
训练好后,每个通道针对目标域的最终输出结果肯定是不同的。但大多数通道在训练好后均能获得较高的诊断精度,因此可以设计一个多通道诊断决策策略,如下所示。
[0049][0050]
表示第k个通道分类器f1的输出值,表示各通道训练正确率的占比,以此来降低错误分类通道对最终输出准确率的影响。在训练完成后,被保存为最后一次训练时的数值。argmax(
·
)返回第i个目标域样本中加权概率的最大和的预测健康状态。使用多个诊断结果进行加权决策,使具有较大相似性的源域-目标域对将对最终决策的贡献最大,而具有较小相似性的源域-目标域对提供的信息可信程度较低,降低其对决策的影响。
[0051]
训练流程:
[0052]
基于多通道联合迁移的高速列车轮对轴承故障诊断网络(简称mjtln)的训练流程如表1所示。
[0053]
表1 mjtln的训练流程
[0054]
[0055][0056]
所述故障诊断模型的训练主要分为三个阶段。在第一个阶段中,通过多个通道的递归多头图注意力残差网络对不同工况下的类型样本特征提取。本阶段网络的优化目标如下。
[0057][0058]
其中,θk是每个通道中resganet的训练参数,通过优化上述目标,模型对源域进行拟合。
[0059]
第二阶段中,将目标域样本在多个通道中进行迁移训练。得到目标域在两个分类器f1和f2下的输出。利用mdd对目标域样本的分类损失和边缘距离进行优化,优化对象为:
[0060][0061]
最后,每个通道各自优化下面的损失,对多个通道的resganet进行联合训练。每个通道单独拟合各自通道源域样本的可迁移特征。但是在最后对目标域进行多通道的诊断决策。利用每个通道学习到的充足知识,提高故障诊断精度。
[0062][0063]
其中,β和γ是超参数。上式中第一项是各自通道下源域的标记样本训练的交叉熵损失。是各自通道目标域样本的mdd迁移损失。最后一项是针对不同通道之间针对目标域特征的补偿损失。使用adam优化算法对模型参数进行优化,参数优化如下。
[0064][0065]
其中,η为模型的学习率。
[0066]
需要注意的是,通过问题描述部分可知,由于每个源域的样本数量均比目标域样本数量大,为了能够充分利用多余的样本,本文提出采用图循环训练法来对源域-目标域对进行处理。通过分别建立源域图样本集和目标域样本集,按顺序每次拿出来一对样本进行训练。当目标域样本用完时,目标域样本集从头开始拿取,而源域样本集继续拿取,直至拿完。以此循环直至训练完成。图循环训练法可以充分利用大数据的源域样本,并且每次训练的源域-目标域对的多样性也更佳,因此可以降低模型过拟合程度,提高训练精度。
[0067]
实验分析
[0068]
实验数据介绍
[0069]
由于轮对轴承实际的故障数据获取十分有限,为了测试模型的迁移性能,采用滚动轴承数据集进行分析。将滚动轴承实验台数据作为源域,向目标域的轮对轴承实验台进行迁移,测试模型在跨机械迁移时的诊断精度。轮对轴承样本集的信息如表2所示。
[0070]
表2轮对轴承实验数据集
[0071][0072]
滚动轴承实验平台如图2所示。支撑轴承与被测轴承由驱动电机带动传动轴旋转。支撑轴承为无故障轴承,起到支撑传动轴的作用,被测轴承由4种健康状态的轴承构成,分别为内圈故障,外圈故障,滚动体故障以及无故障。4种健康状态滚动轴承如图3所示。电机的转速可通过控制器进行设定。载荷由加载机构向滚动轴承的轴向施加载荷。由于载荷的大小无法定量控制,因此通过编号对其进行区分。在实验轴承的外轴承箱上方吸附灵敏度为2.505mv/m/s2的加速度传感器(356a25),来收集运行过程中的振动信号。采集信号时的采样频率设置为12.8khz。滚动轴承实验台的细节如图4所示。
[0073]
采集到的振动信号采用与轮对轴承数据集相同的方式进行处理。构造的滚动轴承数据集如表3所示。同样采用滑窗方式对振动信号进行截取。每种故障类型获取1500个样本。因此4种故障类型共有6000个样本,作为源域进行训练。将样本以250个为一组构建递归图,共获得24个递归图。其中的16个用于训练,8个用于测试。轮对轴承数据集作为目标域,图表3所示,因此四个数据集均采用四种常用故障类型进行测试。
[0074]
表3滚动轴承实验数据集
[0075]
[0076]
分类精度对比实验
[0077]
为了验证模型在跨机械迁移时的效果,同样采用上述模型进行了对比分析。故障诊断针对的对象是轮对轴承故障样本,因此源域数据均采用datasete,f,g。共设计了四组迁移实验,分别是(e,f,g)-》a,(e,f,g)-》b,(e,f,g)-》c,(e,f,g)-》d。同样的,每个实验训练5次来消除随机误差。以5次实验的准确率平均值作为最终诊断精度。实验的标准差作为模型稳定程度的判断依据。实验结果如表4所示。dann,coral,dagcn,mdan以及mjtln的(a,b,c)-》d的实验结果如图5所示,可视图如图6所示。
[0078]
表4对比实验正确率结果
[0079][0080]
从表中不难看出,跨机械迁移的诊断精度相较跨工况迁移时均有所下降。其主要原因是由于机械类型的不同,收集到的振动信号的幅值,故障特征频率,转速以及载荷均有较大差距。这就使得在提取源域特征时的故障特征,不能很好地与目标域共用。但是即使在跨机械迁移的条件下,提出的mjtln仍能达到92%以上的故障诊断精度。四个迁移任务取得的最终结果相差不大,说明mjtln在旋转机械故障诊断中具有一定的通用性。mjtln的可视图中虽有较多分类错误样本,但四种故障的边界较为清晰,显示出其具有较好的诊断效果。mjtln的三个子通道的正确率均低于多通道决策后的正确率。并且多通道决策后的正确率比子通道有了大幅提升。说明多通道决策机制在跨机械迁移这种每个通道的准确率相对较低的情况下仍能起到很好的效果。将模型的多通道补偿去除后,模型的诊断精度也发生了下降。说明多通道的补偿损失可以为不同通道之间提供准确率基准,从而提高模型的诊断精度。
[0081]
在参与对比的模型中,wdcnn与resganet由于均直接采用源域样本进行训练,目标域样本进行测试,分类精度十分糟糕。实验精度均受到了轮对轴承的强噪声以及轮轨共振的影响。对于其他非多通道的域自适应方法,所有任务的诊断精度均不理想。dagcn在一些任务中虽然可以比mjtln的通道1和3的诊断精度高,但是其标准差过大,对于故障诊断这类需要较强稳定性的场景显然不适用。coral同样产生了标准差过大的问题,其平均训练精度
受到了严重影响。dann虽然表现比较稳定,但是由于源域与目标域之间的差距较大导致产生了严重的性能衰退。mdan的诊断性能在跨机械迁移中也产生了较大降低,性能仅能维持在84%左右。所提模型在通过多通道决策机制的帮助下可以有效提高故障诊断精度。
[0082]
综上,本发明公开一种基于多通道联合迁移的高速列车轮对轴承故障诊断网络,该模型由多个resganet和一个多通道知识决策机制构成。通过实验数据集验证了所提模型的有效性和优越性。研究表明,提出的多通道故障知识决策机制能够有效融合多个通道在各自工况下的诊断决策。利用多通道损失补偿机制为多个通道联合训练提供通道间的信息。mjtln还集成了一种循环训练机制,源域与目标域样本数量不同时提供训练方案。因此,所提mjtln可以充分利用现有多工况数据作为源域样本,为目标域轮对轴承的诊断提供丰富故障信息,从而提高了故障诊断精度,同时优于其他传统方法。

技术特征:
1.一种基于多通道联合迁移的高速列车轮对轴承故障诊断网络,其特征在于包括:多个子图网络以及一个多源域知识融合模块;每个子图网络对应的是一种轴承的运行工况,用于分别提取多种源域的故障特征,从而自适应地迁移到目标域;多源域知识融合模块用于对每个通道获得诊断知识进行最终融合与决策。2.如权利要求1所述的基于多通道联合迁移的高速列车轮对轴承故障诊断网络,其特征在于:子图网络包括递归图注意力残差网络(resganet),在进入各自通道前需要首先将原始振动信号处理为图样本,然后利用递归多头图注意力机制对其进行特征提取,最后利用mdd(动态)迁移方式,将源域特征迁移到目标域中。3.如权利要求1所述的基于多通道联合迁移的高速列车轮对轴承故障诊断网络,其特征在于,所述网络中,利用多个子图网络分别学习到目标域特征来补偿每个通道,实现多通道全局自适应:其中,分别从第i个和第j个通道获取的目标域的输出之间的mdd;f1,f2分别表示不同通道下分类器f1和f2的输出;p为总的通道数量;如果其中一个通道较好地学习到了目标域的有效特征,那么这个通道学习到的目标域的分布就被看做其他通道的基础;从而可以在使用相同超参数和结构的情况下,提高每个子网络的分布自适应能力。4.如权利要求1所述的基于多通道联合迁移的高速列车轮对轴承故障诊断网络,其特征在于,所述网络中,设计一个多通道诊断决策策略如下所示:其中,表示第k个通道分类器f1的输出值,表示各通道训练正确率的占比,以此来降低错误分类通道对最终输出准确率的影响;在诊断网络训练完成后,被保存为最后一次训练时的数值;argmax(
·
)返回第i个目标域样本中加权概率的最大和的预测健康状态;使用多个诊断结果进行加权决策,使具有较大相似性的源域-目标域对,将对最终决策的贡献最大,而具有较小相似性的源域-目标域对提供的信息可信程度较低,降低其对决策的影响。5.如权利要求1所述的基于多通道联合迁移的高速列车轮对轴承故障诊断网络,其特征在于,所述轴承故障诊断网络的训练方法包括如下步骤:训练主要分为三个阶段,在第一个阶段中,通过多个通道的递归多头图注意力残差网络(resganet)对不同工况下的类型样本特征提取,本阶段网络的优化目标如下:其中,θ
k
是每个通道中resganet的训练参数,通过优化上述目标,使用模型对源域进行
拟合;第二阶段中,将目标域样本在多个通道中进行迁移训练;得到目标域在两个分类器f1和f2下的输出;利用mdd对目标域样本的分类损失和边缘距离进行优化,优化对象为:最后,根据每个通道各自优化下面的损失,对多个通道的resganet进行联合训练;每个通道单独拟合各自通道源域样本的可迁移特征;但是在最后对目标域进行多通道的诊断决策;利用每个通道学习到的充足知识,提高故障诊断精度;其中,β和γ是超参数;是各自通道下源域的标记样本训练的交叉熵损失;是各自通道目标域样本的mdd迁移损失,是针对不同通道之间针对目标域特征的补偿损失;使用adam优化算法对模型参数进行优化,参数优化如下:其中,η为模型的学习率。

技术总结
本发明公开了一种基于多通道联合迁移的高速列车轮对轴承故障诊断网络,包括:多个子图网络以及一个多源域知识融合模块;每个子图网络对应的是一种轴承的运行工况,用于分别提取多种源域的故障特征,从而自适应地迁移到目标域;多源域知识融合模块用于对每个通道获得诊断知识进行最终融合与决策。所述故障诊断网络可以充分利用现有的故障样本,有效的提高轮对轴承故障诊断精度。对轴承故障诊断精度。对轴承故障诊断精度。


技术研发人员:马增强 苑宗昊 刘敬文 李欣 白雪飞 刘素艳 杜庆郎 周泽嘉
受保护的技术使用者:石家庄铁道大学
技术研发日:2023.07.21
技术公布日:2023/9/20
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐