基于多尺度集成LightGBM的小样本故障诊断方法
未命名
09-15
阅读:118
评论:0

基于多尺度集成lightgbm的小样本故障诊断方法
技术领域
1.本发明属于旋转机械智能故障诊断领域,具体涉及一种基于多尺度集成lightgbm的小样本故障诊断方法。
背景技术:
2.随着现代工业技术的不断进步,机械设备正朝着大型化、复杂化和智能化的方向快速发展。然而,机械零部件在运行过程中难免会出现损伤,进而导致设备故障。这些故障不仅会延误生产进程,还可能造成严重的安全事故,给企业和社会带来巨大损失。为确保机械设备能够稳定高效运行,机械智能故障诊断技术作为一种可行的解决方案在近年来备受关注,现已成为智能制造领域中不可或缺的技术之一。作为机械设备中的核心部件,旋转机械通常工作在高温、重载等恶劣环境下,相较于其他零部件而言更容易出现损伤。因此,为旋转机械开展智能故障诊断研究,对于保障机械设备稳定高效运行,减少或避免重大事故发生,具有重要而深远的意义。
3.机械的智能故障诊断通常需要大量的数据来建立准确可靠的机器学习模型。然而,在实际的工业环境中,往往很难在旋转机械上获取到充足的故障数据,主要包括以下几方面原因:(1)旋转机械的退化需要数月甚至数年的时间,其故障发生的概率较低,特别是对于一些精密和复杂的机械设备而言,如航空发动机等;(2)当故障发生时,机械设备将被要求立即停机以确保安全,此时传感器仅能采集到十分有限的故障数据。(3)故障数据的标注需要耗费高昂的成本,包括人力、时间和经济资源等方面的开销。
4.为了应对上述故障数据稀缺的困境,一些适用于小样本故障诊断的方法被开发出来。其中,基于迁移学习和元学习的方法在近年来成为了该领域的研究重点。例如,下述基于迁移学习的小样本故障诊断方法通过利用数据充足的源域来辅助模型训练,将具有普遍性的知识从源域迁移到数据稀缺的目标域中,从而有效提高了模型在小样本目标域的故障诊断性能。
5.石静雯,侯立群.基于一维卷积注意力门控循环网络和迁移学习的轴承故障诊断[j].振动与冲击,2023,42(03):159-164.
[0006]
虽然此类迁基于移学习或元学习的方法已被证明可以很好地解决小样本故障诊断问题,但仍需要足够多的标记故障数据来构建用于辅助模型训练的源域,并且模型对目标域的诊断精度受源域与目标域之间数据分布相似度的影响。而在实际的工业环境中,获取大量与小样本目标域相似的故障数据来构建源域无疑是十分困难的。另一方面,采用人工模拟获得故障数据的方法同样需要花费巨大的经济和时间成本,且人工故障与真实故障之间不可避免地存在差异,使得模型对于真实故障的诊断性能难以得到保证。
技术实现要素:
[0007]
为了解决现有技术存在的问题,本发明提出了一种基于多尺度集成lightgbm的旋转机械小样本故障诊断方法,该方法由数据增强模块、标签分类模块和输出加权模块组成。
在数据增强模块,多尺度滑动窗口被用于对原始样本进行重采样,获得大量具有不同尺度信息的子样本,从而实现数据扩充,避免模型训练时发生过拟合。在标签分类模块,扩充后的数据被用于训练多个lightgbm分类器,同时这些分类器被进一步集成为一个强分类模型。通过集成,每个lightgbm分类器所产生的诊断误差被削弱了,使得集成模型能够表现出更好的诊断性能和泛化性能。在输出加权模块,基于相似度度量的加权策略被用于为集成模型输出的诊断结果进行加权,以进一步提高诊断精度。本发明无需依赖额外跨域知识,仅需使用少量标记样本训练模型,即可实现有效的旋转机械小样本故障诊断。
[0008]
本发明至少通过如下技术方案之一实现。
[0009]
基于多尺度集成lightgbm的小样本故障诊断方法,包括以下步骤:
[0010]
步骤1、数据集的采集与标定:采集旋转机械在某个实验工况下的振动加速度信号,从振动加速度信号中截取数据段来构成样本,并进行标注,选择其中若干个样本组成训练集其余样本组成测试集其中,xi和yi分别表示第i个样本及其对应的标签,k为训练集的样本数量,m为样本总数;
[0011]
步骤2、构建基于集成学习的小样本故障诊断模型,包括数据增强模块ma、标签分类模块mc和输出加权模块mw,其中,数据增强模块ma用于为样本进行多尺度重采样,以实现数据扩充;标签分类器模块mc用于为样本进行分类诊断,并输出相应的类别预测向量;输出加权模块mw用于为上述类别预测向量进行加权,以提高分类诊断的准确率;
[0012]
步骤3、数据增强:将步骤1构建的训练集d
train
和测试集d
test
分别输入数据增强模块ma,利用多尺度滑动窗口对原始样本进行重采样,获得大量尺度不一的子样本,并相应地构建多个具有不同尺度信息的子样本训练集和子样本测试集其中,和分别表示具有第j种尺度信息的子样本训练集和子样本测试集,t表示尺度的类别数量;
[0013]
步骤4、模型训练:在标签分类模块mc,对于步骤3中获得的每个子样本训练集,都采用梯度提升决策树算法分别训练一组基于轻量级梯度提升机(lightgbm)的标签分类器,共训练t组,其中,每组标签分类器都包含n个用于二分类的lightgbm模型,n即为标签的类别数量;
[0014]
步骤5、模型测试:在标签分类模块mc,将步骤3中获得的每个子样本测试集都分别输入对应组别的标签分类器,各组标签分类器输出测试结果,对测试结果进行加和求平均及拼接操作后得到t组n维的类别预测向量,将各组类别预测向量进行进一步的加和求平均,得到集成后类别预测向量,即标签分类模块mc对测试集d
test
输出的诊断结果;
[0015]
步骤6、权重计算:利用快速傅里叶变换将步骤3中获得的训练集d
train
和测试集d
test
中的样本从时域转换至频域,得到新的频域训练集d
train-f
和频域测试集d
test-f
,将频域训练集d
train-f
中的样本按类别进行加和求平均,得到n个类别中心,采用余弦相似度函数作为度量函数,计算频域测试集d
test-f
中的样本与各个类别中心的相似度,得到n维的度量向量,再将度量向量进行归一化,最终得到n维的权重向量;
[0016]
步骤7、输出加权:在输出加权模块mc,将步骤5、步骤6中获得的集成后的n维类别预测向量与对应的n维权重向量逐分量相乘,得到加权后的类别预测向量,其中最大的向量分量对应的类别即为整体模型对测试集d
test
的最终诊断结果。
[0017]
进一步地,步骤1中,从振动加速度信号截取样本时,各样本的数据点之间无重叠,此外,训练集d
train
和测试集d
test
的数据特征分布相同,且标签空间相同。
[0018]
进一步地,步骤2中,数据增强模块ma采用多尺度滑动窗口重采样的方法实现数据增强,标签分类模块mc包括多个用于二分类的lightgbm模型,输出加权模块mw采用相似度度量策略实现类别预测向量加权。
[0019]
进一步地,步骤3中利用多尺度滑动窗口对原始样本进行重采样时,窗口的尺度分别设置为原始样本数据点长度的其中t为尺度的类别数量,窗口的滑动步长设置为1,以此来获得更多的子样本,子样本的类别与原始样本的类别保持一致。
[0020]
进一步地,步骤4中,每组标签分类器的功能相同,都用于执行n分类目标任务,而其中每个lightgbm都用于为某种类别的子样本进行二分类;对于输入每组第q个lightgbm的子样本训练集,属于第q种类别的子样本将被视为正类并设置标签为1,而属于其他n-1种类别的子样本将被视为负类并设置标签为0,每个lightgbm通过梯度提升决策树算法来训练,其损失函数表示为:
[0021][0022]
式中,l表示损失函数,n表示用于训练的子样本总数,与分别表示第h个子样本的标签真实值与预测值,预测值越大则表示该子样本属于对应正类的概率越大。
[0023]
进一步地,步骤5中,具有第j种尺度信息的子样本测试集将使用由具有第j种尺度信息的子样本训练集所训练的一组标签分类器来进行测试。
[0024]
进一步地,步骤5中,将子样本测试集输入对应组别的标签分类器进行测试时,将得到每个lightgbm对子样本的测试结果,通过将测试结果进行加和求平均,得到每个lightgbm对原始样本的测试结果;将各组标签分类器中所有的lightgbm对原始样本的测试结果按顺序进行拼接后,得到各组标签分类器对原始样本的类别预测向量,将各组类别预测向量进行进一步的加和求平均后,即得到集成后的类别预测向量,其表示为:
[0025][0026]
式中,p(x)表示标签分类模块mc对原始样本x的输出的集成后的类别预测向量,pn(x)表示类别预测向量p(x)的第n个分量,和nj分别表示对原始样本x而言具有第j种尺度信息的第z个子样本及具有第j种尺度信息的子样本总数,f
j,n
表示第j组标签分类器中的第n个lightgbm第j种尺度信息,n为标签的类别数量,即每组标签分类器中lightgbm的数量,t为尺度的类别数量,即标签分类器的组数。
[0027]
进一步地,步骤6中,频域训练集d
train-f
和频域测试集d
test-f
中的样本是时域训练集d
train
和时域测试集d
test
中的原始样本在频域上的频谱表示,其数据点长度是原始样本的一半。
[0028]
进一步地,步骤6中,采用余弦相似度函数计算频域测试集d
test-f
中的样本与各个
类别中心的相似度,通过将计算出的相似度进行拼接,得到n维的度量向量,采用具有调整因子的softmax函数对度量向量进行归一化,得到以下的权重向量:
[0029][0030]
式中,w(x)表示计算得到的对原始样本x的权重向量,wn(x)表示权重向量w(x)的第n个分量,cq表示第q个类别中心,s(x,cq)表示原始样本x与第q个类别中心的余弦相似度计算值,s(x,cn)表示原始样本x与第n个类别中心的余弦相似度计算值,λ为调整因子,用于控制归一化后权重向量中各分量的差异。
[0031]
进一步地,步骤7中,加权后的类别预测向量由下式表示:
[0032]
pw(x)=[p1(x)w1(x),p2(x)w2(x),
…
,pn(x)wn(x)]
ꢀꢀꢀꢀꢀ
(4)
[0033]
式中,pw(x)表示整体模型对原始样本x输出的加权类别预测向量,pn(x)和wn(x)分别表示对原始样本x的类别预测向量和权重向量中的第n个分量。
[0034]
与现有技术相比,本发明的有益效果至少如下:
[0035]
1、本发明采用多尺度滑动窗口对原始样本进行重采样,生成大量的子样本以实现数据扩充。通过使用这些子样本进行训练,可以有效地避免模型因缺乏训练数据而导致的过拟合问题。此外,由于子样本来自原始样本且数量众多,相当于充分挖掘了原始样本中蕴含的信息,实现了小样本场景下数据资源的最大化利用。
[0036]
2、本发明构建了多组标签分类器,每组分类器都由多个用于二分类的lightgbm模型组成,以获得多分类的故障诊断能力。同时,各组分类器被进一步集成为一个强分类模型来实现有效的小样本故障诊断。通过集成,各组分类器所产生的诊断误差被削弱了,使得集成模型能够具备更好的小样本故障诊断性能和泛化性能。
[0037]
3、本发明设计了一种基于频域相似度度量的加权策略,充分利用振动加速度信号的频谱信息,并融合度量学习技术来计算每个样本的权重,对集成模型输出的诊断结果进行加权,从而构建了“时域训练,频域加权”的数据挖掘体系,进一步提升了集成模型的小样本故障诊断性能。
[0038]
4、本发明所采用的lightgbm分类器基于梯度提升决策树算法构建,具有比深度神经网络更少的超参数和更高的训练效率。此外,该分类器同样可以采用gpu来加速计算,便于部署到高性能的gpu服务器上进行应用。
[0039]
5、本发明所提出的方法,充分考虑了工业应用的实际情况,能够在不依赖跨域知识辅助的情况下,仅使用少量的标记数据来实现旋转机械的小样本故障诊断,在保证具有高准确率的同时避免了构造源域所需的成本开销,因更加高效和便捷,具备一定的工业应用价值。
[0040]
本发明所提出的方法,能够在不依赖跨域知识辅助的情况下,仅使用少量的标记数据来实现高效的旋转机械小样本故障诊断,在保证具有高准确率的同时避免了构造源域所需的成本开销,因此更加高效和便捷,具备一定的工业应用价值。证实了将集成学习应用于小样本故障诊断的合理性,为解决工业实际中旋转机械的小样本故障诊断问题提供了另一种可行且高效的技术方案。
附图说明
[0041]
图1是本发明基于多尺度集成lightgbm的小样本故障诊断方法的故障诊断流程图;
[0042]
图2是本发明基于多尺度集成lightgbm的小样本故障诊断方法的模型结构示意图;
[0043]
图3是本发明方法的权重计算过程示意图;
[0044]
图4是本发明方法在工况一下的测试精度图;
[0045]
图5是本发明方法在工况二下的测试精度图;
[0046]
图6是本发明方法在工况三下的测试精度图;
[0047]
图7是本发明方法在工况四下的测试精度图。
具体实施方式
[0048]
为更加清晰地阐述本发明的目的与技术方案,下面将结合附图和具体实施例对本发明进行详细说明。应当理解,此处所描述的具体实施例只用于更好地阐述本发明的应用,但本发明的实施方式所涉及的技术特征不限于此。
[0049]
如图1所示,基于多尺度集成lightgbm的小样本故障诊断方法,所述方法能够在不依赖跨域知识辅助的情况下,仅使用少量标记样本来实现高效的旋转机械小样本故障诊断,包括以下步骤:
[0050]
步骤1、数据集的采集与标定。采集旋转机械在某个实验工况下的振动加速度信号,按一定的数据点长度截取得到若干样本,并进行标注。选取上述少量样本(如每类1~10个)组成训练集其余大量样本组成测试集其中,xi和yi分别表示第i个样本及其对应的标签,k为训练集的样本数量,m为样本总数;
[0051]
从振动加速度信号截取样本时,各样本的数据点之间无重叠。此外,训练集d
train
和测试集d
test
的数据特征分布相同,且标签空间相同。
[0052]
步骤2、构建基于集成学习的小样本故障诊断模型,如图2所示。该模型包括数据增强模块ma、标签分类模块mc和输出加权模块mw。其中,数据增强模块ma用于为样本进行多尺度重采样,以实现数据扩充;标签分类器模块mc用于为样本进行分类诊断,并输出相应的类别预测向量;输出加权模块mw用于为上述的类别预测向量进行加权,以提高分类诊断的准确率;
[0053]
数据增强模块ma基于多尺度滑动窗口重采样的方法实现,标签分类模块mc基于多个二分类的lightgbm模型实现,输出加权模块mw基于相似度度量的原理实现。
[0054]
步骤3、数据增强。将步骤1构建的训练集d
train
和测试集d
test
分别输入数据增强模块ma,利用多尺度滑动窗口对原始样本进行重采样,获得大量尺度不一的子样本,并相应地构建多个具有不同尺度信息的子样本训练集和子样本测试集其中,和分别表示具有第j种尺度信息的子样本训练集和子样本测试集,t表示尺度的类别数量;
[0055]
步骤4、模型训练。在标签分类模块mc,对于步骤3中获得的每个子样本训练集,都采用梯度提升决策树算法来分别训练一组基于轻量级梯度提升机(lightgbm)的标签分类
器,共训练t组。其中,每组标签分类器都包含n个用于二分类的lightgbm模型,n即为标签的类别数量。因此,每组标签分类器都具备n分类的故障诊断能力;
[0056]
步骤5、模型测试。在标签分类模块mc,将步骤3中获得的每个子样本测试集都分别输入对应组别的标签分类器,各组标签分类器输出测试结果,对测试结果进行加和求平均及拼接操作后得到t组n维的类别预测向量,将各组类别预测向量进行进一步的加和求平均,得到集成后类别预测向量,即标签分类模块mc对测试集d
test
输出的诊断结果;
[0057]
步骤6、权重计算。如图3所示,利用快速傅里叶变换技术,将步骤3中获得的训练集d
train
和测试集d
test
中的样本从时域转换至频域,得到频域训练集d
train-f
和频域测试集d
test-f
。将频域训练集d
train-f
中的样本按类别进行加和求平均,得到n个类别中心。而后,采用余弦相似度函数作为度量函数,计算频域测试集d
test-f
中的样本与各个类别中心的相似度,得到n维的度量向量,再将度量向量进行归一化,最终得到n维的权重向量;
[0058]
步骤7、输出加权。在输出加权模块mc,将步骤5、步骤6中获得的集成后的n维类别预测向量与对应的n维权重向量逐分量相乘,得到加权后的类别预测向量,其中最大的向量分量对应的类别即为整体模型对测试集d
test
的最终诊断结果。
[0059]
作为一种实施例,步骤3中,利用多尺度滑动窗口对原始样本进行重采样时,窗口的尺度分别设置为原始样本数据点长度的其中t为尺度的类别数量,窗口的滑动步长设置为1,以此来获得更多的子样本,子样本的类别与原始样本的类别保持一致。
[0060]
进一步地,步骤4中,每组标签分类器的功能相同,都用于执行n分类目标任务,而其中每个lightgbm都分别用于为某种类别的子样本进行二分类。例如,每组第q个lightgbm用于为第q种类别的子样本进行二分类。对于输入第q个lightgbm的子样本训练集,属于第q种类别的子样本将被视为正类并设置标签为1,而属于其他n-1种类别的子样本将被视为负类并设置标签为0。每个lightgbm都通过梯度提升决策树算法来训练,其损失函数表示为:
[0061][0062]
式中,l表示损失函数,n表示用于训练的子样本总数,与分别表示第h个子样本的标签真实值与预测值,预测值越大则表示该子样本属于对应正类的概率越大。
[0063]
进一步地,步骤5中,具有第j种尺度信息的子样本测试集将使用由具有第j种尺度信息的子样本训练集所训练的一组标签分类器来进行测试。
[0064]
进一步地,步骤5中,将子样本测试集输入对应组别的标签分类器进行测试时,将得到每个lightgbm对子样本的测试结果,通过将测试结果进行加和求平均,得到每个lightgbm对原始样本的测试结果,将各组标签分类器中所有lightgbm对原始样本的测试结果进行拼接,得到各组标签分类器对原始样本输出的类别预测向量,将各组类别预测向量进行加和求平均,得到集成后的类别预测向量,其表示为:
[0065][0066]
式中,p(x)表示标签分类模块mc对原始样本x的输出的集成后的类别预测向量,pn(x)表示类别预测向量p(x)的第n个分量,和nj分别表示对原始样本x而言具有第j种尺度信息的第z个子样本及具有第j种尺度信息的子样本总数,f
j,n
表示第j组标签分类器中的第n个lightgbm第j种尺度信息,n为标签的类别数量(也即每组标签分类器中lightgbm的数量),t为尺度的类别数量(也即标签分类器的组数)。
[0067]
进一步地,步骤6中,频域训练集d
train-f
和频域测试集d
test-f
中的样本是时域训练集d
train
和时域测试集d
test
中的原始样本在频域上的频谱表示,其数据点长度是原始样本的一半。
[0068]
进一步地,步骤6中,采用余弦相似度函数计算频域测试集d
test-f
中的样本与各个类别中心的相似度。通过将计算出的相似度进行拼接,可得到n维的度量向量。随后,采用具有调整因子的softmax函数对度量向量进行归一化,可得到以下的权重向量:
[0069][0070]
式中,w(x)表示计算得到的对原始样本x的权重向量,wn(x)表示权重向量w(x)的第n个分量,cq表示第q个类别中心,s(x,cq)表示原始样本x与第q个类别中心的余弦相似度计算值,s(x,cn)表示原始样本x与第n个类别中心的余弦相似度计算值,λ为调整因子,用于控制归一化后权重向量中各分量的差异,通常设置为10。
[0071]
进一步地,步骤7中,加权后的类别预测向量可由下式表示:
[0072]
pw(x)=[p1(x)w1(x),p2(x)w2(x),
…
,pn(x)wn(x)]
ꢀꢀꢀꢀꢀ
(4)
[0073]
式中,pw(x)表示整体模型对原始样本x输出的加权类别预测向量,pn(x)和wn(x)分别表示对原始样本x的类别预测向量和权重向量中的第n个分量。
[0074]
下文结合附图和实验案例对本发明做进一步说明:
[0075]
为验证本发明所提方法(proposed)的优越性,使用了其他八种故障诊断方法进行对比,包括:lightgbm、随机森林(rf)、多粒度级联森林(gcforest)、首层宽卷积深度神经网络(wdcnn)、wdcnn+微调(wdcnn-ft)、原型网络(pn)、匹配网络(mn)和模型无关元学习(maml)。其中,lightgbm、rf、gcforest、wdcnn与mwe-lightgbm相同,都属于标准的监督学习方法;wdcnn-ft是以wdcnn作为基线模型的迁移学习方法;而pn、mn和maml都属于元学习方法,同样以wdcnn作为基线模型。通过对多种类型的方法进行对比,可以使实验结果更具有说服力。需要注意的是,对于迁移学习和元学习方法,将提供额外的源域标记样本来辅助模型训练。
[0076]
作为一种实施例,利用公开的帕德伯恩大学轴承数据集(pu轴承数据集)来设计相关实验。该数据集由32个滚动轴承数据组成,包括6个正常轴承数据、12个人工故障轴承数据和14个真实故障轴承数据。其中,人工故障通过电火花加工、钻孔和电雕刻三种方式来产生,而点蚀和塑性变形等真实故障通过轴承加速寿命实验来产生。该数据集采用压电式加速度传感器在表1所示的四种工况下采集轴承的振动信号,采样频率为64khz。
[0077]
表1 pu轴承数据集的实验工况
[0078][0079]
作为一种实施例,选择了13个轴承来设计小样本故障诊断任务,包括1个正常轴承、8个人工故障轴承以及4个真实故障轴承。实验轴承的详细描述如表2所示,共有三种故障位置:内圈故障、外圈故障、内外圈复合故障,以及两种故障严重程度:1级表示故障尺寸小于或等于2mm,2级表示故障尺寸大于2mm。在本实施例中,正常轴承和真实故障轴承被视为小样本故障诊断的目标轴承,仅有少量的标记样本可供训练使用。如表2所示,实验的目标轴承共包括五种健康类别,分别为正常、1级严重程度的真实内圈故障、1级严重程度的真实外圈故障、1和2级严重程度的真实内外圈复合故障。人工故障轴承将用于为上述迁移学习和元学习方法提供源域来辅助模型训练,包含大量的标记样本可用。
[0080]
表2实验轴承介绍
[0081][0082]
利用不重叠的滑动窗口来截取轴承振动信号并采集样本,分别在四种工况下为每个实验轴承采集了120个样本,每个样本包含2048个振动信号数据点。而后,在四种工况下分别构建了5-way k-shot(k=1,2,5,10)的小样本故障诊断任务,即随机选择每个目标轴承的1、2、5、10个样本用于训练,其余样本用于测试。对于迁移学习和元学习的方法,将额外使用从每个人工故障轴承上采集的120个样本来构成源域,同时模型的输入样本将从时域转化至频域,以提高这些方法的训练效果和诊断性能。表3给出了各对比方法所用的样本数量。为减少随机性,共进行了10次重复实验,取实验结果的平均值来评估各对比方法的诊断性能。本发明所提方法的超参数设置如表4所示。
[0083]
四种工况下的小样本故障诊断实验结果分别如图4、图5、图6和图7所示。实验结果表明,lightgbm、rf和wdcnn在所有小样本故障诊断任务中都取得了较低的测试精度,因为这些方法不允许使用源域或数据增强策略,导致模型在小样本条件下发生过拟合。相比之下,迁移学习和元学习的方法(如wdcnn-ft、pn、mn和maml)通过使用源域来辅助模型训练,
从而有效解决了过拟合问题。例如,在1-shot和5-shot任务中,wdcnn-ft分别获得了78.35%和88.54%的平均测试精度,比基线模型wdcnn的平均测试精度分别高出47.22%和42.27%。然而,这样的对比并不公平,因为标准的监督学习方法只能使用少量的标记样本进行训练。但尽管如此,本发明所提方法同样基于标准的监督学习,却能够在所有的小样本故障诊断任务中都取得最高的测试精度。具体而言,在工况一下的1-shot任务中,如图4所示,所提方法的测试精度为97.19%,比wdcnn-ft、pn、mn和maml分别高出17.81%、5.13%、4.28%和6.81%。此外,由于所提方法不需要依赖额外的跨域知识,能够在保证具有高诊断精度的同时避免构造源域所需的成本开销,因此更加高效和便捷,显著优于其他对比方法。
[0084]
另一个值得关注的对比方法是gcforest。从图4中可以看出,gcforest在1-shot和5-shot任务中的测试精度接近于本发明所提方法。然而,在1-shot和2-shot任务中,gcforest的测试精度明显低于本发明所提方法。虽然这两种方法都基于多尺度集成并采用了数据增强策略,但它们的分类性能仍有很大差异。这可能是由于gcforest的集成主要基于“深度”层面,当训练样本的数量极其稀缺时(如每类仅有1或2个样本),该方法容易出现一定程度的过拟合。相反,所提方法的集成基于“宽度”层面,模型不存在深层结构,因此仅需少量训练样本就能达到良好的拟合效果,比gcforest更适用于数据稀缺的场景。
[0085]
本发明所提方法在进行小样本故障诊断时,首先采用多尺度滑动窗口对原始样本进行重采样,以实现数据扩充,避免模型训练时发生过拟合。而后,将扩充后的数据用于训练多个lightgbm分类器,同时这些分类器被进一步集成为一个强分类模型。通过集成,每个lightgbm分类器所产生的诊断误差被削弱了,使得集成模型能够表现出更好的诊断性能和泛化性能。此外,在测试阶段,基于相似度度量的加权策略被用于为集成模型输出的诊断结果进行加权,以进一步提高诊断精度。上述实验案例的结果充分验证了本发明所提方法对于旋转机械小样本故障诊断的有效性和先进性。
[0086]
需要说明的是,虽然已经参照实例对本发明的实施进行了详细的阐述,但本领域的技术人员应当理解,在不脱离本发明设计精神的情况下所作的任何修改、替换和改进等,均应包含在本发明的保护范围之内。
技术特征:
1.基于多尺度集成lightgbm的小样本故障诊断方法,其特征在于,包括以下步骤:步骤1、数据集的采集与标定:采集旋转机械在某个实验工况下的振动加速度信号,从振动加速度信号中截取数据段来构成样本,并进行标注,选择其中若干个样本组成训练集其余样本组成测试集其中,x
i
和y
i
分别表示第i个样本及其对应的标签,k为训练集的样本数量,m为样本总数;步骤2、构建基于集成学习的小样本故障诊断模型,包括数据增强模块m
a
、标签分类模块m
c
和输出加权模块m
w
,其中,数据增强模块m
a
用于为样本进行多尺度重采样,以实现数据扩充;标签分类器模块m
c
用于为样本进行分类诊断,并输出相应的类别预测向量;输出加权模块m
w
用于为上述类别预测向量进行加权,以提高分类诊断的准确率;步骤3、数据增强:将步骤1构建的训练集d
train
和测试集d
test
分别输入数据增强模块m
a
,利用多尺度滑动窗口对原始样本进行重采样,获得大量尺度不一的子样本,并相应地构建多个具有不同尺度信息的子样本训练集和子样本测试集其中,和分别表示具有第j种尺度信息的子样本训练集和子样本测试集,t表示尺度的类别数量;步骤4、模型训练:在标签分类模块m
c
,对于步骤3中获得的每个子样本训练集,都采用梯度提升决策树算法分别训练一组基于轻量级梯度提升机(lightgbm)的标签分类器,共训练t组,其中,每组标签分类器都包含n个用于二分类的lightgbm模型,n即为标签的类别数量;步骤5、模型测试:在标签分类模块m
c
,将步骤3中获得的每个子样本测试集都分别输入对应组别的标签分类器,各组标签分类器输出测试结果,对测试结果进行加和求平均及拼接操作后得到t组n维的类别预测向量,将各组类别预测向量进行进一步的加和求平均,得到集成后类别预测向量,即标签分类模块m
c
对测试集d
test
输出的诊断结果;步骤6、权重计算:利用快速傅里叶变换将步骤3中获得的训练集d
train
和测试集d
test
中的样本从时域转换至频域,得到新的频域训练集d
train-f
和频域测试集d
test-f
,将频域训练集d
train-f
中的样本按类别进行加和求平均,得到n个类别中心,采用余弦相似度函数作为度量函数,计算频域测试集d
test-f
中的样本与各个类别中心的相似度,得到n维的度量向量,再将度量向量进行归一化,最终得到n维的权重向量;步骤7、输出加权:在输出加权模块m
c
,将步骤5、步骤6中获得的集成后的n维类别预测向量与对应的n维权重向量逐分量相乘,得到加权后的类别预测向量,其中最大的向量分量对应的类别即为整体模型对测试集d
test
的最终诊断结果。2.根据权利要求1所述的基于多尺度集成lightgbm的小样本故障诊断方法,其特征在于,步骤1中,从振动加速度信号截取样本时,各样本的数据点之间无重叠,此外,训练集d
train
和测试集d
test
的数据特征分布相同,且标签空间相同。3.根据权利要求1所述的基于多尺度集成lightgbm的小样本故障诊断方法,其特征在于,步骤2中,数据增强模块m
a
采用多尺度滑动窗口重采样的方法实现数据增强,标签分类模块m
c
包括多个用于二分类的lightgbm模型,输出加权模块m
w
采用相似度度量策略实现类别预测向量加权。4.根据权利要求1所述的基于多尺度集成lightgbm的小样本故障诊断方法,其特征在于,步骤3中利用多尺度滑动窗口对原始样本进行重采样时,窗口的尺度分别设置为原始样
本数据点长度的其中t为尺度的类别数量,窗口的滑动步长设置为1,以此来获得更多的子样本,子样本的类别与原始样本的类别保持一致。5.根据权利要求1所述的基于多尺度集成lightgbm的小样本故障诊断方法,其特征在于,步骤4中,每组标签分类器的功能相同,都用于执行n分类目标任务,而其中每个lightgbm都用于为某种类别的子样本进行二分类;对于输入每组第q个lightgbm的子样本训练集,属于第q种类别的子样本将被视为正类并设置标签为1,而属于其他n-1种类别的子样本将被视为负类并设置标签为0,每个lightgbm通过梯度提升决策树算法来训练,其损失函数表示为:式中,l表示损失函数,n表示用于训练的子样本总数,与分别表示第h个子样本的标签真实值与预测值,预测值越大则表示该子样本属于对应正类的概率越大。6.根据权利要求1所述的基于多尺度集成lightgbm的小样本故障诊断方法,其特征在于,步骤5中,具有第j种尺度信息的子样本测试集将使用由具有第j种尺度信息的子样本训练集所训练的一组标签分类器来进行测试。7.根据权利要求1所述的基于多尺度集成lightgbm的小样本故障诊断方法,其特征在于,步骤5中,将子样本测试集输入对应组别的标签分类器进行测试时,将得到每个lightgbm对子样本的测试结果,通过将测试结果进行加和求平均,得到每个lightgbm对原始样本的测试结果;将各组标签分类器中所有的lightgbm对原始样本的测试结果按顺序进行拼接后,得到各组标签分类器对原始样本的类别预测向量,将各组类别预测向量进行进一步的加和求平均后,即得到集成后的类别预测向量,其表示为:式中,p(x)表示标签分类模块m
c
对原始样本x的输出的集成后的类别预测向量,p
n
(x)表示类别预测向量p(x)的第n个分量,和n
j
分别表示对原始样本x而言具有第j种尺度信息的第z个子样本及具有第j种尺度信息的子样本总数,f
j,n
表示第j组标签分类器中的第n个lightgbm第j种尺度信息,n为标签的类别数量,即每组标签分类器中lightgbm的数量,t为尺度的类别数量,即标签分类器的组数。8.根据权利要求1所述的基于多尺度集成lightgbm的小样本故障诊断方法,其特征在于,步骤6中,频域训练集d
train-f
和频域测试集d
test-f
中的样本是时域训练集d
train
和时域测试集d
test
中的原始样本在频域上的频谱表示,其数据点长度是原始样本的一半。9.根据权利要求1所述的基于多尺度集成lightgbm的小样本故障诊断方法,其特征在于,步骤6中,采用余弦相似度函数计算频域测试集d
test-f
中的样本与各个类别中心的相似度,通过将计算出的相似度进行拼接,得到n维的度量向量,采用具有调整因子的softmax函数对度量向量进行归一化,得到以下的权重向量:
式中,w(x)表示计算得到的对原始样本x的权重向量,w
n
(x)表示权重向量w(x)的第n个分量,c
q
表示第q个类别中心,s(x,c
q
)表示原始样本x与第q个类别中心的余弦相似度计算值,s(x,c
n
)表示原始样本x与第n个类别中心的余弦相似度计算值,λ为调整因子,用于控制归一化后权重向量中各分量的差异。10.根据权利要求1所述的基于多尺度集成lightgbm的小样本故障诊断方法,其特征在于,步骤7中,加权后的类别预测向量由下式表示:p
w
(x)=[p1(x)w1(x),p2(x)w2(x),
…
,p
n
(x)w
n
(x)]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)式中,p
w
(x)表示整体模型对原始样本x输出的加权类别预测向量,p
n
(x)和w
n
(x)分别表示对原始样本x的类别预测向量和权重向量中的第n个分量。
技术总结
本发明公开了基于多尺度集成LightGBM的小样本故障诊断方法,包括以下步骤:采集旋转机械的振动加速度信号并截取样本,得到训练集和测试集;构建由数据增强模块、标签分类模块和输出加权模块组成的多尺度集成模型;在数据增强模块,利用多尺度滑动窗口对原始样本进行重采样,得到多个子样本训练集和子样本测试集;在训练阶段,利用子样本训练集训练标签分类模块中的多组分类器;在测试阶段,将子样本测试集分别输入对应组别的分类器中,通过集成得到标签分类模块对原始样本的测试结果;利用度量函数计算测试集与训练集样本在频域上的相似度,并作为权重;在输出加权模块,对集成后的测试结果进行加权,得到最终的分类诊断结果。果。果。
技术研发人员:李巍华 何敬科 陈祝云 许维冬 贺毅
受保护的技术使用者:华南理工大学
技术研发日:2023.05.31
技术公布日:2023/9/14
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/