一种基于LightGBM特征提取和BiLSTM的滚动轴承故障诊断方法与流程

未命名 09-12 阅读:118 评论:0

一种基于lightgbm特征提取和bilstm的滚动轴承故障诊断方法
技术领域
1.本发明属于滚动轴承故障诊断技术领域,特别涉及一种基于lightgbm特征提取和bilstm的滚动轴承故障诊断方法。


背景技术:

2.随着电机和自动化设备的广泛应用,有关这方面的机械故障诊断技术也被广泛应用。滚动轴承作为旋转机电设备中的一个重要机械部件,如果产生故障,有可能导致整个机电设备的运行都受到不利影响。滚动轴承故障主要表现为滚动表面或滚动体受交变力作用,长时间旋转引起表面材料疲劳而出现点蚀剥落或裂纹等部件表面损伤类故障
[1-2]
,准确地诊断滚动轴承的故障,对保障设备的运行生产和设备的维修决策具有重大意义。
[0003]
通常,滚动轴承的特征提取方法有,利用小波变换进行滤波和包络检波,以便提取故障信号的特征频率
[3-4]
。该方法对故障的特征频率和信噪比的去除有较多要求和局限性。还有可利用小波特性进行故障信号的奇异点检测
[5-7,12]
。该方法容易由奇异点信号引起误判。而滚动轴承的预测诊断方法有,小波系数的峰值和rms值输入到循环神经网络(recurrent neural network,rnn)模型中
[8]
,将频域、时频域特征和自编码器压缩时域特征联合输入到深度神经网络
[9]
,构建特征矩阵来训练cnn故障诊断模型
[10]
,使用玻尔兹曼机进行特征提取后利用自组织映射网络
[11]
。这些研究方法有的提前进行了振动信号特征的提取,有的使用了数学模型或深度学习模型,而轴承的运行实际特征频率会在小范围内有一定的跳跃,但上述方法均未能有效的提取振动信号的全频段特征,也未能考虑滚动轴承振动信号的复杂性和性能逐渐退化的特性。


技术实现要素:

[0004]
针对上述问题,本发明提供一种基于lightgbm特征提取和bilstm的滚动轴承故障诊断方法,所述方法包括:采集滚动轴承不同故障类型的振动信号数据;将振动信号数据分为训练样本和测试样本,并分别进行离散化处理;输入离散后的振动信号构建直方图决策树,生成lightgbm模型;通过lightgbm模型对训练样本和测试样本进行特征提取,生成训练集和测试集;将训练集输入bilstm模型做5折正交训练并调参;将测试集输入bilstm模型,预测诊断故障。
[0005]
优选地,所述故障类型包括:外圈磨损、外圈腐蚀、外圈疲劳剥落、外圈断裂、内圈磨损、内圈腐蚀、内圈疲劳剥落、内圈断裂、滚珠磨损和滚珠腐蚀。
[0006]
优选地,所述将振动信号数据分为训练样本和测试样本之后,还包括:对不同的故障类型进行排序,故障类型对应的序号作为对应的训练样本的标签。
[0007]
优选地,所述输入离散后的振动信号构建直方图决策树,包括:
选定直方图的宽度,宽度为振动信号数据离散生成的整数的个数;将离散后的振动信号数据作为直方图的索引来对统计量进行累计,并通过对离散后的振动信号数据进行装箱处理,形成bin,构建直方图决策树。
[0008]
优选地,所述构建直方图决策树,包括以下步骤:迭代优化直方图决策树,获取最佳分裂特征;建立根节点,依据最佳分裂特征切分离散后的振动信号数据,直至直方图决策树的叶子深度数限制停止分裂;更新离散后的振动信号数据分裂出的最佳值;更新直方图决策树的梯度值,直至所有直方图决策树优化建立完成。
[0009]
优选地,所述迭代优化直方图决策树包括:遍历所有训练样本和测试样本,分别以当前bin作为分割点,左边的bin累加至当前bin梯度和与样本数,然后与父节点上的总梯度与总样本相减,从而得出右边所有bin的梯度和与样本数,在遍历过程中求得最大增益,以最大增益对应的bin特征值和特征作为最佳分裂特征。
[0010]
优选地,所述最佳分裂特征计算公式为:;其中,为样本梯度之和,为样本数量,、均为序号位置,是直方图内样本的总行数,属于1至中的的任一整数。
[0011]
优选地,所述将测试集输入bilstm模型,预测诊断故障,包括:bilstm模型对测试集进行预测,获取预测故障数值;在故障类型字典中查找与预测故障数值对应的故障类型,输出诊断结果。
[0012]
优选地,所述故障类型字典包括故障类型和每种故障类型对应的序号。
[0013]
优选地,所述bilstm模型由bilstm层、dropout层、bilstm层、dropout层、全连接层、激活层和输出层组成。
[0014]
本发明具有以下有益效果:本发明基于lightgbm特征提取和bilstm的滚动轴承故障诊断方法,可以对滚动轴承的全频段振动信号使用lightgbm快速有效地提取特征,然后使用构建的堆叠bilstm模型解决梯度消失问题和特征信息的前后依赖关系,构成由lightgbm特征提取到bilstm故障识别的新模型。
[0015]
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书以及附图中所指出的结构来实现和获得。
附图说明
[0016]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]
图1示出本发明实施例中基于lightgbm提取特征和bilstm的滚动轴承故障诊断方法图;图2示出本发明实施例中训练阶段和预测阶段的示意图;图3示出本发明实施例中由lstm构成的bilstm结构示意图;图4示出本发明实施例中构建直方图树示意图;图5示出本发明实施例中lightgbm提取特征示意图;图6示出本发明实施例中基于lightgbm提取特征的listm深度学习模型的示意图;图7示出本发明实施例中基于lightgbm提取特征和bilstm的滚动轴承故障诊断系统图。
具体实施方式
[0018]
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
[0019]
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。
[0020]
附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0021]
本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。
[0022]
此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或子模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或子模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或子模块。
[0023]
如图1所示,本发明提出一种基于lightgbm特征提取和bilstm的滚动轴承故障诊
断方法,所述方法包括以下步骤:s1、采集滚动轴承不同故障类型的振动信号数据;所述故障类型包括:外圈磨损、外圈腐蚀、外圈疲劳剥落、外圈断裂、内圈磨损、内圈腐蚀、内圈疲劳剥落、内圈断裂、滚珠磨损和滚珠腐蚀。
[0024]
所述故障类型字典包括故障类型和每种故障类型对应的序号。
[0025]
故障类型按故障名称的0至9的序号构成轴承故障类型字典statusdict={'0':'外圈磨损','1':'外圈腐蚀','2':'外圈疲劳剥落','3':'外圈断裂','4':'内圈磨损','5':'内圈腐蚀','6':'内圈疲劳剥落','7':'内圈断裂','8':'滚珠磨损','9':'滚珠腐蚀'};s2、将振动信号数据分为训练样本和测试样本,并分别进行离散化处理;将振动信号数据分为训练样本和测试样本之后,还包括:对不同的故障类型进行排序,故障类型对应的序号作为对应的训练样本的标签。
[0026]
s3、输入离散后的振动信号构建直方图决策树,生成lightgbm模型;本发明使用的lightgbm可以较好寻找最佳分裂特征,机器学习中算法常用的有回归和分类
[13]
,典型的集成决策树算法有gbdt算法
[14][15]
,其既可做回归又可做分类。lightgbm 算法对gbdt算法做了许多改进优化
[16]
。lightgbm通过数值离散构建分箱形成直方图树寻找最优切分点,可以很好提高训练速度获取重要特征并节省内存,同时降低时间复杂度。
[0027]
如图5所示,输入离散后的振动信号构建直方图决策树,包括:选定直方图的宽度,宽度为振动信号数据离散生成的整数的个数;将离散后的振动信号数据作为直方图的索引来对统计量进行累计,并通过对离散后的振动信号数据进行装箱处理,形成bin,构建直方图决策树。
[0028]
所述构建直方图决策树,包括以下步骤:迭代优化直方图决策树,获取最佳分裂特征;建立根节点,依据最佳分裂特征切分离散后的振动信号数据,直至直方图决策树的叶子深度数限制停止分裂;更新离散后的振动信号数据分裂出的最佳值;更新直方图决策树的梯度值,直至所有直方图决策树优化建立完成。
[0029]
如图4所示,所述迭代优化直方图决策树包括:遍历所有训练样本和测试样本,分别以当前bin作为分割点,左边的bin累加至当前bin梯度和与样本数,然后与父节点上的总梯度与总样本相减,从而得出右边所有bin的梯度和与样本数,在遍历过程中求得最大增益,以最大增益对应的bin特征值和特征作为最佳分裂特征。
[0030]
所述最佳分裂特征计算公式为:;其中,为样本梯度之和,为样本数量,、均为序号位置,是直方图内样本的总行数,属于1至中的的任一整数。
[0031]
s4、通过lightgbm模型对训练样本和测试样本进行特征提取,生成训练集和测试
集;s5、将训练集输入bilstm模型做5折正交训练并调参;如图6所示,所述bilstm模型为依次设置bilstm层、dropout层、bilstm层、dropout层、全连接层、激活层和输出层的深度结构的神经网络。bilstm网络由lstm拼接串联而成,具体结构示意图如图3所示。
[0032]
bilstm网络中lstm长短记忆单元的构建过程为:lstm网络在隐藏层引入了一组记忆单元,主要通过门控制器对不同时刻记忆进行权重控制,共计有三个门控制器:输入门i、遗忘门f和输出门o;输入门决定让新的信息加入到cell状态中来,遗忘门决定从cell状态中丢弃信息,候选态根据上一次的输出和本次输入计算被输入门限制是否进入长期记忆的内容,输出门决定从cell状态中输出信息,记忆单元结合遗忘门和输入门来更新记忆单元;lstm长短记忆单元通过门控制器控制特征信息的流动,从而更好获取特征信息中长期依赖的信息,减少循环神经网络的梯度消失,有效地处理序列数据:其更新计算步骤:计算输入门,i
t
=σ(wix
t
+u
iht-1
+bi);计算遗忘门,f
t
=σ(wfx
t
+ufh
t-1
+bf);计算候选态,c
t’=tanh(wcx
t
+uch
t-1
);计算输出门,o
t
=σ(wox
t
+u
oht-1
+bo);计算记忆单元,c
t
=f
tct-1
+i
tct’;计算单元记忆输出,h
t
=o
t
tanh(c
t
);其中,wf、wi、wc、wo分别为t时刻由输入层xt到隐藏层ht的转移权重矩阵,uf、ui、uc、uo分别是由时刻t-1到时刻t隐藏层的状态转移权重矩阵,bi、bf、bo分别为输入门、遗忘门、输出门的偏置,σ为sigmoid函数。
[0033]
s6、将测试集输入bilstm模型,预测诊断故障。
[0034]
所述将测试集输入bilstm模型诊断滚动轴承故障,包括:bilstm模型对测试集进行预测,获取预测故障数值;在故障类型字典中查找与预测故障数值对应的故障类型,输出诊断结果。预测故障数值即为故障类型的标签,依据故障类型的标签在字典里找到对应的故障类型。
[0035]
具体地,本发明的诊断方法包括两个阶段:训练阶段和预测阶段。
[0036]
(一)训练阶段:(如图2左边的虚线框所示)步骤1:将带标签的数据预处理后离散化通过lightgbm提取特征后构建二维输入数据。
[0037]
步骤2:使用adam梯度下降算法计算五折交叉验证迭代训练深度学习模型。
[0038]
(二)预测阶段:(如图2右边的虚线框所示)步骤1:将没带标签的数据预处理后离散化通过lightgbm提取特征后构建二维预测数据。
[0039]
步骤2:使用训练阶段训练好的lilstm深度学习模型进行预测。
[0040]
下面具体阐述两个阶段的实现过程。
[0041]
(一)训练阶段:步骤1-1:将原始数据预处理并转化为标准二维数据。
[0042]
具体为:采集机电设备实测轴承振动信号数据,分别对滚动轴承的内环、外环和滚动体的不同故障振动信号共计采集10组。每组400个故障样例,分别以13000次/秒和6500次/秒的不同采样率分别进行振动信号采集,每类故障不同采样率数据分别采集200个样例,各组数据汇总构成训练集。数据采集并预处理后,将振动信号数据离散化,然后输入本文的lightgbm模型,做五折交叉验证训练提取特征。主要调参设置为最大迭代次数n_estimators为1000,树的最大深度max_depth为3,模型学习率learning_rate为0.1,指定叶子数num_leaves为31,分类的类别数num_class为10。然后模型做fit五折交叉验证训练,模型做fit的住要参数评分函数eval_metric为multi_logloss,验证训练集eval_set为[(valid_features,valid_labels),(train_features,train_labels)],其中valid_features,valid_labels,train_features,train_labels分别表示为验证集,验证集类别标签,训练集,训练集类别标签。对每一折训练,用训练好的模型预测测试集并除以5,作为测试集特征,用训练好的模型预测验证集,直接作为训练集的特征,然后将每一折得到的特征按相应的索引号顺序累加分别构成相应的测试集和训练集特征。这里是基于不同类别数据集,学习提取不同类别的特征,生成的训练集实际特征结果样例如表1所示:测试集没有标签,测试集实际特征结果样例如表2所示:最后分别将特征归一化构成初始的训练集和测试集的标准二维数据。
[0043]
表1
[0044]
表2
[0045]
步骤1-2:根据滚动轴承的外圈故障(磨损、腐蚀、疲劳剥落和断裂),内圈故障(磨损、腐蚀、疲劳剥落和断裂)和滚珠故障(磨损和腐蚀)。共10类故障。这10种轴承故障类型按故障名称的0至9的序号构成轴承故障类型字典statusdict={
‘0’


外圈磨损’,
‘1’


外圈腐蚀’,
‘2’


外圈疲劳剥落’,
‘3’


外圈断裂’,
‘4’


内圈磨损’,
‘5’


内圈腐蚀’,
‘6’


内圈疲劳剥落’,
‘7’


内圈断裂’,
‘8’


滚珠磨损’,
‘9’


滚珠腐蚀’},轴承故障名称对应序号作为训练集标签。
[0046]
步骤1-3:将预处理初始化好的训练集二维数据通过设置input_shape=(8000,128)降维输入,划分为5份分别做交叉验证训练。
[0047]
步骤1-4:通过bidirectional、lstm和input_shape构建双向lstm,提取特征获取数据矩阵大小为(none,8000,128)的三维矩阵,然后通过dropout抽样,抽样率为0.8。
[0048]
步骤1-5:将步骤1-4中的抽样后的矩阵再次通过bidirectional和lstm构建双向lstm,提取特征获并降低矩阵大小为(none,64)的二维矩阵,然后通过dropout抽样,抽样率为0.7。
[0049]
步骤1-6:将步骤1-5中的矩阵送入全连层,来提取特征并降低矩阵大小为(none,10)。
[0050]
步骤1-7:设置optimizer优化函数为'adam',metrics评价函数设为'accuracy',训练批次数量batch_size设为256,迭代次数nb_epoch设为1200。
[0051]
步骤1-8:使用adam梯度下降算法进行多分类计算训练深度学习模型和调参数。
[0052]
步骤1-9:训练深度学习模型达到最大迭代次数1200,则中断深度学习模型训练。基于lightgbm提取特征的listm深度学习模型的示意图如图6所示。
[0053]
(二)预测阶段:步骤2-1:按步骤1-1方法对各类故障样例采集共计360个没有标签的样例作为测试集。然后按步骤1-1的数据转化方式把预测数据处理成标准二维数据。
[0054]
步骤2-2:将步骤2-1预处理好的预测数据送入训练好的lilstm深度学习模型预测,得到轴承故障预测数字类别结果。然后使用步骤1-2生成的电机状态故障类型字典将数字类别转化为电机状态故障名称。lilstm深度学习模型预测的真实值和预测值的混淆矩阵见下表3,滚动轴承故障诊断的实验结果见表4。
[0055]
表3
[0056]
表4
[0057]
由表3和表4的预测结果可以看出,本发明的基于lightgbm特征提取和bilstm的滚动轴承故障诊断发明方法,除了外环故障的预测精确率为99.31%,其余的内环故障和滚珠故障的预测精确率达到了100%,超过了一些普通特征提取分析和频谱分析的精确率,取得了较好的预测效果分析。
bearingusinghierarchical convolutional network based health state classification[j].advanced engineering informatics,2017,32:139-151.[11] liao l x,jin w j,pavel r.enhanced restricted boltzmann machine with prognosability regularization for prognostics and health assessment[j].ieee transactions on industrial electronics,2016,63(11):7076-7083.[12]陈长征,杨璐. 基于小波分析技术的通风机振动故障诊断研究[j]. 风机技术,1999.(6):34-36[13]witten i h,frank e.data mining:practical machine learning tools and techniques(third edition)[m].机械工业出版社,2005.[14]friedman j h. greedy function approximation:a gradient boosting machine[j].annals of statistics,2001,29(5):1189-1232.[15]son j,jung i,park k,et al. tracking-by-segmentation with on-line gradient boosting decision tree[c]// ieee international conference on computer vision. ieee,2016.[16]wang d,zhang y,zhao y. lightgbm:an effective mirna classification method in breast cancer patients[c]// the 2017 international conference. 2017.

技术特征:
1.一种基于lightgbm特征提取和bilstm的滚动轴承故障诊断方法,其特征在于,所述方法包括:采集滚动轴承不同故障类型的振动信号数据;将振动信号数据分为训练样本和测试样本,并分别进行离散化处理;输入离散后的振动信号构建直方图决策树,生成lightgbm模型;通过lightgbm模型对训练样本和测试样本进行特征提取,生成训练集和测试集;将训练集输入bilstm模型做5折正交训练并调参;将测试集输入bilstm模型,预测诊断故障。2.根据权利要求1所述的基于lightgbm特征提取和bilstm的滚动轴承故障诊断方法,其特征在于,所述故障类型包括:外圈磨损、外圈腐蚀、外圈疲劳剥落、外圈断裂、内圈磨损、内圈腐蚀、内圈疲劳剥落、内圈断裂、滚珠磨损和滚珠腐蚀。3.根据权利要求1所述的基于lightgbm特征提取和bilstm的滚动轴承故障诊断方法,其特征在于,所述将振动信号数据分为训练样本和测试样本之后,还包括:对不同的故障类型进行排序,故障类型对应的序号作为对应的训练样本的标签。4.根据权利要求1所述的基于lightgbm特征提取和bilstm的滚动轴承故障诊断方法,其特征在于,所述输入离散后的振动信号构建直方图决策树,包括:选定直方图的宽度,宽度为振动信号数据离散生成的整数的个数;将离散后的振动信号数据作为直方图的索引来对统计量进行累计,并通过对离散后的振动信号数据进行装箱处理,形成bin,构建直方图决策树。5.根据权利要求1所述的基于lightgbm特征提取和bilstm的滚动轴承故障诊断方法,其特征在于,所述构建直方图决策树,包括以下步骤:迭代优化直方图决策树,获取最佳分裂特征;建立根节点,依据最佳分裂特征切分离散后的振动信号数据,直至直方图决策树的叶子深度数限制停止分裂;更新离散后的振动信号数据分裂出的最佳值;更新直方图决策树的梯度值,直至所有直方图决策树优化建立完成。6.根据权利要求5所述的基于lightgbm特征提取和bilstm的滚动轴承故障诊断方法,其特征在于,所述迭代优化直方图决策树包括:遍历所有训练样本和测试样本,分别以当前bin作为分割点,左边的bin累加至当前bin梯度和与样本数,然后与父节点上的总梯度与总样本相减,从而得出右边所有bin的梯度和与样本数,在遍历过程中求得最大增益,以最大增益对应的bin特征值和特征作为最佳分裂特征。7.根据权利要求6所述的基于lightgbm特征提取和bilstm的滚动轴承故障诊断方法,其特征在于,
所述最佳分裂特征计算公式为:;其中,为样本梯度之和,为样本数量,、均为序号位置,是直方图内样本的总行数,属于1至中的的任一整数。8.根据权利要求1所述的基于lightgbm特征提取和bilstm的滚动轴承故障诊断方法,其特征在于,所述将测试集输入bilstm模型,预测诊断故障,包括:bilstm模型对测试集进行预测,获取预测故障数值;在故障类型字典中查找与预测故障数值对应的故障类型,输出诊断结果。9.根据权利要求8所述的基于lightgbm特征提取和bilstm的滚动轴承故障诊断方法,其特征在于,所述故障类型字典包括故障类型和每种故障类型对应的序号。10.根据权利要求1所述的基于lightgbm特征提取和bilstm的滚动轴承故障诊断方法,其特征在于,所述bilstm模型由bilstm层、dropout层、bilstm层、dropout层、全连接层、激活层和输出层组成。

技术总结
本发明属于滚动轴承故障诊断技术领域,特别涉及一种基于LightGBM特征提取和BiLSTM的滚动轴承故障诊断方法。所述方法包括:采集滚动轴承不同故障类型的振动信号数据;将振动信号数据分为训练样本和测试样本,并分别进行离散化处理;输入离散后的振动信号构建直方图决策树,生成LightGBM模型;通过LightGBM模型对训练样本和测试样本进行特征提取,生成训练集和测试集;将训练集输入BiLSTM模型做5折正交训练并调参;将测试集输入BiLSTM模型,预测诊断故障。本发明基于LightGBM特征提取和BiLSTM的滚动轴承故障诊断方法,可以对滚动轴承的全频段振动信号使用LightGBM快速有效地提取特征,然后使用构建的堆叠BiLSTM模型解决梯度消失问题和特征信息的前后依赖关系,构成由LightGBM特征提取到BiLSTM故障识别的新模型。LightGBM特征提取到BiLSTM故障识别的新模型。LightGBM特征提取到BiLSTM故障识别的新模型。


技术研发人员:陈安志
受保护的技术使用者:成都星云智联科技有限公司
技术研发日:2023.08.02
技术公布日:2023/9/9
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐