一种基于时空注意力机制的深度循环神经网络的电信号预测方法

未命名 09-13 阅读:136 评论:0


1.本发明涉及基于时空注意力机制的深度循环神经网络的电信号预测方法


背景技术:

2.随着技术的不断发展,预测和健康管理技术(phm)在各个领域日益受到关注。该技术利用先进传感器实时监测装备运行的状态参数和特征信号,并结合智能推理算法和模型,旨在评估装备的健康状态并实现主动故障预测。在飞行器的故障管理任务中,故障预测是至关重要的一环,它可以提前预测装备故障,并评估剩余寿命,以便及时采取预防措施。
3.传统的故障预测方法主要分为三类:基于物理模型的方法、基于数据驱动的方法以及基于混合估计的方法。基于物理模型的方法依赖于装备退化过程的机理模型,但对于功能众多或工况多变的装备,退化机理往往复杂或未知,因此直接建立物理模型变得困难。基于数据驱动的方法则通过从设备运行过程的监测数据中提取特征,并建立特征随时间变化的模型,以构建健康指标用于故障预测。相比于物理模型方法,数据驱动方法更具通用性,适用于各种装备部件的故障预测。另外,基于混合估计的方法有效地结合了不同模型的优点,为故障预测提供了新的解决思路,然而该方法的复杂度和求解难度较高,目前研究相对较少。
4.近年来,基于数据驱动的方法在故障预测领域迅速发展。相对于依赖特定的失效物理模型,这种方法更具通用性,能够应用于不同装备部件的故障预测。通过从实时采集的监控信号中提取特征,并利用算法模型和知识库,数据驱动方法能够实时预测系统未来的工作状态和变化趋势,从而实现对故障的提前预防与管理。其应用将为飞行器健康管理提供可靠的数据支撑,提高飞行安全性和装备可靠性。
5.综上所述,预测和健康管理技术的发展旨在利用先进传感器、智能推理算法和模型来实现装备的健康状态评估和主动故障预测。在不同的故障预测方法中,基于数据驱动的方法因其通用性和快速发展的趋势而备受关注。这种方法为各类装备部件的故障预测提供了一种灵活且可行的解决方案,有望广泛应用于各个领域,推动故障预测技术的不断创新和发展。
6.循环神经网络是一种带有循环结构与机制的深度神经网络。在循环神经网络中,每一层都具有基于一维顺序的反馈循环,最终的网络通过循环网络层叠加而成。在网络循环式地处理传递的信息内容时,能通过数据传播方式学习到数据中的时序信息。在循环神经网络每层的运行过程中,通过内部循环记忆的机制,可以对每层所输入的信息进行记忆。当一个信息被添加到某一循环网络层中,循环神经网络可以利用多次循环机制将更新的信息有上一循环神经元传递到下一循环神经元当中,从而使循环神经网络具有大长度的记忆深度,这也是该网络能应用于时序数据处理的原因。目前,循环神经网络已经广泛应用于自然语言处理问题中,在时间序列预测问题上也得到有效应用。
7.然而循环神经网络处理长序列数据时存在梯度消失的问题,因此,需要对循环神
经网络进行改进,以有效规避循环神经网络中出现的梯度消失问题。


技术实现要素:

8.针对现有技术的上述问题,本发明将长短期记忆网络应用于飞行器电信号故障预测中,在克服了数据梯度消失的前提下,有效提升了预测精度。
9.基于长短期记忆网络提取的不同时间节点特征向量之间会具有一些联系,基于时间注意力机制的网络层能够通过训练信号中不同时间节点提取特征的重要程度来提取时许信号中的重要特征。本发明通过注意力机制所起的作用,可以找出电信号中的关键时间节点,这些时间节点的数据特征往往是预测的重要信息。
10.本发明中的基于长短期记忆网络进行飞行器电信号预测,一方面克服了时序序列预测中存在的梯度消失问题与多时间节点特征权重分配问题,同时通过采用滑动窗口预测的方法进行预测,既使得网络接收了足够的前序数据信息,又保障了网络运行的计算量不至于太大,有效提升了飞行器电信号故障预测的准确率和实时性。
附图说明
11.图1显示了根据本发明的一个实施例的基于时空注意力机制的深度循环神经网络电信号预测方法的流程图,
12.图2显示了根据本发明的一个实施例的飞行器电信号故障预测的深度循环神经网络的训练流程图。
具体实施方式
13.如图1所示,根据本发明的一个实施例的基于时间注意力机制的深度循环神经网络的电信号预测方法包括:
14.当对飞行器电信号进行预测时(101),首先输入长度为t的信号(102)进入第一长短期记忆层(103);根据本发明的一个实施例采用滑动窗口预测的方法来进行预测,滑动窗口机制通过在输入的定长数据集上通过滑动窗口来捕获网络的输入序列,然后得到后序的输出序列。此时再把预测得到的新数据点作为输入序列的一部分,进一步预测出下一点的值。通过滑动窗口预测方法,既使网络接收了足够的前序信息,又保障了网络运行的计算量不至于太大,未来有望拓展到移动设备中进行线上预测任务当中。与通常的循环神经网络类似,长短期记忆网络(长短期记忆层)的数据流也是由循环结构构成的。在通常的循环神经网络中,前后循环传递的参数只有隐藏状态h,而在本发明的长短期记忆网络(长短期记忆层)中,新增了隐藏状态c,该状态被称之为细胞状态。在本发明的长短期记忆网络中,存在着多个运算门结构(gate),具体介绍如下:
15.长短期记忆网络的一个循环神经元的输入数据为h
t-1
与c
t-1
。其中输入为h
t-1
与x
t
(x
t
为输入状态)并传递用于对细胞状态进行遗忘的门为遗忘门,遗忘门决定了历史状态信息的遗忘程度。遗忘门的计算公式为:
16.f
t
=σ(wf·
[h
t-1
,x
t
]+bf)
ꢀꢀꢀꢀ
(1)
[0017]
其中wf和bf分别为遗忘门对应的权值参数与偏差参数,[h
t-1
,x
t
]运算表示将两个矩阵拼接为一个矩阵,σ()为激活函数,在此激活函数一般使用sigmoid函数,其表达式为:
[0018][0019]
输入为h
t-1
与x
t
,并传递用于对细胞状态进行更新的门为输入门。输入门的计算公式为:
[0020]it
=σ(wi·
[h
t-1
,x
t
]+bi)
ꢀꢀꢀꢀ
(3)
[0021]
其中wi和bi分别为输入门对应的权值参数与偏差参数,[h
t-1
,x
t
]运算表示将两个矩阵拼接为一个矩阵,σ()为激活函数。
[0022]
然后,针对h
t-1
与x
t
,新的输入信息由下式计算得来:
[0023][0024]
其中wc和bc分别为对应的权值参数与偏差参数,[h
t-1
,x
t
]运算表示将两个矩阵拼接为一个矩阵。
[0025]
于是,新的细胞状态根据遗忘门、输入门和新输入信息,如下式进行更新:
[0026][0027]
同时,输入为h
t-1
与x
t
并用于计算下一输出隐藏状态h
t
的运算门为输出门。输出门的计算公式为:
[0028]ot
=σ(wo·
[h
t-1
,x
t
]+bo)
ꢀꢀꢀꢀ
(6)
[0029]
其中wo和bo分别为输出门对应的权值参数与偏差参数,[h
t-1
,x
t
]运算表示将两个矩阵拼接为一个矩阵,σ()为激活函数。
[0030]
通过输出门和细胞状态,最终的输出h
t
由下式得到:
[0031]ht
=o
t
*tanh(c
t
)
ꢀꢀꢀꢀ
(7)
[0032]
由此,该神经元最终输出了隐藏态h
t
,并将h
t
与新的细胞状态c
t
传递到下一循环神经元当中。
[0033]
将一定时序范围n的隐藏态输入时间注意力层,计算各个输入的注意力概率分布值a1,a2,...an。
[0034][0035]
不同时间节点的概率分布值经过归一化:
[0036][0037]et
=tanh(w
tht
+b
t
)
ꢀꢀ
(10)
[0038]
其中,e
t
是由babdanau等人提出的一种校验模型,e
t
表示第t时刻隐层状态向量h
t
所决定的注意力概率分布值,w
t
表示第t时刻的权重系数矩阵,b
t
表示第t时刻相应的偏移量。通过上面的公式可以计算出最后包含时序信号的特征向量v,作为随机丢弃层的输入。
[0039]
根据本发明的长短期记忆层的更新同样采用基于时间的反向传播方法。但与传统循环神经网络层相比,根据本发明的长短期记忆层的更新存在着优势:在循环神经网络中,求偏导数的时候进行链式乘法,当其中一个输出元效果不佳时,对整个系统的权值都会有很大的影响。而在根据本发明的长短期记忆层中,进行更新时采用的是加法运算,因此即使
存在输出元效果不佳的情况,也不会对网络权值产生巨大的影响。这个由乘法到加法的变换,很大程度上解决了循环神经网络层中出现的梯度消失和梯度爆炸问题。堆叠的长短期记忆神经元能使网络能充分记忆前序信号的波性特征,并从中提取出更深层的特征。
[0040]
为了利用堆叠的长短期记忆神经元以使网络能够充分记忆前序信号的波形特征,并从中提取出更深层的特征,根据本发明的实施例包括了第一至第三长短期记忆层(103),(106)及(108)及其各自分别对应的第一至第三时间注意力机制层(104),(107)及(109)。时间注意力机制层可以根据训练数据自适应的。同时,本发明在网络中包括了第一和第二随机丢弃层(105)与(110),以为训练数据增添随机噪声,从而有效抑制过拟合现象,使网络在测试数据中更具有鲁棒性。第一长短期记忆层(103)的数据流经过第一时间注意力机制层(104)被送到第一随机丢弃层(105),经过随机丢弃后的数据输入至第二和第三长短期记忆层(106)和(108)及其相对应的第二和第三时间注意力层(107)和(109),以进一步提取深度特征,随后再通过第二随机丢弃层(110)执行随机丢弃以防止网络过拟合,最后数据流通过全连接层(111)输出预测结果(112)。结束操作(113)。
[0041]
本发明的时空注意力机制的深度循环神经网络的训练算法的流程图如图2所示。开始训练后(201),首先采用滑动窗口方法划分数据集(202),即划分为时间序列和预测值的样本形式。接着对迭代步数进行初始化(203),开始训练(204),按批次输入划分好的样本(205),进行前向传播(206),计算网络损失函数(207)并反向更新网络参数(208)。判断是否遍历训练集(209),没有的话返回(205)继续,若已遍历数据集,则将当前轮数加1(210),返回(204)开始新一轮训练。直到训练轮次已到设定的轮数时(211),结束训练(212)。根据本发明的一个实施例,网络损失函数设定为均方误差函数,最终的预测精度采用均方根误差来衡量。根据本发明的一个实施例,采用adam优化器进行训练,其学习率及β1、β2动量分别为0.001,0.9,0.999;采用分批次训练的模式对模型进行训练,数据批大小为64,共进行50轮的训练。对于网络中的随机丢弃层,为了在保留大部分训练信息的同时提高网络的抗过拟合能力,其随机丢弃概率被设定为0.2。
[0042]
本发明的优点和/或有益效果包括:
[0043]
(1)本发明提出了一种基于深度循环神经网络的电信号预测方法,该方法通过直接从数据层面挖掘深度特征,无需依赖具体的物理模型来描述飞行器电信号的退化过程。因此,这种算法具有出色的鲁棒性和普适性。传统的故障预测方法通常依赖于具体的物理模型,这要求我们对系统的退化机理有深入的理解。然而,在实际应用中,某些装备的退化过程可能非常复杂或者我们缺乏足够的先验知识来建立准确的物理模型。因此,基于物理模型的方法可能面临着局限性和困难。相比之下,本发明所提出的基于深度循环神经网络的方法通过利用深度学习技术,直接从电信号数据中学习到具有代表性的深度特征。这些深度特征能够捕捉到电信号中的潜在模式和规律,无需事先对系统的物理特性做出假设或建立复杂的物理模型。因此,该方法具有很好的鲁棒性,能够适应不同系统和不同工况下的故障预测需求。
[0044]
(2)根据本发明的长短期记忆网络的更新存在着优势:在传统的循环神经网络中,求偏导数的时候进行链式乘法,当其中一个输出元效果不佳时,对整个系统的权值都会有很大的影响。而在根据本发明的长短期记忆网络中,进行更新时采用的是加法运算,因此即使存在输出元效果不佳的情况,也不会对网络权值产生巨大的影响。这个由乘法到加法的
变换,很大程度上解决了循环神经网络中出现的梯度消失和梯度爆炸问题。且本发明采用了堆叠的长短期记忆网络结构,使网络能充分记忆前序信号的波形特征,并从中提取出更深层的特征,充分提升了电信号数据的应用效率,在保障预测实时更新能力的前提下,有效提升了算法的准确性。
[0045]
根据本发明的时间注意力机制,可以大幅提升时序信号预测模型的训练效能和可解释性。时间注意力机制能够为不同时间点的信息赋予不同的权重,使得模型能够专注于对当前时刻最有意义的信息进行处理。通过自适应地调整不同时间点的重要性,时间注意力机制能够在预测中更好地利用有限的资源和信息,提高模型的效率和性能。此外,时间注意力机制还具有解释性和可解释性的优势。通过可视化时间注意力权重的分布,我们能够深入了解模型在不同时间点上的关注程度和重要性,从而更好地理解故障发生的原因和机理。这种解释性有助于工程师和领域专家进行故障诊断和决策制定,提高故障管理的效果和效率。
[0046]
(3)针对飞行器电信号的预测问题,本发明的方法相对于传统故障预测方法表现出更优异的预测准确性与更广泛的不同类型设备故障预测能力,可应用于飞行器故障预测与检测系统当中的信息预测模型构建当中,具有重要的实际工程意义。

技术特征:
1.基于时空注意力机制的深度循环神经网络的电信号预测方法,所述深度循环神经网络包括:第一至第三长短期记忆层(103、106、108),第一至第三长短期记忆层各自分别对应的第一至第三时间注意力机制层(104、107、109),第一和第二随机丢弃层(105、110),用于为训练数据增添随机噪声,从而有效抑制过拟合现象,使深度循环神经网络更具有鲁棒性,第一至第三时间注意力层(104,107,109),其特征在于包括:当对飞行器电信号进行预测时(101),首先输入长度为t的信号(102)进入第一长短期记忆层(103);把第一长短期记忆层(103)的输出数据流输入第一时间注意力层(104)把第一时间注意力层(104)的输出数据送入第一随机丢弃层(105),把第一随机丢弃层(105)的输出数据流送入第二长短期记忆层(106),把第二长短期记忆层(106)的输出数据流输入第二时间注意力层(107),把第二时间注意力层(107)的输出数据流送入第三长短期记忆层(108),把第三长短期记忆层(108)的输出数据流输入第三时间注意力层(109),把第三时间注意力层(109)的输出数据流送入第二随机丢弃层(110),使第二随机丢弃层(110)的输出数据流通过全连接层(111),从而输出预测结果(112),其中:输入深度循环神经网络的信号(102)的数据流具有循环结构并包括了隐藏状态c,该隐藏状态c为细胞状态,第一至第三长短期记忆层各包括多个运算门,所述运算门包括遗忘门、输入门、输出门,第一至第三长短期记忆层中的每一个均包括多个循环神经元,每个循环神经元输入h
t-1
与c
t-1
,经过遗忘门、输入门、输出门的运算输出h
t
,每个循环神经元的输入数据为h
t-1
与c
t-1
,其中,其输入为h
t-1
与x
t
并传递用于对细胞状态进行遗忘的门为遗忘门,x
t
为输入状态,遗忘门决定了历史状态信息的遗忘程度,遗忘门的计算公式为:f
t
=σ(w
f
·
[h
t-1
,x
t
]+b
f
)
ꢀꢀꢀꢀꢀ
(1)其中w
f
和b
f
分别为遗忘门对应的权值参数与偏差参数,[h
t-1
,x
t
]运算表示将两个矩阵拼接为一个矩阵,σ()为激活函数,其输入为h
t-1
与x
t
并传递用于对细胞状态进行更新的门为输入门,输入门的计算公式为:i
t
=σ(w
i
·
[h
t-1
,x
t
]+b
i
)
ꢀꢀꢀꢀꢀꢀꢀ
(3)其中w
i
和b
i
分别为输入门对应的权值参数与偏差参数,[h
t-1
,x
t
]运算表示将两个矩阵拼接为一个矩阵,σ()为激活函数,针对h
t-1
与x
t
的新的输入信息由下式确定:
其中w
c
和b
c
分别为对应的权值参数与偏差参数,[h
t-1
,x
t
]运算表示将两个矩阵拼接为一个矩阵,从而,根据遗忘门、输入门和新的输入信息,新的细胞状态如下式进行更新:其输入为h
t-1
与x
t
并用于计算下一输出隐藏状态h
t
的运算门为输出门,输出门的计算公式为:o
t
=σ(w
o
·
[h
t-1
,x
t
]+b
o
)
ꢀꢀꢀꢀꢀꢀ
(6),其中w
o
和b
o
分别为输出门对应的权值参数与偏差参数,[h
t-1
,x
t
]运算表示将两个矩阵拼接为一个矩阵,σ()为激活函数,通过输出门和细胞状态,最终的输出h
t
由下式得到:h
t
=o
t
*tanh(c
t
)
ꢀꢀꢀꢀꢀꢀꢀ
(7),由此该循环神经元最终输出了隐藏态h
t
,并将h
t
与新的细胞状态c
t
传递到下一循环神经元当中,其中:第一至第三时间注意力层的每一个接收输入的一定时序范围n的隐藏态,计算各个输入的注意力概率分布值a1,a2,...a
n
,不同时间节点的概率分布值是经过归一化的:e
t
=tanh(w
t
h
t
+b
t
)
ꢀꢀꢀꢀꢀꢀꢀ
(10),由此确定出包含时序信号的特征向量v,作为随机丢弃层的输入,其中,e
t
是babdanau校验模型,e
t
表示第t时刻隐层状态向量h
t
所决定的注意力概率分布值,w
t
表示第t时刻的权重系数矩阵,b
t
表示第t时刻相应的偏移量。2.根据权利要求1所述的基于深度循环神经网络的电信号预测方法,其特征在于激活函数使用sigmoid函数,其表达式为:3.根据权利要求1或2所述的基于深度循环神经网络的电信号预测方法,其特征在于所述深度循环神经网络的训练算法流程包括:f1)采用滑动窗口方法划分数据集(202),包括划分为时间序列和预测值的样本形式,f2)对迭代步数进行初始化(203),f3)开始训练(204),f4)按批次输入划分好的数据集(205),f5)进行前向传播(206),
f6)计算网络损失函数(207)并反向更新网络参数(208),f7)判断是否遍历训练集(209),“否”则返回f4),“是”则将当前轮数加1(210)并返回f3)开始新一轮训练,直到训练轮次已到设定的轮数时(211),结束训练(212)。4.根据权利要求3所述的基于深度循环神经网络的电信号预测方法,其特征在于:网络损失函数设定为均方误差函数,最终的预测精度采用均方根误差来衡量。5.根据权利要求3所述的基于深度循环神经网络的电信号预测方法,其特征在于:采用adam优化器进行训练,其学习率及β1、β2动量分别为0.001,0.9,0.999。6.根据权利要求3所述的基于深度循环神经网络的电信号预测方法,其特征在于:采用分批次训练的模式对模型进行训练,数据批大小为64,共进行50轮的训练。7.根据权利要求3所述的基于深度循环神经网络的电信号预测方法,其特征在于:第一随机丢弃层(105)和第二随机丢弃层(110)的随机丢弃概率被设定为0.2。

技术总结
本发明涉及一种基于时间注意力机制的深度循环网络飞行器电信号预测方法。包含堆叠的长短期记忆网络模块,时间注意力机制模块,滑动窗口预测方法及信号预测模块。飞行器电信号进行预测时(101),首先将通过滑动窗口划分的信号输入网络(102),经由多个堆叠的长短期记忆层(103)充分提取数据特征,使用多个时间注意力机制层为长短期记忆层中的每个时间点特征赋予重要性权重(104),再结合随机丢弃技术(105)抑制过拟合现象,提升算法鲁棒性,最后由全连接层(111)对输出值进行预测,训练时通过反向传播更新网络参数(208),直到迭代步数满足判断模块条件(211),最终结束训练(212)。最终结束训练(212)。最终结束训练(212)。


技术研发人员:李可 王少凡 胡振宁 李鹏蛟 武昊鹏 阚艳 庞丽萍 杨顺昆
受保护的技术使用者:北京航空航天大学
技术研发日:2023.06.09
技术公布日:2023/9/12
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐