自适应的铝电解槽异常检测方法、装置、存储介质及设备

未命名 08-18 阅读:79 评论:0


1.本发明涉及人工智能检测技术领域,特别是涉及自适应的铝电解槽异常检测方法、装置、存储介质及设备。


背景技术:

2.长期以来,异常检测一直是工业系统中的热点问题。现如今学者们已经发表了大量的论文,提出了很多有效的理论和算法。在铝电解行业中正常情况下的样本数量远远大于异常情况下的样本数量,异常样本难以发现,本研究可以找出铝电解行业中的异常样本,帮助专家判断异常,使专家对异常有一个清晰的了解,能够做出适当决策减少损失。铝电解槽在工作过程中如果出现异常可能会导致电解槽的损坏和生产原料的浪费,会大大增加生产的成本。通过实施早期预防性维护,及早的发现异常可以提高设备的生产效率。


技术实现要素:

3.有鉴于此,本发明提供了一种自适应的铝电解槽异常检测方法、装置、存储介质及设备,提供了一套完整的方法,帮助工艺人员对铝电解过程中的参数进行正确调控,对于掌握槽况信息,减少设备损坏和原料浪费,提高出铝量具有十分重大的意义,从而更加适于实用。
4.为了达到上述第一个目的,本发明提供的自适应的铝电解槽异常检测方法的技术方案如下:
5.本发明提供的自适应的铝电解槽异常检测方法包括以下步骤:
6.获取多维时间序列铝电解槽的铝电解工业数据、安全水处理数据,以及,水分配数据各数据集,其中,所述铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的正常点、异常点均具有标记;
7.根据所述多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的显著特征,对所述铝电解工业数据、安全水处理数据,以及,水分配数据进行缺失值补全,得到完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集;
8.针对所述完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集进行降维处理,得到多个二维矩阵;
9.针对所述多个二维矩阵进行分类,得到分类结果,其中,若所述二维矩阵中包含异常样本数据,生成包含异常样本数据的样本被划分为异常样本,除所述异常样本之外的样本,则被划分为正常样本;
10.应用所述正常样本训练,得到自适应改变的对抗自编码器生成对抗网络模型,所述自适应改变的对抗自编码器生成对抗网络模型包括生成器和鉴别器;
11.向所述生成器输入待检测铝电解槽的铝电解工业数据、安全水处理数据,以及,水分配数据,经所述生成器后,生成待检测铝电解槽样本;
12.将所述待检测铝电解槽样本输入至所述鉴别器,得到所述待检测铝电解槽的检测结果,所述待检测铝电解槽的检测结果包括正常样本、异常样本中的一种结果。
13.本发明提供的自适应的铝电解槽异常检测方法还可采用以下技术措施进一步实现。
14.作为优选,根据所述铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的显著特征,对所述铝电解工业数据、安全水处理数据,以及,水分配数据进行缺失值补全,得到完整的铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的步骤过程中,补全铝电解工业数据、安全水处理数据,以及,水分配数据的方法为线性插值法。
15.作为优选,针对所述完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集进行降维处理,得到多个二维矩阵具体包括以下步骤:
16.计算所述二维矩阵每个参数的最大值max和最小值min;
17.令每个时间序列曲线的上限为0.9
·
max,每个时间序列曲线的下限为1.1
·
min,使得所述二维矩阵有值的数据点分布均匀,其中,每个时间序列曲线代表一个参数的取值。
18.作为优选,针对所述完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集进行降维处理,得到多个二维矩阵的步骤过程中,还需要针对所述完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据进行分段处理,得到多个子序列,其中,各子序列的分段标准通过设定步长为1的滑动窗口实现。
19.作为优选,应用所述正常样本训练,得到自适应改变的对抗自编码器生成对抗网络模型,所述自适应改变的对抗自编码器生成对抗网络模型包括生成器和鉴别器的步骤过程中,所述生成器的结构如下:
[0020][0021][0022][0023]
其中,
[0024]
den(x)-二维矩阵中有值点与总点数之比,
[0025]
dim(x)-二维矩阵的维度,
[0026]nv-有数值的数据点数,
[0027]ns-总数据点数,
[0028]
m1-自编码器组数量,最大值不能超过4,
[0029]
g-生成器,
[0030]
x-输入图像,其中,x∈rw×h×c,-自编码器组de重建的图像,
[0031]
e-子网编码器网络,
[0032]
de-自编码器组,
[0033]
en-译码器组,
[0034]
将缩小以得到的特征,
[0035]
z-x的潜在表示,
[0036]
向量的维度与z的维度相同。
[0037]
作为优选,所述子网编码器网络的自动编码方法包括瓶颈特征,并明确学习了通过参数来最小化距离。
[0038]
作为优选,应用所述正常样本训练,得到自适应改变的对抗自编码器生成对抗网络模型,所述自适应改变的对抗自编码器生成对抗网络模型包括生成器和鉴别器中,
[0039]
对抗损失的为:
[0040][0041]
上下文损失为:
[0042][0043]
编码器损失为:
[0044][0045]
生成器的目标函数为:
[0046]
l=w
adv
l
adv
+w
con
l
con
+w
enc
l
enc
[0047]
其中,
[0048]
x-输入样本,
[0049]
g-生成器,
[0050]-符合数据分布p
x
的输入x的二范数期望,
[0051]
f-中间层函数,
[0052]
ge(x)-瓶颈特征,
[0053]
e(g(x))-编码特征,
[0054]
l
adv-对抗损失,
[0055]
l
con-上下文损失,
[0056]
l
enc-编码器损失,
[0057]
l-生成器的目标函数,
[0058]wadv
为调整对抗损失对生成器的目标函数的权参数,
[0059]wcon
为调整上下文损失对生成器的目标函数的权参数,
[0060]wenc
为调整编码器损失对生成器的目标函数的权参数。
[0061]
作为优选,将所述待检测铝电解槽样本输入至所述鉴别器,得到所述待检测铝电解槽的检测结果,所述待检测铝电解槽的检测结果包括正常样本、异常样本中的一种结果的步骤过程中,
[0062]
所述待检测铝电解槽样本的异常分数为:
[0063][0064]
测试集中中单个测试样本的异常评分为
[0065][0066]
应用特征缩放将异常分数控制在[0,1]的范围内,则:
[0067][0068]-测试样本,
[0069]-待检测铝电解槽样本的异常分数,
[0070]-测试集,
[0071]
s-异常评分组,
[0072]si-测试集中中单个测试样本的异常评分,
[0073]-特征缩放后的异常评分,
[0074]
w1为调整上下文损失l
con
的权参数,
[0075]
w2为调整编码器损失l
enc
的权参数,
[0076]
min(s)为s中的最小值。
[0077]
max(s)为s中的最大值。
[0078]
为了达到上述第二个目的,本发明提供的自适应的铝电解槽异常检测装置的技术方案如下:
[0079]
本发明提供的自适应的铝电解槽异常检测装置包括:
[0080]
数据集获取模块,用于获取多维时间序列铝电解槽的铝电解工业数据、安全水处理数据,以及,水分配数据各数据集,其中,所述铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的正常点、异常点均具有标记;
[0081]
缺失值补全模块,用于根据所述多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的显著特征,对所述铝电解工业数据、安全水处理数据,以及,水分配数据进行缺失值补全,得到完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集;
[0082]
降维处理模块,用于针对所述完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集进行降维处理,得到多个二维矩阵;
[0083]
矩阵分类模块,用于针对所述多个二维矩阵进行分类,得到分类结果,其中,若所述二维矩阵中包含异常样本数据,生成包含异常样本数据的样本被划分为异常样本,除所述异常样本之外的样本,则被划分为正常样本;
[0084]
模型生成模块,用于应用所述正常样本训练,得到自适应改变的对抗自编码器生成对抗网络模型,所述自适应改变的对抗自编码器生成对抗网络模型包括生成器和鉴别器;
[0085]
待检测铝电解槽样本生成模块,用于向所述生成器输入待检测铝电解槽的铝电解工业数据、安全水处理数据,以及,水分配数据,经所述生成器后,生成待检测铝电解槽样本;
[0086]
检测模块,用于将所述待检测铝电解槽样本输入至所述鉴别器,得到所述待检测铝电解槽的检测结果,所述待检测铝电解槽的检测结果包括正常样本、异常样本中的一种结果。
[0087]
为了达到上述第三个目的,本发明提供的计算机可读存储介质的技术方案如下:
[0088]
本发明提供的计算机可读存储介质上存储有自适应的铝电解槽异常检测程序,所
述自适应的铝电解槽异常检测程序在被处理器执行时,实现本发明提供的自适应的铝电解槽异常检测方法的步骤。
[0089]
为了达到上述第四个目的,本发明提供的电子设备的技术方案如下:
[0090]
本发明提供的电子设备包括存储器和处理器,所述存储器上存储有自适应的铝电解槽异常检测程序,所述自适应的铝电解槽异常检测程序在被处理器执行时,实现本发明提供的自适应的铝电解槽异常检测方法的步骤。
附图说明
[0091]
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0092]
图1为本发明实施例提供的自适应的铝电解槽异常检测方法的步骤流程图;
[0093]
图2为本发明实施例提供的自适应的铝电解槽异常检测方法涉及的多个子序列的示意图;
[0094]
图3为本发明实施例提供的自适应的铝电解槽异常检测方法涉及的样本分配示意图;
[0095]
图4为本发明实施例提供的自适应的铝电解槽异常检测装置各功能模块之间的信号流向关系示意图;
[0096]
图5为本发明实施例提供的硬件运行环境的自适应的铝电解槽异常检测设备结构示意图。
具体实施方式
[0097]
本发明为解决现有技术存在的问题,提供一种自适应的铝电解槽异常检测方法、装置、存储介质及设备,提供了一套完整的方法,帮助工艺人员对铝电解过程中的参数进行正确调控,对于掌握槽况信息,减少设备损坏和原料浪费,提高出铝量具有十分重大的意义,从而更加适于实用。
[0098]
发明人经过长期艰苦卓绝的努力,发现,现有技术中的异常检测方法包括:
[0099]
1、基于深度学习的智能故障诊断模型
[0100]
随着各种工业生产系统中产生的时间序列数据的规模越来越大,深度学习中使用的许多异常检测技术已经被广泛的应用。它们是无目的的,这意味着它们不清楚最终的输出特征是什么。这些采用黑匣子模式的方法为特定数据集提取特定的特征样式,例如长期短期记忆网络(lstm),递归神经网络(rnn),卷积神经网络(cnn)和自动编码器。尽管上述深度学习模型已经获得了比较不错的异常检测性能,但是当模型遇到样本不平衡的情况时,它们的性能就会大打折扣。此外,由于工业数据的表示形式多种多样(如时间序列或图像),现有的很多深度学习模型在图像领域表现很好,而它们在工业领域的表现不能让人满意。
[0101]
2、基于类不平衡问题的模型
[0102]
基于类不平衡的时间序列异常检测问题,通常考虑两种关键的方向:数据方法和算法方法。数据级方法利用抽样策略来改变不平衡数据的分布,其中欠采样方法和过采样方法已被广泛使用。算法级方法用于加强分类器以适应不平衡数据,其中通常采用捕获和
增强集成的方法。更具体地说,现如今已经提出了简易合成(easyensemble)和平衡级联算法来解决类不平衡问题。合成少数过采样技术(the synthetic minority oversampling technique,smote)是一种可以添加新的少数类别的样本的合成技术。为了克服二元和多元类不平衡问题,基于smote的数据扩充策略和easyensemble算法提出了一种easy-smt集成算法。
[0103]
3、基于gan的模型
[0104]
最近,生成对抗模型,尤其是gan在类不平衡的图像异常检测领域越来越流行。gan由goodfellow等人最初提出,并被视为一种无监督的机器学习算法,在图像识别和图像生成领域取得了出色的成果。基于gan出现了各种对抗算法。
[0105]
在工业领域,lim等人提出了一种新的基于gan的异常检测方法,将gan与lstm-rnn结合使用,以检测网络物理系统的网络攻击,并且提出了一种基于gan的数据增强技术,其作用是提高模型异常检测的性能。此外,akcay等人提出了一种称为ganomaly的通用异常检测架构。在中,在多个基准图像数据集上与之前的先进方法相比,其结果展示出了这个模型的优越性和有效性,这促使我们在铝电解领域采用该技术进行异常检测。以下是ganomaly的简要介绍:samet等人在生成器网络中使用编码器-解码器-编码器子网来训练一个半监督网络。这种架构使用了深度卷积生成对抗网络(dcgan),并在生成器中采用了三种损失函数来捕获输入图像和潜在空间中的区别性特征。该算法的主要特点之一是它在训练过程中不需要异常样本,并且在某些基准图像数据集中达到了最高的异常检测性能。
[0106]
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的自适应的铝电解槽异常检测方法、装置、存储介质及设备,其具体实施方式、结构、特征及其功效,详细说明如后。在下述说明中,不同的“一实施例”或“实施例”指的不一定是同一实施例。此外,一或多个实施例中的特征、结构、或特点可由任何合适形式组合。
[0107]
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,具体的理解为:可以同时包含有a与b,可以单独存在a,也可以单独存在b,能够具备上述三种任一种情况。
[0108]
自适应的铝电解槽异常检测方法
[0109]
参见附图1,本发明实施例提供的自适应的铝电解槽异常检测方法包括以下步骤:
[0110]
步骤s1:获取多维时间序列铝电解槽的铝电解工业数据、安全水处理数据,以及,水分配数据各数据集,其中,铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的正常点、异常点均具有标记;
[0111]
步骤s2:根据多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的显著特征,对铝电解工业数据、安全水处理数据,以及,水分配数据进行缺失值补全,得到完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集;
[0112]
步骤s3:针对完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集进行降维处理,得到多个二维矩阵;
[0113]
步骤s4:针对多个二维矩阵进行分类,得到分类结果,其中,若二维矩阵中包含异常样本数据,生成包含异常样本数据的样本被划分为异常样本,除异常样本之外的样本,则
被划分为正常样本;
[0114]
步骤s5:应用正常样本训练,得到自适应改变的对抗自编码器生成对抗网络模型,自适应改变的对抗自编码器生成对抗网络模型包括生成器和鉴别器;
[0115]
步骤s6:向生成器输入待检测铝电解槽的铝电解工业数据、安全水处理数据,以及,水分配数据,经生成器后,生成待检测铝电解槽样本;
[0116]
步骤s7:将待检测铝电解槽样本输入至鉴别器,得到待检测铝电解槽的检测结果,待检测铝电解槽的检测结果包括正常样本、异常样本中的一种结果。
[0117]
其中,根据铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的显著特征,对铝电解工业数据、安全水处理数据,以及,水分配数据进行缺失值补全,得到完整的铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的步骤过程中,补全铝电解工业数据、安全水处理数据,以及,水分配数据的方法为线性插值法。
[0118]
其中,针对完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集进行降维处理,得到多个二维矩阵具体包括以下步骤:
[0119]
计算二维矩阵每个参数的最大值max和最小值min;
[0120]
令每个时间序列曲线的上限为0.9
·
max,每个时间序列曲线的下限为1.1
·
min,使得二维矩阵有值的数据点分布均匀,其中,每个时间序列曲线代表一个参数的取值。
[0121]
其中,针对完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集进行降维处理,得到多个二维矩阵的步骤过程中,还需要针对完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据进行分段处理,得到多个子序列,其中,各子序列的分段标准通过设定步长为1的滑动窗口实现。
[0122]
其中,应用正常样本训练,得到自适应改变的对抗自编码器生成对抗网络模型,自适应改变的对抗自编码器生成对抗网络模型包括生成器和鉴别器的步骤过程中,生成器的结构如下:
[0123][0124][0125][0126]
其中,
[0127]
den(x)-二维矩阵中有值点与总点数之比,
[0128]
dim(x)-二维矩阵的维度,
[0129]nv-有数值的数据点数,
[0130]ns-总数据点数,
[0131]
m1-自编码器组数量,最大值不能超过4,
[0132]
g-生成器,
[0133]
x-输入图像,其中,x∈rw×h×c,-自编码器组de重建的图像,
[0134]
e-子网编码器网络,
[0135]
de-自编码器组,
[0136]
en-译码器组,
[0137]
将缩小以得到的特征,
[0138]
z-x的潜在表示,
[0139]
向量的维度与z的维度相同。
[0140]
其中,子网编码器网络的自动编码方法包括瓶颈特征,并明确学习了通过参数来最小化距离。
[0141]
其中,应用正常样本训练,得到自适应改变的对抗自编码器生成对抗网络模型,自适应改变的对抗自编码器生成对抗网络模型包括生成器和鉴别器中,
[0142]
对抗损失的为:
[0143][0144]
上下文损失为:
[0145][0146]
编码器损失为:
[0147][0148]
生成器的目标函数为:
[0149]
l=w
adv
l
adv
+w
con
l
con
+w
enc
l
enc
[0150]
其中,
[0151]
x-输入样本,
[0152]
g-生成器,
[0153]-符合数据分布p
x
的输入x的二范数期望,
[0154]
f-中间层函数,
[0155]
ge(x)-瓶颈特征,
[0156]
e(g(x))-编码特征,
[0157]
l
adv-对抗损失,
[0158]
l
con-上下文损失,
[0159]
l
enc-编码器损失,
[0160]
l-生成器的目标函数,
[0161]wadv
为调整对抗损失对生成器的目标函数的权参数,
[0162]wcon
为调整上下文损失对生成器的目标函数的权参数,
[0163]wenc
为调整编码器损失对生成器的目标函数的权参数。
[0164]
其中,将待检测铝电解槽样本输入至鉴别器,得到待检测铝电解槽的检测结果,待检测铝电解槽的检测结果包括正常样本、异常样本中的一种结果的步骤过程中,
[0165]
待检测铝电解槽样本的异常分数为:
[0166][0167]
测试集中中单个测试样本的异常评分为
[0168]
[0169]
应用特征缩放将异常分数控制在[0,1]的范围内,则:
[0170][0171]-测试样本,
[0172]-待检测铝电解槽样本的异常分数,
[0173]-测试集,
[0174]
s-异常评分组,
[0175]si-测试集中中单个测试样本的异常评分,
[0176]-特征缩放后的异常评分,
[0177]
w1为调整上下文损失l
con
的权参数,
[0178]
w2为调整编码器损失l
enc
的权参数,
[0179]
min(s)为s中的最小值。
[0180]
max(s)为s中的最大值。
[0181]
自适应的铝电解槽异常检测装置
[0182]
参见附图2,本发明实施例提供的自适应的铝电解槽异常检测装置包括:
[0183]
数据集获取模块,用于获取多维时间序列铝电解槽的铝电解工业数据、安全水处理数据,以及,水分配数据各数据集,其中,铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的正常点、异常点均具有标记;
[0184]
缺失值补全模块,用于根据多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的显著特征,对铝电解工业数据、安全水处理数据,以及,水分配数据进行缺失值补全,得到完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集;
[0185]
降维处理模块,用于针对完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集进行降维处理,得到多个二维矩阵;
[0186]
矩阵分类模块,用于针对多个二维矩阵进行分类,得到分类结果,其中,若二维矩阵中包含异常样本数据,生成包含异常样本数据的样本被划分为异常样本,除异常样本之外的样本,则被划分为正常样本;
[0187]
模型生成模块,用于应用正常样本训练,得到自适应改变的对抗自编码器生成对抗网络模型,自适应改变的对抗自编码器生成对抗网络模型包括生成器和鉴别器;
[0188]
待检测铝电解槽样本生成模块,用于向生成器输入待检测铝电解槽的铝电解工业数据、安全水处理数据,以及,水分配数据,经生成器后,生成待检测铝电解槽样本;
[0189]
检测模块,用于将待检测铝电解槽样本输入至鉴别器,得到待检测铝电解槽的检测结果,待检测铝电解槽的检测结果包括正常样本、异常样本中的一种结果。
[0190]
计算机可读存储介质
[0191]
本发明提供的计算机可读存储介质上存储有自适应的铝电解槽异常检测程序,自适应的铝电解槽异常检测程序在被处理器执行时,实现本发明提供的自适应的铝电解槽异常检测方法的步骤。
[0192]
电子设备
[0193]
本发明提供的电子设备包括存储器和处理器,存储器上存储有自适应的铝电解槽异常检测程序,自适应的铝电解槽异常检测程序在被处理器执行时,实现本发明提供的自适应的铝电解槽异常检测方法的步骤。
[0194]
参照图5,图5为本发明实施例方案涉及的硬件运行环境的自适应的铝电解槽异常检测设备结构示意图。
[0195]
如图5所示,该自适应的铝电解槽异常检测设备可以包括:处理器1001,例如中央处理器(central processing unit,cpu),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(wireless-fidelity,wi-fi)接口)。存储器1005可以是高速的随机存取存储器(random access memory,ram)存储器,也可以是稳定的非易失性存储器(non-volatile memory,nvm),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
[0196]
本领域技术人员可以理解,图5中示出的结构并不构成对自适应的铝电解槽异常检测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0197]
如图5所示,作为一种存储介质的存储器1005中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及自适应的铝电解槽异常检测程序。
[0198]
在图5所示的自适应的铝电解槽异常检测设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明自适应的铝电解槽异常检测设备中的处理器1001、存储器1005可以设置在自适应的铝电解槽异常检测设备中,自适应的铝电解槽异常检测设备通过处理器1001调用存储器1005中存储的自适应的铝电解槽异常检测程序,并执行本发明实施例提供的自适应的铝电解槽异常检测方法。
[0199]
实施例
[0200]
1、数据集介绍
[0201]
在实验中使用了三个时间序列数据集。它们分别是铝电解工业数据、swat和wadi,用于评估本论文中时间序列异常检测模型的性能。在这些数据集中,异常点和正常点都需要被标记出来。各个数据集的介绍如下:
[0202]
swat:安全水处理(swat)系统是用于水处理的操作试验平台,代表了在大城市中的大型现代化水处理厂的小规模版本。测试平台的总体设计与新加坡的公共事业委员会(全国性的水务公司)进行了协调,以确保总体物理过程和控制系统与现场的真实系统的相似性。swat数据集收集过程持续了11天,系统每天24小时运行。在2016swat数据收集过程的最后四天内,总共发起了36次攻击。通常,被攻击点包括传感器(例如,水位传感器,流速计数器等)和制动器(例如,阀,泵等)。在最后四天内,这些攻击以不同的意图和不同的持续时间(从几分钟到一个小时不等)在测试平台上发起。在再次发起攻击之前或连续发起攻击之前,允许系统达到其正常操作状态。有关swat数据集的更多详细信息,请访问swat网站。
[0203]
swat中的净水过程由六个子过程组成,称为p1至p6。第一个过程是关于原水的供应和存储,p2是用于评估水质的预处理。在p3中通过超滤装置(uf)反冲洗将不想要的材料去除。剩余的氯在脱氯过程(p4)中被破坏。随后,将来自p4的水泵入反渗透(ro)系统(p5)中
以减少无机杂质。最后,p6储存准备分配的水。
[0204]
wadi:与通常在固定位置的水处理系统工厂不同,供水系统由横跨大片地区的无数管道组成。这极大地增加了对供水网络进行物理攻击的风险。水分配(wadi)测试平台是swat系统的扩展,通过吸收一部分swat反渗透渗透液和原水来形成一个完整而现实的水处理,存储和分配的网络。供水系统共有三个控制过程,第一个过程是从swat,公共事业局(pub)入口或wadi的回水中获取原水,并将原水存储在两个水箱中。p2根据预设的需求模式分配来自两个高架水箱和六个消费者水箱的水。水被回收并在第三步送回p1。
[0205]
wadi试验平台同样配备了化学定量给料系统,增压泵,阀门,仪器和分析仪。除了通过网络模拟在plc上进行的攻击和防御之外,wadi还具有模拟物理攻击(例如漏水和恶意化学注入)效果的功能。wadi的数据采集过程包括16天的连续操作,其中14天的数据是在正常运行情况下收集的,而2天是在发生攻击情况下进行的。在数据收集期间,收集了所有网络流量,传感器和执行器数据。有关wadi数据集的更多详细信息,请访问wadi网站。
[0206]
铝电解数据:本文中的铝电解数据来自中国某铝厂,某铝厂“数据服务平台”建设项目一期于2017年12月开始建设,截止2019年1月已完成了3个板块5家生产企业的数据采集:电解铝板块、氧化铝板块、炭素板块,生产过程数据中心建设,包括各企业数采硬件、总部服务器、数据中心机房、可视化及视频会议系统。
[0207]
随着铝电解上下游产品的能耗和原材物料消耗大幅度上升,技术指标恶化,产品质量也有所下降;综合能耗和工艺能耗增加幅度较大。各生产部门非常关注氧化铝、电解铝、碳素等板块的可控生产数据指标。
[0208]
为保证氧化铝、电解铝、碳素各板块关键指标模型的执行效果,应动态监控各项经营指标的达成情况,确保生产过程控制结果体现在经营绩效上。其中收集的数据总数为28万个,所涉及的参数有203个,具体情况如表1所示:
[0209]
表1实验所涉及的数据集介绍
[0210][0211]
由于铝电解槽的数据变化多样,专家很难评定数据样本的状态,为了方便铝电解的专家打标签,在铝电解领域提出了一个样本自动标注方法,用于辅助专家标记样本。标注系统需要专家提供以下参数:标注参数、标注参数的连续样本数和前推异常趋势样本数。其中标注参数用于标注样本,需要给出所有标注参数的正常范围,将样本分为正常,趋势异常,和异常三种状态。标注参数的连续样本数n用于标注异常样本,将n个连续样本取平均值,与标注参数的正常范围做对比,超出范围则判断为异常;前推异常趋势样本数m用于标注趋势异常,将异常样本前推m天,这m天就是异常趋势样本。网络模型主要是学习那些专家分辨不出来的异常趋势样本,异常趋势样本和异常样本统称为异常样本。
[0212]
2、数据预处理
[0213]
在数据预处理中,为了最大程度地提高self-adaptionaae-gan的精准度,人为的根据先前的经验挑选显著特征,并且利用线性差值的方法将多维时间序列中的缺失值补
全,保证数据的完整性与有效性。然后,为了利用生成对抗网络(gans)学习复杂的高维图像分布的能力,将降维后的多维时间序列数据转换成二维矩阵,由于铝电解的参数很多,为了使每个二维矩阵有值的数据点分布均匀,计算每个参数的最大值max和最小值min,使每个时间序列曲线的上下限都等于0.9
·
max和1.1
·
min,每条曲线代表一个参数的取值。
[0214]
此外,在某些工业生产如铝电解工业中,通常无法通过一天当中各种传感器的值判断铝电解槽有没有出现异常,需要获取多个时间步长中各个参数的值来判断是否有异常出现,如果某个电解槽当天的分子比、氧化铝浓度值偏大或者偏小,并不能判断这一天的电解槽出现了异常。并且,在铝电解工业有严重的滞后性问题,如专家在某天调整了一个电解槽的温度,然而专家并不知道这样做是否正确,必须在之后的一段时间里观察各个参数的状态才能判断,并且,在这之中通常存在很多专家无法分辨的状态。因此将数据进行分段处理,通过大小为10步长为1的滑动窗口将多元时间序列分为多个子序列,用于训练阶段和测试阶段。最后的结果如图2所示。
[0215]
有关窗口长度的实验如表2所示:
[0216]
表2窗口长度对模型性能的影响
[0217][0218]
如表2所示,当窗口长度取10的时候模型性能最好,所以本文窗口长度取10。
[0219]
如果某个二维矩阵中包含异常样本数据,那么就把这个矩阵划分为异常样本,其他的矩阵都划分为正常样本,将生成的二维矩阵样本分为两部分。由于的模型在模型训练阶段只学习正常数据的分布,因此第一部分数据中不包含任何异常样本。第二部分中的数据包含正常和异常样本,用于模型测试。样本数据的分配示意图如图3所示:
[0220]
3、异常检测
[0221]
本文提出了一种基于输入样本自适应改变的对抗自编码器生成对抗网络(self-adaptionaae-gan)的时间序列异常检测方法。该方法有两个阶段,一个是模型训练阶段,另一个是异常检测阶段。在训练阶段,的模型只学习正常时间序列数据的分布,在测试阶段,根据模型输出的异常分数a(x)来判断样本是否为异常样本,异常分数越高样本为异常的可能性就越高。
[0222]
整个网络由一个生成器和一个鉴别器组成,而生成器由一组自编码器构成。
[0223]
生成器网络中的由一个编码器和多个自编码器组组成,一组自编码器由一个编码器和一个译码器组成,构成模型的生成器,其结构如下所示:
[0224][0225][0226][0227]
其中,
[0228]
den(x)-二维矩阵中有值点与总点数之比,
[0229]
dim(x)-二维矩阵的维度,
[0230]nv-有数值的数据点数,
[0231]ns-总数据点数,
[0232]
m1-自编码器组数量,最大值不能超过4,
[0233]
g-生成器,
[0234]
x-输入图像,其中,x∈rw×h×c,-自编码器组de重建的图像,
[0235]
e-子网编码器网络,
[0236]
de-自编码器组,
[0237]
en-译码器组,
[0238]
将缩小以得到的特征,
[0239]z–
x的潜在表示,
[0240]
向量的维度与z的维度相同。
[0241]
m1的最大值不能超过阈值з=4,超过4以后模型的训练时间会大大的增加,并且模型的精度没有明显的上升,模型由三个子网络组成。
[0242]
第一个子网是自编码器组,生成器学习输入的图像数据,并分别通过使用编码器和解码器网络来重建输入图像。自编码器组由若干个编码器和解码器组成,子网的形式原则如下:生成器g读取输入图像x,其中x∈rw×h×c,并将其转发到其编码器网络ge。通过分别使用卷积层,batch-norm和leaky relu()激活,ge将x压缩为向量z从而缩小x的大小,其中z∈rd。
[0243]
第二个子网是编码器网络e,它压缩由自编码器组de重建的图像通过不同的参数化,它具有与ge相同的体系结构细节。e将缩小以得到其特征表示为了方便比较,向量的维度与z的维度相同。该子网是所提出方法的独特部分之一。与现有的基于自动编码器的方法不同,在该方法中,通过bottleneck features实现了潜在矢量的最小化,该子网e明确学习了通过参数化来最小化距离。此外,在测试阶段,通过这种最小化来执行异常检测。
[0244]
第三子网是鉴别器网络d,其目的是区分输入x和输出分别将它们标记为真实样本或伪造样本。该子网是dcgan中引入的标准鉴别器网络。
[0245]
self-adaptionaae-gan模型异常检测的原理如下:在模型的训练阶段,只使用正常样本进行参数优化,在异常检测阶段,将异常样本x输入到生成器网络g中,由于在训练过程中没有异常样本的参与,ge无法很好的将输入x映射到潜在表示z,gd同样也无法将异常样本很好的重构,其根本原因是因为ge和gd中的参数不适用于处理异常样本的重构。自编码器组de的输出结果同样的导致编码器网络e错误的映射到异常特征表示这就使z和之间的差异加大。当这种差异很明显的时候,模型就会把该样本x视作异常样本。为了使异常样本的重构差异更加显著,本文通过自编码器组对样本进行编码-译码操作,使异常样本的重构差异被明显放大。为了验证这一假设,通过组合三个损失函数来制定目标函数,每个损失函数对网络架构的优化都起到重要的作用。
[0246]
对抗损失:为了减少gan在训练过程中的不稳定性,采用了特征匹配损失。的对抗损失l
adv
定义为:
[0247][0248]
上下文损失:在有了对抗损失l
adv
之后,可以对鉴别器d进行充分的训练,但是生成器g无法根据输入样本进行参数的优化。参考了isola等人[18]提出的方法,通过输入样本和生成样本之间的l1距离来训练生成器g,使用上下文损失l
con
,通过测量原始x与生成的图像之间的l1距离来训练g,其中取的是编码器组中最后一个解码器的输出结果,l
con
定义为:
[0249][0250]
编码器损失:上面介绍的两个损失可以迫使生成器生成不仅逼真,而且上下文合理的图像。此外,采用了额外的编码器损失函数l
enc
来最小化输入的瓶颈特征(z=ge(x))和生成的图像的编码特征之间的距离,其中是生成器网络最后输出的结果。l
enc
的正式定义为:
[0251][0252]
生成器的目标函数l如下:
[0253]
l=w
adv
l
adv
+w
con
l
con
+w
enc
l
enc
[0254]
其中,
[0255]
x-输入样本,
[0256]
g-生成器,
[0257]-符合数据分布p
x
的输入x的二范数期望,
[0258]
f-中间层函数,
[0259]
ge(x)-瓶颈特征,
[0260]
e(g(x))-编码特征,
[0261]
l
adv-对抗损失,
[0262]
l
con-上下文损失,
[0263]
l
enc-编码器损失,
[0264]
l-生成器的目标函数,
[0265]wadv
为调整对抗损失对生成器的目标函数的权参数,
[0266]wcon
为调整上下文损失对生成器的目标函数的权参数,
[0267]wenc
为调整编码器损失对生成器的目标函数的权参数。
[0268]
在测试阶段,模型使用等式中给出的l
con
和l
enc
的加权平均对给定图像的异常进行评分。因此,对于测试样本的异常分数或定义为:
[0269][0270]
为了评估整体异常检测性能,计算了测试集中中单个测试样本的异常评分,从而为提供了一组异常评分然后,应用特征缩放将异常分数控制在[0,1]的范围内:
[0271]
其中:
[0272][0273]-测试样本,
[0274][0274]-待检测铝电解槽样本的异常分数,
[0275]-测试集,
[0276]
s-异常评分组,
[0277]si-测试集中中单个测试样本的异常评分,
[0278]-特征缩放后的异常评分,
[0279]
w1为调整上下文损失l
con
的权参数,
[0280]
w2为调整编码器损失l
enc
的权参数,
[0281]
min(s)为s中的最小值。
[0282]
max(s)为s中的最大值。
[0283]
如表3所示,在铝电解领域,的模型性能高于现存的基于样本重建思想的时间序列异常检测方法。
[0284]
本研究为工艺人员判断异常参数提供了一套完整的方法,帮助工艺人员对铝电解过程中的参数进行正确调控,对于掌握槽况信息,减少设备损坏和原料浪费,提高出铝量具有十分重大的意义。
[0285]
表3基于样本重构误差模型的结果比较
[0286][0287][0288]
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0289]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

技术特征:
1.一种自适应的铝电解槽异常检测方法,其特征在于,包括以下步骤:获取多维时间序列铝电解槽的铝电解工业数据、安全水处理数据,以及,水分配数据各数据集,其中,所述铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的正常点、异常点均具有标记;根据所述多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的显著特征,对所述铝电解工业数据、安全水处理数据,以及,水分配数据进行缺失值补全,得到完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集;针对所述完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集进行降维处理,得到多个二维矩阵;针对所述多个二维矩阵进行分类,得到分类结果,其中,若所述二维矩阵中包含异常样本数据,生成包含异常样本数据的样本被划分为异常样本,除所述异常样本之外的样本,则被划分为正常样本;应用所述正常样本训练,得到自适应改变的对抗自编码器生成对抗网络模型,所述自适应改变的对抗自编码器生成对抗网络模型包括生成器和鉴别器;向所述生成器输入待检测铝电解槽的铝电解工业数据、安全水处理数据,以及,水分配数据,经所述生成器后,生成待检测铝电解槽样本;将所述待检测铝电解槽样本输入至所述鉴别器,得到所述待检测铝电解槽的检测结果,所述待检测铝电解槽的检测结果包括正常样本、异常样本中的一种结果。2.根据权利要求1所述的自适应的铝电解槽异常检测方法,其特征在于,根据所述铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的显著特征,对所述铝电解工业数据、安全水处理数据,以及,水分配数据进行缺失值补全,得到完整的铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的步骤过程中,补全铝电解工业数据、安全水处理数据,以及,水分配数据的方法为线性插值法。3.根据权利要求1所述的自适应的铝电解槽异常检测方法,其特征在于,针对所述完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集进行降维处理,得到多个二维矩阵具体包括以下步骤:计算所述二维矩阵每个参数的最大值max和最小值min;令每个时间序列曲线的上限为0.9
·
max,每个时间序列曲线的下限为1.1
·
min,使得所述二维矩阵有值的数据点分布均匀,其中,每个时间序列曲线代表一个参数的取值。4.根据权利要求1所述的自适应的铝电解槽异常检测方法,其特征在于,针对所述完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集进行降维处理,得到多个二维矩阵的步骤过程中,还需要针对所述完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据进行分段处理,得到多个子序列,其中,各子序列的分段标准通过设定步长为1的滑动窗口实现。5.根据权利要求1所述的自适应的铝电解槽异常检测方法,其特征在于,应用所述正常样本训练,得到自适应改变的对抗自编码器生成对抗网络模型,所述自适应改变的对抗自编码器生成对抗网络模型包括生成器和鉴别器的步骤过程中,所述生成器的结构如下:
其中,den(x)-二维矩阵中有值点与总点数之比,dim(x)-二维矩阵的维度,n
v-有数值的数据点数,n
s-总数据点数,m1-自编码器组数量,最大值不能超过4,g-生成器,x-输入图像,其中,x∈r
w
×
h
×
c
,自编码器组de重建的图像,e-子网编码器网络,de-自编码器组,en-译码器组,将缩小以得到的特征,z-x的潜在表示,向量的维度与z的维度相同。6.根据权利要求5所述的自适应的铝电解槽异常检测方法,其特征在于,所述子网编码器网络的自动编码方法包括瓶颈特征,并明确学习了通过参数来最小化距离。7.根据权利要求1所述的自适应的铝电解槽异常检测方法,其特征在于,应用所述正常样本训练,得到自适应改变的对抗自编码器生成对抗网络模型,所述自适应改变的对抗自编码器生成对抗网络模型包括生成器和鉴别器中,对抗损失的为:上下文损失为:编码器损失为:生成器的目标函数为:l=w
adv
l
adv
+w
con
l
con
+w
enc
l
enc
其中,x-输入样本,g-生成器,符合数据分布p
x
的输入x的二范数期望,f-中间层函数,g
e
(x)-瓶颈特征,
e(g(x))-编码特征,l
adv-对抗损失,l
con-上下文损失,l
enc-编码器损失,l-生成器的目标函数,w
adv
为调整对抗损失对生成器的目标函数的权参数,w
con
为调整上下文损失对生成器的目标函数的权参数,w
enc
为调整编码器损失对生成器的目标函数的权参数。8.根据权利要求1所述的自适应的铝电解槽异常检测方法,其特征在于,将所述待检测铝电解槽样本输入至所述鉴别器,得到所述待检测铝电解槽的检测结果,所述待检测铝电解槽的检测结果包括正常样本、异常样本中的一种结果的步骤过程中,所述待检测铝电解槽样本的异常分数为:测试集中中单个测试样本的异常评分为应用特征缩放将异常分数控制在[0,1]的范围内,则:应用特征缩放将异常分数控制在[0,1]的范围内,则:-测试样本,-待检测铝电解槽样本的异常分数,-测试集,s-异常评分组,s
i-测试集中中单个测试样本的异常评分,-特征缩放后的异常评分,w1为调整上下文损失l
con
的权参数,w2为调整编码器损失l
enc
的权参数,min(s)为s中的最小值。max(s)为s中的最大值。9.一种自适应的铝电解槽异常检测装置,其特征在于,包括:数据集获取模块,用于获取多维时间序列铝电解槽的铝电解工业数据、安全水处理数据,以及,水分配数据各数据集,其中,所述铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的正常点、异常点均具有标记;缺失值补全模块,用于根据所述多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集的显著特征,对所述铝电解工业数据、安全水处理数据,以及,水分配数据进行缺失值补全,得到完整的多维时间序列铝电解工业数据、安全水处理数据,以及,水分配数据各数据集;降维处理模块,用于针对所述完整的多维时间序列铝电解工业数据、安全水处理数据,
以及,水分配数据各数据集进行降维处理,得到多个二维矩阵;矩阵分类模块,用于针对所述多个二维矩阵进行分类,得到分类结果,其中,若所述二维矩阵中包含异常样本数据,生成包含异常样本数据的样本被划分为异常样本,除所述异常样本之外的样本,则被划分为正常样本;模型生成模块,用于应用所述正常样本训练,得到自适应改变的对抗自编码器生成对抗网络模型,所述自适应改变的对抗自编码器生成对抗网络模型包括生成器和鉴别器;待检测铝电解槽样本生成模块,用于向所述生成器输入待检测铝电解槽的铝电解工业数据、安全水处理数据,以及,水分配数据,经所述生成器后,生成待检测铝电解槽样本;检测模块,用于将所述待检测铝电解槽样本输入至所述鉴别器,得到所述待检测铝电解槽的检测结果,所述待检测铝电解槽的检测结果包括正常样本、异常样本中的一种结果。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有自适应的铝电解槽异常检测程序,所述自适应的铝电解槽异常检测程序在被处理器执行时,实现权利要求1-8中任一所述的自适应的铝电解槽异常检测方法的步骤。11.一种电子设备,其特征在于,包括存储器和处理器,所述存储器上存储有自适应的铝电解槽异常检测程序,所述自适应的铝电解槽异常检测程序在被处理器执行时,实现权利要求1-8中任一所述的自适应的铝电解槽异常检测方法的步骤。

技术总结
本发明公开了一种自适应的铝电解槽异常检测方法、装置、存储介质及设备,其该方法包括:获取多维时间序列铝电解槽的各数据集;根据各数据集的显著特征,进行数据缺失值补全,得到完整的多维时间序列各数据集;针对完整的多维时间序列各数据集进行降维处理,得到多个二维矩阵;针对多个二维矩阵进行分类,得到分类结果;应用正常样本训练,得到自适应改变的对抗自编码器生成对抗网络模型,包括生成器和鉴别器;向生成器输入待检测铝电解槽的数据,生成待检测铝电解槽样本;经过鉴别器,得到待检测铝电解槽的检测结果。该装置、存储介质及设备能够用于实现该方法。其对于掌握槽况信息,减少设备损坏和原料浪费,提高出铝量具有十分重大的意义。十分重大的意义。十分重大的意义。


技术研发人员:曹丹阳 刘迪 高磊 任旭
受保护的技术使用者:北方工业大学
技术研发日:2023.05.06
技术公布日:2023/8/16
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐