针对工业时序数据的异常检测以及根因分析方法及系统

未命名 08-22 阅读:411 评论:0


1.本发明属于工业多维时序数据异常检测技术领域,尤其涉及一种针对工业时序数据的异常检测以及根因分析方法、系统及终端。


背景技术:

2.近年来,随着工业互联网的快速发展,现代化工业制造系统通过传感器、控制器、智能仪表等监测设备,实现了对生产运行状态、环境和过程的感知和记录,积累了大量的工业数据。工业互联网旨在实现更敏锐、更高效的工业制造系统的自动化控制和资源分配,同时提高智能工厂的能源效率。但是由于工业设备存在产品质量缺陷、设备故障、性能下降、外部环境变化等异常问题,如果工业生产中的设备异常情况不能及时地被有效识别,将导致生产环境存在隐性安全隐患,很可能给整个生产线带来连带的损失。因此工业设备异常检测成为智能制造的重要的具体任务,也是工业大数据分析中的重要研究问题。
3.随着机器学习技术的发展和成熟,数据驱动模型成为异常检测的主流手段。一方面工业生产是一种持续且实时的行为,另一方面工业生产的监测设备多样化程度高,积累的工业数据是一种典型的多维时序数据,因此基于多维时序数据的异常检测受到了工业互联网领域的高度重视。然而面向工业多维时序数据的异常检测是一项十分具有挑战的任务:首先数据的不同维度之间存在潜在关联和相互影响,导致异常模式更难以检测和识别。其次工业大数据具有体量大、多源异构、动态性强、连续采样、价值密度低、时效性强等一系列特点,这些都为工业设备的异常检测问题带来了难度和挑战。
4.通过上述分析,现有技术存在的问题及缺陷为:
5.(1)由于工业大数据体量大、多源异构、动态性强、连续采样、价值密度低以及时效性强的特点,并且工业生产存在大量的噪声,为工业多维时序数据的异常检测问题带来难度和挑战。
6.(2)工业多维时序数据指标繁杂多样,随着时间的推移,指标值不断动态变换。同一个指标在时序上可能存在周期变化,突升、突降,线性递增、递减或者非线性递增、递减的历史依赖关系。不同指标间也存在时间依赖特征,一个指标的变化可能会引起其他指标的相应变化。由于多维时序数据存在复杂的时间和空间依赖特征,导致面向工业多维时序数据的异常模式更加难以检测和识别。


技术实现要素:

7.针对现有技术存在的问题,本发明提供了一种针对工业多维时序数据的异常检测以及根因分析方法、系统及终端,尤其涉及一种基于注意力机制的层次变分自编码器异常检测以及根因分析方法、系统及终端。
8.本发明是这样实现的,一种针对工业多维时序数据的异常检测以及根因分析方法,针对工业多维时序数据的异常检测以及根因分析方法包括:通过数据预处理模块对数据进行标准化处理以及滑动窗口处理;构建神经网络模型并将预处理后的数据传入神经网
络模型,对神经网络模型进行训练;利用训练好的神经网络模型对工业设备的多维时序数据进行在线检测,实时检测设备运行状态,并对异常点进行根因分析和告警通知,进而从多维度数据中定位发生异常的指标。
9.进一步,针对工业设备的异常检测以及根因分析方法还包括:
10.(1)异常检测平台在接受到实时数据后,使用pytorch训练模型,模型训练前获取工业设备运行的历史数据,平台按照约定好的规范提供历史数据查询接口,异常检测平台通过接口获取历史数据并进行模型训练,如果没有接口,则通过异常检测平台基于消息队列中的数据积累训练数据集。
11.(2)将训练好的模型上传至hdfs大型文件系统,利用神经网络模型对智能传感器上传的多维实时数据流进行异常检测并对检测窗口内的指标进行根因分析。
12.(3)根据不同的异常等级及根因分析结果推送给不同的设备管理人员和维修人员,检查异常设备运行状态并进行维修。
13.(4)将异常检测及根因分析模型融入进物联网平台的异常检测模块,通过物联网平台实时获取工业设备的运行数据,再利用异常检测模块对设备进行异常检测以及根因分析,实时观测工业生产的运行状态。
14.进一步,针对工业多维时序数据的异常检测以及根因分析方法包括以下步骤:
15.步骤一,为了统一的表达各个传感器数值,使用最大最小归一化处理数据,并使用滑动窗口和掩码对多维时序数据进行增强,抗击网络波动和工业噪声。
16.步骤二,利用基于注意力机制的层次变分自编码器神经网络对多维时序数据进行数据重构。
17.步骤三,利用多维度重构残差矩阵计算异常分数。
18.步骤四,利用极值理论自动设定异常阈值。
19.步骤五,计算实时在线数据的异常分数,与阈值进行对比,得到异常结果进行根因分析。
20.进一步,步骤二中的基于注意力机制的层次变分自编码器包括编码器和解码器两个部分。
21.编码器网络用于构建后验分布q
φ
(s2,s1|x),其中使用两个隐变量来表示多维时序数据的潜在特征空间,s1代表空间随机隐变量,利用注意力机制捕获其空间特征。s2代表时间随机隐变量,利用lstm捕获其时间特征。
22.在解码器网络中需要利用多维时序数据的时空特征对数据进行重构,为了使重构数据和原数据的重构误差尽量小的同时,还需要其生成的数据具有随机性。所以利用vae概率模型对其解码器网络进行构建。
23.在线检测,用于将工业多维时序数据输入进基于注意力机制的层次变分自编码器中,输出重构时序矩阵,计算矩阵差异,最终进行异常检测。
24.进一步,步骤五中的多维时序数据异常检测包括:
25.(1)sensor

rowdata,传感器通过不同的物联网协议mqtt、modbustcp或nb-iot上传数据给物联网平台的不同协议解析层,得到未处理的数据rowdata。
26.(2)rowdata

msg{"hum":10,"at":16710046,"sn":"1028"}:协议适配层将rowdata转化为内部可识别的三重结构;其中,场景号sn代表设备,node代表采集卡,
attribute代表传感器数据,at代表时间戳上传到消息队列中。
27.(3)msg

influxdb,物联网平台的datacenter数据处理模块对msg数据进行清理,校验后存储进各种数据库,数据库包括时序数据库或文档性数据库。
28.(4)influxdb

tensorx:将时序数据库中的数据通过预处理形成一个模型可处理的二维张量。
29.(5)tensor x

x

,tensorx经过基于注意力机制的层次变分自编码器获得重构矩阵,利用重构矩阵检测是否正常运行。
30.(6)x
res

||x-x'||2:利用x
res
残差矩阵获得偏移值大小,通过不同的方法对偏移值进行度量得到指标是否产生异常情况。融合导数矩阵获得指标异常分数,获取异常分数最大的指标对异常进行根因分析,得到根因分析结果。
31.(7)sendinfo(s,d,title,subject,content):s代表发送消息的原地址,d表示目的地址,title表示标题,subject代表主题,content代表具体内容,当物联网平台检测出异常情况时发送通知给设备管理人员,对异常进行处理。
32.(8)update(name,phone,subject,content,deviceid):name表示设备维修人员名字,phone代表电话,subject代表主题,content代表维修内容,deviceid代表设备id。当设备维修人员维修好设备后上报设备故障原因,以及是否误报,供产生同样的异常信息后进行查看。
33.进一步,利用多维度重构矩阵对异常数据进行根因分析包括:利用贝叶斯推断构建多通道变分网络并获取潜在时间特征和空间维度特征;利用生成网络构建时间窗口内的重构时序矩阵,利用重构矩阵对设备状态进行实时异常检测;当异常检测完成后,利用重构矩阵对异常指标进行根因分析。
34.(1)rm×n'

conv(rm×n):使用1
×
1卷积和relu激活函数在时间维度上对数据进行处理,在对数据编码的同时,通过激活函数为模型引入非线性特征。
35.(2)rm×
n”←
multihead(rm×
n'
):为了对空间随机隐变量进行推断,提出时序空间自注意力机制学习其指标间的相关依赖特征。注意力机制常用来学习数据的复杂相关依赖关系和重要特征,用于提高模型对输入数据的关注度和表现能力。(3)rm‘×n←
lstm(conv1d(m
×
n”)):为了恢复特征编码的时间维度,使用1
×
1卷积进行处理,并使用深度lstm对多维时序数据时间特征进行构建
36.(4)p
θ
(x|s1,s2):通过生成网络得到重构矩阵,最大化elbo得到最终的训练目的;
37.(5)x
res

||x-x'||2:当获取到工业生产在线多维时序数据,通过求解残差矩阵求得异常严重程度,获取异常窗口的矩阵后,对比单指标偏移程度并利用导数矩阵度量数据突变程度,对异常情况进行根因分析,并下发异常通知;
38.(6)将异常检测和根因分析模块融入物联网平台,实时接入大型设备状态并对设备进行智能监控,实时检测设备运行是否异常并对异常进行根因分析。
39.本发明的另一目的在于提供一种针对工业多维时序数据的异常检测及根因分析系统,针对工业多维时序数据的异常检测以及根因分析系统包括:
40.数据获取模块,首先定义好数据所属的工业场景,数据传输所需要的协议以及传感器类型。协议包括mqtt协议、modbustcp协议以及私有自定义协议,传感器类型具有温度传感器、湿度传感器和电压电流传感器等等。
41.数据获取模块,首先定义好数据所属的工业场景,数据传输所需要的协议以及传感器类型。协议包括mqtt协议、modbustcp协议以及私有自定义协议,传感器类型具有温度传感器、湿度传感器和电压电流传感器等等。
42.模型构建模块,用于构建基于注意力机制的层次变分自编码器神经网络模型,并将预处理后的数据传入神经网络模型,对神经网络模型进行训练;
43.异常检测模块,用于利用训练好的自编码器神经网络模型对工业多维时序数据进行异常检测,实时检测设备运行状态。
44.根因分析模块,用于利用多维度重构矩阵对异常数据进行根因分析和告警通知,进而从多维度数据中定位发生异常的指标。
45.本发明的另一目的在于提供一种计算机设备,计算机设备包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行所述的针对工业设备的异常检测以及根因分析方法的步骤。
46.本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行所述的针对工业设备的异常检测以及根因分析方法的步骤。
47.本发明的另一目的在于提供一种信息数据处理终端,信息数据处理终端用于实现所述的针对工业设备的异常检测以及根因分析系统。
48.结合上述的技术方案和解决的技术问题,本发明所要保护的技术方案所具备的优点及积极效果为:
49.第一,工业设备的异常来源主要分为两个方面。一种是设备自身出现异常,例如设备发电机故障。另一种是环境异常,例如气温造成温度传感器检测温度突然上升或瓦斯泄漏造成的二氧化碳传感器异常以及人为操作造成的异常情况。为了尽量提高异常检测的精确度,降低异常检测的误报率,本发明基于深度学习对多维时序数据进行异常检测。但是多维时序数据具有体量大、连续采样、价值密度低、时效性强、采集信息不连贯等一系列特点,所以在进行异常检测之前需要对数据进行预处理。本发明的数据预处理分为数据补全,数据降维,最终在保留数据的大体特征基础上,对数据进行补全和降维;利用基于注意力机制的层次变分自编码器神经网络对多维时序数据进行异常检测,最终设计出一个既能保证异常检测准确度又能实时对其异常根因定位的方案。本发明涉及一种基于神经网络的异常检测算法,利用数据采集模块对工业设备的历史数据进行收集,并利用协议适配模块对数据进行对接和预处理,预处理之后,传入搭建好的神经网络,对其模型进行训练。其次,本发明利用训练好的模型对工业设备的多维时序数据进行在线检测,实时检测其工业生产的运行状态,对异常数据快速告警通知管理人员,并从多维度中智能化的定位其发生异常的指标,减少其设备宕机可能性,以及减少其设备故障迁移成本。
50.本发明提供的针对工业设备的异常检测以及根因分析方法,针对工业历史运行的多维时序数据训练神经网络模型,利用训练好的神经网络模型对工业设备的多维时序数据进行实时检测,尽早发现其异常数据,并对异常点进行根因分析,减少企业损失。本发明基于层次结构神经网络构建出不仅可以学习多维时序矩阵的空间特征还能学习其时间上的特征,增加其多维时序数据异常检测的准确度。该方法利用卷积神经网络对多维时序矩阵进行编码去除网络延迟造成的传感器数据不一致的噪音影响,再利用多头注意力机制学习
不同指标间的特征,最后利用长短期网络(lstm)学习时间上的特征。对于不同时间精度要求,可以在不同时间刻度上对其多维时序矩阵进行切片,可以缓解网络波动导致的数据延迟。在空间维度上,不同指标间存在不同的指标相关性,有些指标间存在正相关,有些指标间存在负相关,多头自注意力机制学习其指标间的潜在相关性特征。工业生产过程中,其传感器指标在时间维度上存在相关联性,某些指标会在不同时刻表现出不同的状态并且存在前后关联性,在时间维度上利用长短期神经网络可以学习其潜在的时间特征。在模型的鲁棒性方面,通过使用变分自动编码器(vae)学习其概率分布可以解决数据的噪声问题。
51.第二,本发明利用基于注意力机制的层次变分自编码器神经网络对工业设备的多维时序数据进行实时检测,设计了一套实时处理能力强、异常检测准确率高的异常检测模型,通过将异常检测和根因分析模块融入进物联网平台,给物联网平台赋能,不仅可以快速实时接入大型设备的状态而且还能对设备进行智能监控,实时检测设备运行是否异常并对其异常进行根因分析,减少人力分析成本提升企业效益。
52.第三,作为本发明的权利要求的创造性辅助证据,还体现在以下几个重要方面:
53.(1)本发明的技术方案转化后的预期收益和商业价值为:
54.在传统制造业中,企业也通过各种智能传感器获取了大量工业多维时序数据,但是由于工业生产环境复杂多样,物联网协议多种多样以及数据传输过程中网络的不稳定性,导致没有通用且有效的方法对其进行数据挖掘和利用。所以本发明利用深度学习神经网络对多维时序数据进行异常数据挖掘,及时发现工业生产的异常情况,减少企业损失。
55.(2)本发明的技术方案填补了国内外业内技术空白:
56.本发明的技术方案相比于国内外的工业多维时序数据异常检测方法,通过客观指标值进行对比后,均优于其他方法。
附图说明
57.为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
58.图1是本发明实施例提供的针对工业设备的异常检测以及根因分析方法的流程图;
59.图2是本发明实施例提供的神经网络模型图;
60.图3是本发明实施例提供的对多维时序数据进行数学表示的时序矩阵图;
61.图4是本发明实施例提供的离线数据训练流程和在线数据预测流程图;
62.图5是本发明实施例提供的指标概率密度分布图;
63.图6是本发明实施例提供的原始时序矩阵热力图和重构矩阵热力图;
64.图7是本发明实施例提供的物联网平台架构图。
65.图8是本发明实施例提供的验证效果图。(a)多维时序数据第15维度的指标发生了点异常,其值远远偏离了正常取值范围。(b)维度1和维度3不符合历史走势,区间内形成的上下文时间依赖异常被成功检测出来。
66.(c)维度7和15两个指标正常情况是呈现正相关关系,但是在其他区域两个指标呈
现负相关,检测出其指标间的异常;(d)数据呈现周期震荡的趋势,但是在其他异常区域出现了违反历史周期震荡趋势,从而检测出异常情况。
具体实施方式
67.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
68.针对现有技术存在的问题,本发明提供了一种针对工业设备的异常检测以及根因分析方法、系统及终端,下面结合附图对本发明作详细的描述。
69.如图1所示,本发明实施例提供的针对工业设备的异常检测以及根因分析方法包括以下步骤:
70.s101,使用最大最小归一化处理数据,并使用滑动窗口和掩码对多维时序数据进行增强,抗击网络波动和工业噪声。
71.s102,利用基于注意力机制的层次变分自编码器神经网络对多维时序数据进行数据重构。
72.s103,利用多维度重构残差矩阵计算异常分数。
73.s104,利用极值理论自动设定异常阈值。
74.s105,计算实时在线数据的异常分数,与阈值进行对比,得到异常结果进行异常检测以及根因分析。
75.作为优选实施例,本发明实施例提供的针对工业设备的异常检测以及根因分析方法包括以下步骤:
76.第一步:异常检测平台在接受到实时数据后,使用pytorch训练模型。模型训练需要工业设备运行的历史数据,平台可以按照约定好的规范提供历史数据查询接口,异常检测平台通过接口获取历史数据并进行模型训练、如果没有接口,异常检测平台基于消息队列中的数据来积累训练数据集。
77.第二步:把训练好的模型上传到hdfs大型文件系统中,然后利用此神经网络模型对工业设备上传上来的多维实时数据流进行异常检测,并对其检测窗口内的指标进行根因分析。
78.第三步:根据不同的异常等级及根因分析结果推送给不同的设备管理人员和维修人员,然后检查其异常设备运行状态,并进行维修,减少企业的损失。
79.第四步:将此异常检测及根因分析模型融入进物联网平台的异常检测模块,提升其异常检测模块的智能性,通过物联网平台快速实时的获取工业设备的运行数据,再利用异常检测模块快速对设备进行异常检测以及根因分析,实时观测设备的健康状态。
80.1.基于注意力机制的层次变分自编码器神经网络
81.本发明实施例提供了一种基于注意力机制的层次变分自编码器神经网络,其结构分为两部分,一部分为编码器网络,一部分为解码器网络。本发明的系统模型如图2所示。
82.编码器网络:通过对多维时序数据建模构建出时序矩阵如图3所示,然后划分时间滑动窗口输入进编解码器网络中,其中经过三阶段,分别为卷积层和relu激活函数在时间维度上对数据进行处理,在对数据编码的同时,通过激活函数为模型引入非线性特征、指标
间相关性特征提取以及时间维度相关性特征提取。
83.解码器网络:在解码器网络中需要利用多维时序数据的时空特征对数据进行重构,为了使重构数据和原数据的重构误差尽量小的同时,还需要其生成的数据具有随机性。所以利用vae概率模型对其解码器网络进行构建。
84.在线检测:将工业设备产生的多维时序矩阵输入进基于注意力机制的层次变分自编码器神经网络中,生成重构时序矩阵,然后计算其矩阵差异,差异越大表明其异常程度越大,最终对其进行准确的异常检测。
85.本发明实施例提供的工业多维时序数据异常检测与根因分析定义:
86.如图2所示,神经网络模型分为两部分,第一部分利用贝叶斯推断构建起编码器网络获取其潜在时间特征和空间维度特征。然后利用解码器网络构建起时间窗口内的重构时序矩阵,利用其重构矩阵可以对设备状态进行实时检测,并进行准确的异常检测。当异常检测完成之后,面对众多工业多维时序指标无法对其准确的分析情况下可以利用其重构矩阵对异常指标进行根因分析。
87.1)rm×
n’←
conv(rm×n):使用1
×
1卷积和relu激活函数在时间维度上对数据进行处理,在对数据编码的同时,通过激活函数为模型引入非线性特征。
88.2)rm×
n”←
multihead(rm×
n’):为了对空间随机隐变量进行推断,提出时序空间自注意力机制学习其指标间的相关依赖特征。注意力机制常用来学习数据的复杂相关依赖关系和重要特征,用于提高模型对输入数据的关注度和表现能力。
89.3)rm‘×n←
lstm(conv1d(m
×
n”)):为了恢复特征编码的时间维度,使用1
×
1卷积进行处理,并使用深度lstm对多维时序数据时间特征进行构建。
90.4)p
θ
(x|s1,s2):通过解码器网络得到重构矩阵,最大化elbo得到最终的训练目的;
91.5)x
res

||x-x'||2:当获取到工业生产在线多维时序数据,通过求解残差矩阵求得异常严重程度,获取异常窗口的矩阵后,对比单指标偏移程度并利用导数矩阵度量数据突变程度,对异常情况进行根因分析,并下发异常通知。
92.6)通过将异常检测和根因分析模块融入进物联网平台,给物联网平台赋能,可以快速实时接入大型设备的状态而且还能对设备进行智能监控,实时检测设备运行是否异常并对其异常进行根因分析,减少人力分析成本提升企业效益。
93.本发明实施例提供的基于神经网络的工业设备异常检测算法过程如下:
94.1)sensor

rowdata,传感器通过不同的物联网协议,例如mqtt,modbustcp或nb-iot上传数据给物联网平台的不同协议解析层,得到未处理的数据rowdata。
95.2)rowdata

msg{"hum":10,"at":16710046,"sn":"1028"}。协议适配层把rowdata转化为内部可识别的三重结构,分别为场景号sn代表设备,node代表采集卡,attribute代表传感器数据,at代表时间戳上传到消息队列中。
96.3)msg

influxdb,物联网平台的datacenter数据处理模块对msg数据进行清理,校验然后存储进各种数据库,例如时序数据库或者文档性数据库。
97.4)influxdb

tensorx:将时序数据库里面的数据通过预处理形成一个模型可处理的二维张量。
98.5)tensorx

x

,tensorx经过多通道变分长短期网络和生成网络获得重构矩阵,重构矩阵可以用来检测设备是否正常运行。其中,本发明实施例提供的原始时序矩阵热力
图和重构矩阵热力图如图6所示。
99.6)x
res

||x-x'||2:利用x
res
残差矩阵可以获得偏移值大小,通过不同的方法对偏移值进行度量可以得到指标是否产生了异常,并融合导数矩阵可以获得指标异常分数,获取异常分数最大的几个指标能对其设备异常进行根因分析,最终得到根因分析结果。
100.7)sendinfo(s,d,title,subject,content):s代表发送消息的原地址,d表示目的地址,title表示标题,subject代表主题,content代表具体内容。当物联网平台检测出异常情况时会通过此方法发送通知给设备管理人员,让设备管理人员对其异常进行处理。
101.8)update(name,phone,subject,content,deviceid):name表示设备维修人员名字,phone代表电话,subject代表主题,content代表维修内容,deviceid代表设备id。当设备维修人员维修好设备之后,可以上报设备故障原因,以及是否误报,供产生同样的异常信息后进行查看。
102.本发明实施例提供的针对工业设备的异常检测以及根因分析系统包括:
103.数据获取模块,首先定义好数据所属的工业场景,数据传输所需要的协议以及传感器类型。协议包括mqtt协议、modbustcp协议以及私有自定义协议,传感器类型具有温度传感器、湿度传感器和电压电流传感器等等。
104.模型构建模块,用于构建基于注意力机制的层次变分自编码器神经网络模型,并将预处理后的数据传入神经网络模型,对神经网络模型进行训练;
105.异常检测模块,用于利用训练好的长短期神经网络模型对工业多维时序数据进行异常检测,实时检测设备运行状态;
106.根因分析模块,用于利用多维度重构矩阵对异常数据进行根因分析和告警通知,进而从多维度数据中定位发生异常的指标。
107.本发明实施例提供的融合异常检测模块的物联网平台架构图如图7所示,工业设备通过传感器收集工业设备运转数据,通过数据接收层和解析层处理好原始数据,传入kafka消息中间件。数据处理中心接受数据转存进不同的数据库里面。异常检测模块可以从数据库得到历史数据,以及从kafka得到在线数据进行模型训练以及在线检测如图4所示。若检测到异常可进行消息下发给设备维修人员。如果设备真的产生异常,则对其进行标记,并写明异常原因以及解决异常的步骤以便下次产生同样的异常进行对比加快设备维修速度。如果产生误报情况,则将数据重新拿入网络框架进行学习,以便学习到设备指标正常模式,避免下次产生同样的误报情况,通过持续性学习,增加模型的精确性。本发明的物联网平台通过智能融合其异常检测模块和设备异常根因分析模块可以快速检测到设备异常并进行根因分析,减少企业损失,加快设备检修速度。
108.本发明实施例提供的方案通过协议接入层不仅能快速接入物联网设备,还能通过协议适配层转换成内部协议,通过kafka消息队列可以对大量的物联网数据进行接入,通过时序数据库和grafana进行自定义数据展示。kafka获得的数据还可以下发给异常检测模块和根因分析模块对设备状态进行实时检测。
109.1.在大型工业设备上安装传感器,传感器实时收集数据通过各种网络协议接入到物联网平台相关协议接入层,协议接入层可以推送数据到协议适配层把数据转化成内部数据格式传输给kafka,然后对数据进行清理、校验和存储。
110.2.基于注意力机制的层次变分自编码器神经网络通过物联网平台获取到的数据
对模型进行训练,模型通过识别网络波动特征,时间和空间特征能准确检测出设备异常程度。
111.3.对不同的异常等级进行等级划分下发给不同的设备管理人员或不同的维修人员,其中包括邮件,短信,电话和站内信通知。
112.4.当设备维修人员收到设备异常信息,可以进一步在物联网根因分析模块中查看异常根因分析结果,根因分析模块通过融合指标导数值以及残差矩阵并通过衰减因子可以较准确的给出分析报告辅助设备管理人员对设备进行检修。
113.5.设备维修人员可以根据根因分析报告着重检查最有可能造成设备异常的模块,加快设备检修速度。
114.6.当设备维修人员检查到设备产生异常的真正原因之后,上传维修报告,以及是否产生误报填写进物联网平台设备维修模块中,当下一次产生同样的异常可以利用历史维修步骤对设备进行检修。
115.为了证明本发明实施例提出的方法能很好的捕获多维时序数据的时间以及空间依赖关系,进而进行有效的异常检测,对异常检测案列进行可视化展示。其中包括工业多维时序数据集中的点异常,上下文时间依赖异常,指标间异常以及周期异常。
116.从图8(a)可以看到多维时序数据第15维度的指标发生了点异常,其值远远偏离了正常取值范围。从图(b)可以看出维度1和维度3不符合历史走势,区间内形成的上下文时间依赖异常被成功检测出来。
117.从图8(c)可以看出维度7和15两个指标正常情况是呈现正相关关系,但是在其他区域两个指标呈现负相关,检测出其指标间的异常。从图8(d)可以看出数据呈现周期震荡的趋势,但是在其他异常区域出现了违反历史周期震荡趋势,从而检测出异常情况。
118.应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、cd或dvd-rom的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
119.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

技术特征:
1.一种针对工业多维时序数据的异常检测以及根因分析方法,其特征在于,包括:通过数据预处理模块对数据进行标准化处理以及滑动窗口处理;构建神经网络模型并将预处理后的数据传入神经网络模型,对神经网络模型进行训练;利用训练好的神经网络模型对工业设备的多维时序数据进行在线检测,实时检测设备运行状态,并对异常点进行根因分析和告警通知,进而从多维度数据中定位发生异常的指标。2.如权利要求1所述的针对工业设备的异常检测以及根因分析方法,其特征在于,针对工业多维时序数据的异常检测以及根因分析方法还包括:(1)异常检测平台在接受到实时数据后,使用pytorch训练模型,模型训练前获取工业设备运行的历史数据,平台按照约定好的规范提供历史数据查询接口,异常检测平台通过接口获取历史数据并进行模型训练,如果没有接口,则通过异常检测平台基于消息队列中的数据积累训练数据集。(2)将训练好的模型上传至hdfs大型文件系统,利用神经网络模型对智能传感器上传的多维实时数据流进行异常检测并对检测窗口内的指标进行根因分析。(3)根据不同的异常等级及根因分析结果推送给不同的设备管理人员和维修人员,检查异常设备运行状态并进行维修。(4)将异常检测及根因分析模型融入进物联网平台的异常检测模块,通过物联网平台实时获取工业设备的运行数据,再利用异常检测模块对设备进行异常检测以及根因分析,实时观测工业生产的运行状态。3.如权利要求1所述的针对工业多维时序数据的异常检测以及根因分析方法,其特征在于,针对工业多维时序数据的异常检测以及根因分析方法包括以下步骤:步骤一,为了统一的表达各个传感器数值,使用最大最小归一化处理数据,并使用滑动窗口和掩码对多维时序数据进行增强,抗击网络波动和工业噪声。步骤二,利用基于注意力机制的层次变分自编码器神经网络对多维时序数据进行数据重构。步骤三,利用多维度重构残差矩阵计算异常分数。步骤四,利用极值理论自动设定异常阈值。步骤五,计算实时在线数据的异常分数,与阈值进行对比,得到异常结果进行根因分析。4.如权利要求3所述的针对工业设备的异常检测以及根因分析方法,其特征在于,步骤二中的基于注意力机制的层次变分自编码器神经网络;编码器网络用于构建后验分布q
φ
(s2,s1|x),其中使用两个隐变量来表示多维时序数据的潜在特征空间,s1代表空间随机隐变量,利用注意力机制捕获其空间特征。s2代表时间随机隐变量,利用lstm捕获其时间特征。在解码器网络中需要利用多维时序数据的时空特征对数据进行重构,为了使重构数据和原数据的重构误差尽量小的同时,还需要其生成的数据具有随机性。所以利用vae概率模型对其解码器网络进行构建。在线检测,用于将工业多维时序数据输入进基于注意力机制的层次变分自编码器中,输出重构时序矩阵,计算矩阵差异,最终进行异常检测。5.如权利要求3所述的针对工业多维时序数据的异常检测以及根因分析方法,其特征
在于,步骤五中的多维时序数据异常检测包括:(1)sensor

rowdata,传感器通过不同的物联网协议mqtt、modbustcp或nb-iot上传数据给物联网平台的不同协议解析层,得到未处理的数据rowdata;(2)rowdata

msg{"hum":10,"at":16710046,"sn":"1028"}:协议适配层将rowdata转化为内部可识别的三重结构;其中,场景号sn代表设备,node代表采集卡,attribute代表传感器数据,at代表时间戳上传到消息队列中;(3)msg

influxdb,物联网平台的datacenter数据处理模块对msg数据进行清理,校验后存储进各种数据库,数据库包括时序数据库或文档性数据库;(4)influxdb

tensorx:将时序数据库中的数据通过预处理形成一个模型可处理的二维张量;(5)tensorx

x

,tensorx经过多通道变分长短期网络和生成网络获得重构矩阵,利用重构矩阵检测设备是否正常运行;(6)x
res

||x-x'||2:利用x
res
残差矩阵获得偏移值大小,通过不同的方法对偏移值进行度量得到指标是否产生异常;融合导数矩阵获得指标异常分数,获取异常分数最大的指标对设备异常进行根因分析,得到根因分析结果;(7)sendinfo(s,d,title,subject,content):s代表发送消息的原地址,d表示目的地址,title表示标题,subject代表主题,content代表具体内容;当物联网平台检测出异常情况时发送通知给设备管理人员,对异常进行处理;(8)update(name,phone,subject,content,deviceid):name表示设备维修人员名字,phone代表电话,subject代表主题,content代表维修内容,deviceid代表设备id;当设备维修人员维修好设备后上报设备故障原因,以及是否误报,供产生同样的异常信息后进行查看。6.如权利要求3所述的针对工业多维时序数据的异常检测以及根因分析方法,其特征在于,步骤五中的利用多维度重构矩阵对异常数据进行根因分析包括:利用贝叶斯推断构建多通道变分网络并获取潜在时间特征和空间维度特征;利用生成网络构建时间窗口内的重构时序矩阵,利用重构矩阵对设备状态进行实时异常检测;当异常检测完成后,利用重构矩阵对异常指标进行根因分析,具体包括:(1)r
m
×
n'

conv(r
m
×
n
):使用1
×
1卷积和relu激活函数在时间维度上对数据进行处理,在对数据编码的同时,通过激活函数为模型引入非线性特征。(2)r
m
×
n”←
multihead(r
m
×
n'
):为了对空间随机隐变量进行推断,提出时序空间自注意力机制学习其指标间的相关依赖特征。注意力机制常用来学习数据的复杂相关依赖关系和重要特征,用于提高模型对输入数据的关注度和表现能力。(3)r
m
‘×
n

lstm(conv1d(m
×
n”)):为了恢复特征编码的时间维度,使用1
×
1卷积进行处理,并使用深度lstm对多维时序数据时间特征进行构建(4)p
θ
(x|s1,s2):通过生成网络得到重构矩阵,最大化elbo得到最终的训练目的;(5)x
res

||x-x'||2:当获取到工业生产在线多维时序数据,通过求解残差矩阵求得异常严重程度,获取异常窗口的矩阵后,对比单指标偏移程度并利用导数矩阵度量数据突变程度,对异常情况进行根因分析,并下发异常通知;(6)将异常检测和根因分析模块融入物联网平台,实时接入大型设备状态并对设备进
行智能监控,实时检测设备运行是否异常并对异常进行根因分析。7.一种应用如权利要求1~6任意一项所述的基于自编码神经网路的针对工业多维时序数据的异常检测以及根因分析系统,其特征在于,针对工业多维时序数据的异常检测以及根因分析系统包括:数据获取模块,首先定义好数据所属的工业场景,数据传输所需要的协议以及传感器类型。协议包括mqtt协议、modbustcp协议以及私有自定义协议,传感器类型具有温度传感器、湿度传感器和电压电流传感器等等。模型构建模块,用于构建基于注意力机制的层次变分自编码器神经网络模型,并将预处理后的数据传入神经网络模型,对神经网络模型进行训练;异常检测模块,用于利用训练好的自编码器神经网络模型对工业多维时序数据进行异常检测,实时检测设备运行状态。根因分析模块,用于利用多维度重构矩阵对异常数据进行根因分析和告警通知,进而从多维度数据中定位发生异常的指标。8.一种计算机设备,其特征在于,计算机设备包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行如权利要求1~6任意一项所述的针对工业设备的异常检测以及根因分析方法的步骤。9.一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行如权利要求1~6任意一项所述的针对工业设备的异常检测以及根因分析方法的步骤。10.一种信息数据处理终端,其特征在于,信息数据处理终端用于实现如权利要求7所述的针对工业设备的异常检测以及根因分析系统。

技术总结
本发明属于工业设备多维时序数据异常检测技术领域,公开了一种针对工业设备的异常检测以及根因分析方法、系统及终端,利用多通道变分长短期推断网络对工业设备的历史数据进行预处理;构建神经网络模型并将预处理后的数据传入神经网络模型,对神经网络模型进行训练;利用训练好的神经网络模型对工业设备的多维时序数据进行在线检测,实时检测设备运行状态,对异常点进行根因分析和告警通知,从多维度数据中定位发生异常的指标。本发明将异常检测和根因分析模块融入物联网平台,给物联网平台赋能,可以快速实时接入大型设备的状态而且还能对设备进行智能监控,实时检测设备运行是否异常并对其异常进行根因分析,减少人力分析成本提升企业效益。成本提升企业效益。成本提升企业效益。


技术研发人员:沈玉龙 杨佳辉 贾军超 张琛 李琳 光宇 杜志雄 赵双睿 王建东
受保护的技术使用者:西安电子科技大学青岛计算技术研究院
技术研发日:2023.04.14
技术公布日:2023/8/21
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐