一种异常检测方法、装置以及计算机存储介质与流程

未命名 07-29 阅读:91 评论:0


1.本发明涉及一种异常检测技术领域,特别涉及一种故障检测方法、装置以及计算机存储介质。


背景技术:

2.智能电子设备可能会在使用过程中出现各种各样的故障,比如软件方面的代码bug、硬件方面的元件损坏、环境引起的网络故障等。故障诊断需要专家来进行,但排查之前往往需要复现问题,这需要花费很多时间,为此,希望通过一些指标的预测,可以帮专家排除一些故障原因。且也希望在设备出现故障之前能获得一些预警,这样就能提前采取一些措施。
3.异常检测,是对某个事务活动中产生的大量数据进行检测以确定其中的异常数据,所述异常数据被称为异常点。异常点具有不符合正常数据的分布特征或表现模式,通过分析异常点可以获知事务活动的安全状态。目前常采用的异常检测技术包括监督的、半监督的和无监督的异常检测方法。
4.基于监督的异常检测技术通过给出带标签的正常数据集和异常数据集来构成整个训练集,而标签需要事先通过人工定义进行手工定义。
5.基于k均值聚类的异常检测方法为广泛使用的无监督异常检测方法,然而,常规的k均值聚类由于采用均值计算方法来确定聚类中心,收敛较慢,特别是对于样本规模大的收据,异常检测效率低下。


技术实现要素:

6.本发明的目的是为了克服现有技术的不足,引入了遗传算法对常规的k均值聚类进行改进,以加快收敛速度,提高异常检测效率。
7.本发明是通过以下技术方案实现:
8.一种异常检测方法,该方法包括:获取设备的状态检测数据,该状态检测数据构成历史数据;
9.对所述历史数据进行数据处理,得到训练数据样本集x={x1,x2,x3,...,xn},其中xi=[x
i1
,x
i2
,x
i3
,...,x
im
]表示第i个样本且1≤i≤n,n表示训练数据样本集的样本个数,m表示每个样本的维数;
[0010]
利用遗传算法对k均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型;
[0011]
获取设备的最新状态检测数据,该最新状态检测数据构成实时数据;
[0012]
将所述实时数据导入到所述非监督学习模型进行预测以得到预测结果,当所述预测结果确定所述待设备为故障设备时,对所述设备进行标记,所述利用遗传算法对k均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型,具体包括:
[0013]
步骤一:从样本集x中随机选择k个样本x
radom
作为每个聚类结果的聚类中心,其中radom表示在[1,n]之间随机选择的整数,构造初始聚类中心集
[0014]
步骤二:依次计算并比较每一个样本xi到每一个聚类中心c
p
的距离dis(xi,c
p
),1≤p≤k,将样本xi分配到距离最近的聚类中心的类簇中,得到k个类簇{s1,s2,s3,...,sk},其中x
id
表示xi的第d维数据,c
pd
表示聚类中c
p
的第d维数据,1≤d≤m;
[0015]
步骤三:构造每个类簇s
p
的最小值向量和最大值向量根据所述最小值向量和最大值向量进行二进制编码构造染色体,重复多次编码构造多个染色体,多个染色体构造成初始种群;其中所述遗传算法的适应度函数其中,q表示类簇s
p
中的样本数量,表示类簇s
p
中第j个样本的第d维数据,1≤j≤q;根据所述适应度函数,获取出最优解并将该最优解更新为类簇s
p
的聚类中心c
p

[0016]
步骤四:重复步骤三,完成k个类簇{s1,s2,s3,...,sk}的聚类中心的更新;
[0017]
步骤五:比较更新前后的每个类簇的聚类中心是否一致,若不一致,则返回步骤二后继续执行;若一致,则得到最终的k个类簇{s1,s2,s3,...,sk}的聚类中心,聚类分析完成,得到设备异常检测模型。
[0018]
更进一步地,所述设备为家庭多媒体自由终端。
[0019]
更进一步地,所述状态检测数据包括cpu温度、cpu使用率、ram占用率、网速。
[0020]
更进一步地,所述构造每个类簇s
p
的最小值向量和最大值向量包括:获取类簇s
p
的q个样本xq的每个维度的最小值和最大值其中,
[0021]
根据所述每个维度的最小值和最大值构成出最小值向量以及最大值向量根据所述最小值向量和最大值向量确定m个约束条件根据所述m个约束条件,进行二进制编码构造染色体。
[0022]
更进一步地,所述步骤三还包括:对初始种群中的每个染色体,利用适应度函数进行选择后,进行交叉、变异操作完成一轮染色体更新,得到新的种群;重复多轮染色体更新,检查是否满足终止条件,当满足终止条件时,则终止染色体更新,获取出最优解
[0023]
在另一实施例中,本发明还涉及一种用于风险设备故障检测装置,包括:
[0024]
第一获取模块,用于获取设备的状态检测数据,该状态检测数据构成历史数据;
[0025]
处理模块,用于对所述历史数据进行数据处理,得到训练数据样本集x={x1,x2,x3,...,xn},其中xi=[x
i1
,x
i2
,x
i3
,...,x
im
]表示第i个样本,1≤i≤n,n表示训练数据样本集
的样本个数,m表示每个样本的维数;
[0026]
分析模块,用于利用遗传算法对k均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型;
[0027]
第二获取模块,用于获取设备的最新状态检测数据,该最新状态检测数据构成实时数据;将所述实时数据导入到所述非监督学习模型进行预测以得到预测结果,当所述预测结果确定所述设备为故障设备时,对所述设备进行标记;所述利用遗传算法对k均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型,具体包括:
[0028]
步骤一:从样本集x中随机选择k个样本x
radom
作为每个聚类结果的聚类中心,其中radom表示在[1,n]之间随机选择的整数,构造初始聚类中心集
[0029]
步骤二:依次计算并比较每一个样本xi到每一个聚类中心c
p
的距离dis(xi,c
p
),1≤p≤k,将样本xi分配到距离最近的聚类中心的类簇中,得到k个类簇{s1,s2,s3,...,sk},其中x
id
表示xi的第d维数据,c
pd
表示聚类中心c
p
的第d维数据,1≤d≤m;
[0030]
步骤三:构造每个类簇s
p
的最小值向量和最大值向量根据所述最小值向量和最大值向量进行二进制编码构造染色体,重复多次编码构造多个染色体,多个染色体构造成初始种群;
[0031]
其中所述遗传算法的适应度函数其中,q表示类簇s
p
中的样本数量,表示类簇s
p
中第j个样本的第d维数据,1≤j≤q;
[0032]
根据所述适应度函数,获取出最优解并将该最优解更新为类簇s
p
的聚类中心c
p

[0033]
步骤四:重复步骤三,完成k个类簇{s1,s2,s3,...,sk}的聚类中心的更新;
[0034]
步骤五:比较更新前后的每个类簇的聚类中心是否一致,若不一致,则返回步骤二后继续执行;若一致,则得到最终的k个类簇{s1,s2,s3,...,sk}的聚类中心,聚类分析完成,得到设备异常检测模型。
[0035]
更进一步地,所述设备包括家庭多媒体自由终端。
[0036]
更进一步地,所述状态检测数据包括cpu温度、cpu使用率、ram占用率、网速。
[0037]
更进一步地,所述构造每个类簇s
p
的最小值向量和最大值向量包括:获取类簇s
p
的q个样本xq的每个维度的最小值和最大值其中,根据所述每个维度的最小值和最大值构成出最小值向量以及最大值向量根据所述最小值向量和最大值向量确定m个约束条件
根据所述m个约束条件,进行二进制编码构造染色体。
[0038]
在另一实施例中,本发明还包括一种计算机存储介质,其特征在于,所述计算机存储介质存储有用于执行上述方法的程序。
[0039]
本发明具有如下的技术效果:
[0040]
本发明通过使用均值聚类方法,自动找出异常簇类,不需要人工事先进行定义,克服了传统的通过人工定义规则识别产品风险而产生的高度依赖人的经验、知识,人工定义不全面、准确的问题,从而高效的检测出潜在风险设备,实现设备的故障检测。
[0041]
本发明针对传统的均值聚类方法存在的聚类中心运算不准确导致的收敛速度低下、运算效率低的问题,引入了遗传算法,采用遗传算法对聚类中心进行更新,可提高运算速度和准确度。
附图说明
[0042]
图1为本发明的计算流程图;
[0043]
图2为遗传算法的计算流程图;
[0044]
图3为用于设备的故障检测装置。
具体实施方式
[0045]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0046]
传统的k均值聚类算法一般采用如下步骤:
[0047]
sep1:创建k个点作为初始的质心点(随机选择)。
[0048]
step2:计算每个数据点到质心点的距离,将数据点分配到距离最近的类簇。
[0049]
step3:计算类簇中所有点的均值,并将均值作为更新后的质心。
[0050]
step4:重复步骤2-3,对类簇和质心进行更新,当前后两次的质心不发生变化时,则终止计算。
[0051]
其中,对重新归属后的每个类簇更新质心点(聚类中心),对于每个类簇sw而言,其更新后的类聚中心计算公式如下:
[0052]
其中表示第w个类簇的聚类中心的第j维度分量,p表示第w个类簇的对象个数。
[0053]
事实上,每个簇的质心点(聚类中心),应该是到该簇的所有数据点距离最接近的点。然而,通过计算类簇中所有点的均值所确定的点,并不一定是到该类簇的所有数据点距离最接近的点。由于该计算方式的偏差,均值确定的点并不是实际意义上真正的质心,从而导致由该质心点确定的类簇具有一定偏差,即导致聚类过程可能存在一定的偏差。因此需要通过多次计算,不断的变换质心,导致收敛速度慢,计算效率低下。当前后两次质心不发生变化时,则表明簇的种类、数据点没有发生变化,此时停止计算。
[0054]
基于上述原因,本技术采用遗传算法对k均值算法的聚类中心的确定进行了改进,从而可以快速、准确的确定出聚类中心,使得以该聚类中心为基准确定的类簇更加准确,进
而可以实现快速收敛,提高计算效率。
[0055]
本技术的方案如下所示:
[0056]
实施例1
[0057]
如图1所示,一种异常检测方法,该方法包括:获取设备的状态检测数据。该设备为家庭多媒体自由终端或者其他家庭智能设备。该状态检测数据构成历史数据;对所述历史数据进行数据处理,得到训练数据样本集x={x1,x2,x3,...,xn},其中xi=[x
i1
,x
i2
,x
i3
,...,x
im
]表示第i个样本且1≤i≤n,n表示训练数据样本集的样本个数,m表示每个样本的维数。所述训练数据中包括多个与故障相关的feature,所以所选的feature与设备的故障之间要有强的相关性,即能够反映出设备的故障情况。其中,对所述历史数据进行数据处理,包括对数据进行整理、清洗、剔除或者转换数据格式或类型等。
[0058]
利用遗传算法对k均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型。具体而言,对该历史数据进行聚类分析后会得到多个聚类结果,即得到多个簇类{s1,s2,s3,...,sk},而每个簇类具有数量不同的样本数。一般而言,样本数目小的簇类表明该簇类中的数据产生较少,相对于正常数据表现出为异常模式。因此,取样本数目相对小的簇类为异常簇类,该异常簇类中的样本为异常模式样本,该异常簇类的聚类中心为异常模式聚类中心。
[0059]
获取设备的最新状态检测数据,该最新状态检测数据构成实时数据;
[0060]
将所述实时数据导入到所述非监督学习模型进行预测以得到预测结果,当所述预测结果确定所述待设备为故障设备时,对所述设备进行标记。即利用非监督学习模型确定的异常检测模型,对实时数据进行聚类分析,当该实时数据属于异常簇类时,则表明此时数据异常,设备存在故障。
[0061]
遗传算法包括基本遗传算子:选择算子、交叉算子、和变异算子。在进行染色体编码的时候,需用固定长度的二进制符号串来表示群体中的个体(染色体),等位基因由二值{0,1}所组成。设一优化变量x∈[u1,u2]用长度为k的二进制编码符号来表示该参数,则总共有2k种不同的编码,其中,编码前实数值与编码后二进制码对于关系如下:
[0062][0063]
其中,
[0064]
因此,可以根据优化变量x∈[u1,u2]确定二进制编码的长度以及编码、解码规则。
[0065]
本技术中利用遗传算法对k均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型,具体包括:
[0066]
步骤一:从样本集x中随机选择k个样本x
radom
作为每个聚类结果的聚类中心,其中radom表示在[1,n]之间随机选择的整数,构造初始聚类中心集
[0067]
步骤二:依次计算并比较每一个样本xi到每一个聚类中心c
p
的距离dis(xi,c
p
),1
≤p≤k,将样本xi分配到距离最近的聚类中心的类簇中,得到k个类簇{s1,s2,s3,...,sk},其中x
id
表示xi的第d维数据,c
pd
表示聚类中c
p
的第d维数据,1≤d≤m;
[0068]
步骤三:构造每个类簇s
p
的最小值向量和最大值向量具体而言,过程如下:获取类簇s
p
的q个样本xq的每个维度的最小值和最大值其中,
[0069]
根据所述每个维度的最小值和最大值构成出最小值向量以及最大值向量根据所述最小值向量和最大值向量确定m个约束条件根据所述m个约束条件,进行二进制编码构造染色体,重复多次编码构造多个染色体,多个染色体构造成初始种群;其中所述遗传算法的适应度函数其中,q表示类簇s
p
中的样本数量,表示类簇s
p
中第j个样本的第d维数据,1≤j≤q;根据所述适应度函数,获取出最优解并将该最优解更新为类簇s
p
的聚类中心c
p
。如图2所示,在确定了初始种群后,对初始种群中的每个染色体,利用适应度函数进行选择后,进行交叉、变异操作完成一轮染色体更新,得到新的种群;重复多轮染色体更新,检查是否满足终止条件,当满足终止条件时,则终止染色体更新,获取出最优解
[0070]
步骤四:重复步骤三,完成k个类簇{s1,s2,s3,...,sk}的聚类中心的更新;
[0071]
步骤五:比较更新前后的每个类簇的聚类中心是否一致,若不一致,则返回步骤二后继续执行;若一致,则得到最终的k个类簇{s1,s2,s3,...,sk}的聚类中心,聚类分析完成,得到设备异常检测模型。
[0072]
在一些实施例中,状态检测数据包括cpu温度、cpu使用率、ram占用率、网速。
[0073]
在一些实施例中,在skyway云平台对社保上报的设备状态数据进行聚类。
[0074]
实施例2
[0075]
根据本发明实施例,提供了一种用于设备的故障检测装置,包括:
[0076]
第一获取模块,用于获取设备的状态检测数据,该状态检测数据构成历史数据;
[0077]
处理模块,用于对所述历史数据进行数据处理,得到训练数据样本集x={x1,x2,x3,...,xn},其中xi=[x
i1
,x
i2
,x
i3
,...,x
im
]表示第i个样本,1≤i≤n,n表示训练数据样本集的样本个数,m表示每个样本的维数;
[0078]
分析模块,用于利用遗传算法对k均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型;
[0079]
第二获取模块,用于获取设备的最新状态检测数据,该最新状态检测数据构成实时数据;将所述实时数据导入到所述非监督学习模型进行预测以得到预测结果,当所述预
测结果确定所述设备为故障设备时,对所述设备进行标记;所述利用遗传算法对k均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型,具体包括:
[0080]
步骤一:从样本集x中随机选择k个样本x
radom
作为每个聚类结果的聚类中心,其中radom表示在[1,n]之间随机选择的整数,构造初始聚类中心集
[0081]
步骤二:依次计算并比较每一个样本xi到每一个聚类中心c
p
的距离dis(xi,c
p
),1≤p≤k,将样本xi分配到距离最近的聚类中心的类簇中,得到k个类簇{s1,s2,s3,...,sk},其中x
id
表示xi的第d维数据,c
pd
表示聚类中心c
p
的第d维数据,1≤d≤m;
[0082]
步骤三:构造每个类簇s
p
的最小值向量和最大值向量根据所述最小值向量和最大值向量进行二进制编码构造染色体,重复多次编码构造多个染色体,多个染色体构造成初始种群;
[0083]
其中所述遗传算法的适应度函数其中,q表示类簇s
p
中的样本数量,表示类簇s
p
中第j个样本的第d维数据,1≤j≤q;
[0084]
根据所述适应度函数,获取出最优解并将该最优解更新为类簇s
p
的聚类中心c
p

[0085]
步骤四:重复步骤三,完成k个类簇{s1,s2,s3,...,sk}的聚类中心的更新;
[0086]
步骤五:比较更新前后的每个类簇的聚类中心是否一致,若不一致,则返回步骤二后继续执行;若一致,则得到最终的k个类簇{s1,s2,s3,...,sk}的聚类中心,聚类分析完成,得到设备异常检测模型。
[0087]
在一个具体的实施例中,所述设备包括家庭多媒体自由终端。
[0088]
在一个具体的实施例中,所述状态检测数据包括cpu温度、cpu使用率、ram占用率、网速。
[0089]
在一个具体的实施例中,所述构造每个类簇s
p
的最小值向量和最大值向量包括:获取类簇s
p
的q个样本xq的每个维度的最小值和最大值其中,根据所述每个维度的最小值和最大值构成出最小值向量以及最大值向量根据所述最小值向量和最大值向量确定m个约束条件根据所述m个约束条件,进行二进制编码构造染色体。
[0090]
所述步骤三还包括:对初始种群中的每个染色体,利用适应度函数进行选择后,进行交叉、变异操作完成一轮染色体更新,得到新的种群;重复多轮染色体更新,检查是否满足终止条件,当满足终止条件时,则终止染色体更新,获取出最优解
[0091]
实施例3
[0092]
根据本发明实施例,提供了一种非易失性存储介质。非易失性存储介质中包括存储的程序,其中,程序在运行时会控制非易失性存储介质所在设备执行如下异类检测方法方法:获取设备的状态检测数据,该状态检测数据构成历史数据;对所述历史数据进行数据处理,得到训练数据样本集;利用遗传算法对k均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型;获取设备的最新状态检测数据,该最新状态检测数据构成实时数据;将所述实时数据导入到所述非监督学习模型进行预测以得到预测结果,当所述预测结果确定所述待设备为故障设备时,对所述设备进行标记。
[0093]
实施例4
[0094]
根据本发明实施例,还提供了一种用于设备的故障检测装置结构图。图3是根据本发明实施例提供的一种用于设备的故障检测装置结构图,包括指令的计算机可读存储介质,例如包括指令的存储器704,上述指令可由一种用于设备的故障检测装置结构图的处理器702执行以完成以下异类检测方法:获取设备的状态检测数据,该状态检测数据构成历史数据;对所述历史数据进行数据处理,得到训练数据样本集;利用遗传算法对k均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型;获取设备的最新状态检测数据,该最新状态检测数据构成实时数据;将所述实时数据导入到所述非监督学习模型进行预测以得到预测结果,当所述预测结果确定所述待设备为故障设备时,对所述设备进行标记。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
[0095]
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0096]
在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0097]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0098]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的
介质。
[0099]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

技术特征:
1.一种异常检测方法,其特征在于:该方法包括:获取设备的状态检测数据,该状态检测数据构成历史数据;对所述历史数据进行数据处理,得到训练数据样本集x={x1,x2,x3,...,x
n
},其中x
i
=[x
i1
,x
i2
,x
i3
,...,x
im
]表示第i个样本,1≤i≤n,n表示训练数据样本集的样本个数,m表示每个样本的维数;利用遗传算法对k均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型;获取设备的最新状态检测数据,该最新状态检测数据构成实时数据;将所述实时数据导入到所述非监督学习模型进行预测以得到预测结果,当所述预测结果确定所述设备为故障设备时,对所述设备进行标记;所述利用遗传算法对k均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型,具体包括:步骤一:从样本集x中随机选择k个样本x
radom
作为每个聚类结果的聚类中心,其中radom表示在[1,n]之间随机选择的整数,构造初始聚类中心集步骤二:依次计算并比较每一个样本x
i
到每一个聚类中心c
p
的距离dis(x
i
,c
p
),1≤p≤k,将样本x
i
分配到距离最近的聚类中心的类簇中,得到k个类簇{s1,s2,s3,...,s
k
},其中x
id
表示x
i
的第d维数据,c
pd
表示聚类中心c
p
的第d维数据,1≤d≤m;步骤三:构造每个类簇s
p
的最小值向量和最大值向量根据所述最小值向量和最大值向量进行二进制编码构造染色体,重复多次编码构造多个染色体,多个染色体构造成初始种群;其中所述遗传算法的适应度函数其中,q表示类簇s
p
中的样本数量,表示类簇s
p
中第j个样本的第d维数据,1≤j≤q;根据所述适应度函数,获取出最优解并将该最优解更新为类簇s
p
的聚类中心c
p
;步骤四:重复步骤三,完成k个类簇{s1,s2,s3,...,s
k
}的聚类中心的更新;步骤五:比较更新前后的每个类簇的聚类中心是否一致,若不一致,则返回步骤二后继续执行;若一致,则得到最终的k个类簇{s1,s2,s3,...,s
k
}的聚类中心,聚类分析完成,得到设备异常检测模型。2.根据权利要求1所述的异常检测方法,其特征在于,所述设备包括家庭多媒体自由终端。3.根据权利要求1所述的异常检测方法,其特征在于,所述状态检测数据包括cpu温度、cpu使用率、ram占用率、网速。4.根据权利要求1所述的异常检测方法,其特征在于,所述构造每个类簇s
p
的最小值向
量和最大值向量包括:获取类簇s
p
的q个样本x
q
的每个维度的最小值和最大值其中,根据所述每个维度的最小值和最大值构成出最小值向量以及最大值向量根据所述最小值向量和最大值向量确定m个约束条件根据所述m个约束条件,进行二进制编码构造染色体。5.根据权利要要求1所述的异常检测方法,所述步骤三还包括:对初始种群中的每个染色体,利用适应度函数进行选择后,进行交叉、变异操作完成一轮染色体更新,得到新的种群;重复多轮染色体更新,检查是否满足终止条件,当满足终止条件时,则终止染色体更新,获取出最优解x
*p
。6.一种用于设备的故障检测装置,其特征在于,包括:第一获取模块,用于获取设备的状态检测数据,该状态检测数据构成历史数据;处理模块,用于对所述历史数据进行数据处理,得到训练数据样本集x={x1,x2,x3,...,x
n
},其中x
i
=[x
i1
,x
i2
,x
i3
,...,x
im
]表示第i个样本,1≤i≤n,n表示训练数据样本集的样本个数,m表示每个样本的维数;分析模块,用于利用遗传算法对k均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型;第二获取模块,用于获取设备的最新状态检测数据,该最新状态检测数据构成实时数据;将所述实时数据导入到所述非监督学习模型进行预测以得到预测结果,当所述预测结果确定所述设备为故障设备时,对所述设备进行标记;所述利用遗传算法对k均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型,具体包括:步骤一:从样本集x中随机选择k个样本x
radom
作为每个聚类结果的聚类中心,其中radom表示在[1,n]之间随机选择的整数,构造初始聚类中心集步骤二:依次计算并比较每一个样本x
i
到每一个聚类中心c
p
的距离dis(x
i
,c
p
),1≤p≤k,将样本x
i
分配到距离最近的聚类中心的类簇中,得到k个类簇{s1,s2,s3,...,s
k
},其中x
id
表示x
i
的第d维数据,c
pd
表示聚类中心c
p
的第d维数据,1≤d≤m;步骤三:构造每个类簇s
p
的最小值向量和最大值向量根据所述最小值向量和最大值向量进行二进制编码构造染色体,重复多次编码构造多个染色体,多个染色体构造成初始种群;其中所述遗传算法的适应度函数其中,q表示类簇s
p
中的样本数量,表示类簇s
p
中第j个样本的第d维数据,1≤j≤q;根据所述适应度函数,获取出最优解并将该最优解更新为类簇s
p
的聚类中心
c
p
;步骤四:重复步骤三,完成k个类簇{s1,s2,s3,...,s
k
}的聚类中心的更新;步骤五:比较更新前后的每个类簇的聚类中心是否一致,若不一致,则返回步骤二后继续执行;若一致,则得到最终的k个类簇{s1,s2,s3,...,s
k
}的聚类中心,聚类分析完成,得到设备异常检测模型。7.根据权利要求1所述的异常检测装置,其特征在于,所述设备包括家庭多媒体自由终端。8.根据权利要求1所述的异常检测装置,其特征在于,所述状态检测数据包括cpu温度、cpu使用率、ram占用率、网速。9.根据权利要求1所述的异常检测装置,其特征在于,所述构造每个类簇s
p
的最小值向量和最大值向量包括:获取类簇s
p
的q个样本x
q
的每个维度的最小值和最大值其中,根据所述每个维度的最小值和最大值构成出最小值向量以及最大值向量根据所述最小值向量和最大值向量确定m个约束条件根据所述m个约束条件,进行二进制编码构造染色体。10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有用于执行权利要求1-5任意一项的方法的程序。

技术总结
本发明涉及一种异常检测方法、装置以及计算机存储介质,该方法包括:获取设备的状态检测数据,该状态检测数据构成历史数据;对所述历史数据进行数据处理,得到训练数据样本集;利用遗传算法对K均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型;获取设备的最新状态检测数据,该最新状态检测数据构成实时数据;将所述实时数据导入到所述非监督学习模型进行预测以得到预测结果,当所述预测结果确定所述待设备为故障设备时,对所述设备进行标记。本发明解决了由于现有技术中采用常规的K均值聚类算法收敛速度慢、计算效率低的技术问题。算效率低的技术问题。算效率低的技术问题。


技术研发人员:尹继圣 刘大照 黄文曦 李航 朱正伟
受保护的技术使用者:深圳感臻智能股份有限公司
技术研发日:2023.04.12
技术公布日:2023/7/28
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐