基于PPYoloe的配电设备目标检测方法
未命名
08-13
阅读:118
评论:0

基于ppyoloe的配电设备目标检测方法
技术领域
1.本发明属于计算机视觉技术领域,具体地,涉及基于ppyoloe的配电设备目标检测方法。
背景技术:
2.电力系统是涉及国家形象、民计民生,保障社会企业生产有序进行的庞大系统,在电网设备输电线路中缺陷检测、线路故障修复是电网企业普遍而重要的问题。通常发现和解决故障的人力资源是该任务成本的主要构成,并且电网工人的工作环境往往存在着一些安全隐患。随着图像识别技术的快速发展和广泛应用,其在输电线路上的防护设备佩戴监测、输电线路缺陷识别等任务上有了一定的研究和应用,且一再体现配电线路运检数字化、机器代人解决故障等技术越来越重要的作用。为了提高缺陷故障检测的效率和准确度、减少人力成本、避免工人直接接触危险环境,目标检测算法有着广泛而深刻的应用机遇。
3.广东电网有限公司广州供电局在其申请的专利文献“电网安全预警方法、装置、计算机设备和存储介质”(公布号:cn115620208a,申请号:cn202211395215.9,申请日:2022-11-09)中提供了电网监控设备结合目标检测算法的应用。该专利申请所公开方法的步骤包括:a.采集电力设备附近的多源监控数据;b.通过训练完成的目标检测模型,对所述多源监控数据进行目标检测处理;c.在从所述多源监控数据中检测到目标对象的情况下,对所述目标对象进行跟踪,确定所述目标对象的预测运动轨迹;d.当基于所述预测运动轨迹确定所述目标对象存在风险时,生成预警信息。该方法基本沿用了传统的目标检测模型。而在传统目标检测模型下,大部分监控图像中的人体行为、小目标检测、物体运动轨迹等目标对象,通常训练所得的效果并不理想。
4.国家电网有限公司信息通信分公司;南京南瑞信息通信科技有限公司在其申请的专利文献“一种针对电网缺失数据的智能补全方法及装置”(公布号:cn115587089a,申请号:cn202211343491.0,申请日:2022-10-31)中提供了电气工程结合gan生成对抗网络的模拟样本数据缺失处理的方法。其专利申请所公开方法的特征包括:s1:构建全局-局部生成对抗网络,包括;提取完整样本数据做随机缺失处理并标注缺失区域,构建成对的全局缺失数据集和完整数据集;基于全局缺失数据集和缺失区域的标注范围得到局部缺失数据集;全局生成器基于全局缺失数据集对缺失区域进行全局补全,得到全局补全数据;局部生成器基于局部缺失数据集对缺失区域进行局部补全,得到局部补全数据;将全局补全数据和局部补全数据输入判别器中进行识别,全局生成器和局部生成器、判别器交替训练生成全局-局部生成对抗网络;s2:基于全局-局部生成对抗网络对电网缺失区域进行补全。该方法在实际应用时,一些特殊情况如变电器上缠绕异物、呼吸器严重变色等,并非采用生成对抗网络即可解决缺失的数据,因为实际环境可能有多种异物如垃圾袋、风筝等,只用生成对抗网络很难得出详细的结果;又如呼吸器变色实际有相对固定的颜色域,对应了不同的寿命状态,并非生成其他颜色、让模型能够区分其变色即可,这些均需要实际的数据支撑。
5.综上所述,在现有的技术中,实现配电线路、电气工程相关的目标检测算法,通常
是基于开源的、具有普适性的目标检测模型的应用,如yolov3、yolox、faster-rcnn、mask-rcnn等,或是通过生成对抗网络等类似的方法,仅从深度学习算法工程角度上的提升一些准确率。但从电网设备实际工程环境角度的逻辑分析、通过监控图像的共性对模型内部结构改进的设计与实现并未涉及。
技术实现要素:
6.为解决现有技术存在的问题,本发明采用以下技术方案:
7.基于ppyoloe的配电设备目标检测方法,包括:
8.采集图像样本,并根据业务逻辑对所述图像样本进行标注处理;
9.对所述图像样本进行数据增强处理;
10.建立目标检测模型,并通过所述图像样本训练所述目标检测模型;
11.使用所述目标检测模型计算得到端对端结果,并根据所述业务逻辑对所述端对端结果进行后处理;
12.其中,所述目标检测模型包括输入模块、分类定位模块;所述输入模块包括主干网络、backbone注意力机制、路径聚合网络模块和neck注意力机制;
13.所述建立目标检测模型包括:
14.使用cspresnet网络作为所述主干网络;
15.使用ese注意力机制作为所述backbone注意力机制;
16.使用ca注意力机制作为所述neck注意力机制。
17.作为优选方案,所述对所述图像样本进行数据增强处理,包括:
18.对所述图像样本进行缩放处理;
19.采用填充因子对所述图像样本进行随机扩展;
20.对所述图像样本进行随机翻转和随机锐化处理。
21.作为优选方案,所述通过所述图像样本训练所述目标检测模型之前还包括:
22.设定训练的图像批大小和图像间隔;
23.根据所述图像批大小和图像间隔将所述图像样本进行随机缩放,随机缩放的过程中像素之间使用双线性随机插值补全,同时保留所述图像样本的向量之间的比例。
24.作为优选方案,所述双线性随机插值的公式表示如下:
[0025][0026][0027]
其中,为p点的x坐标插值,为p点的y坐标插值;p点表示以设定的原训练样本a点和原训练样本b点为对角形成的矩形中的随机点;xi为原训练样本a点的x坐标,xj为原训练样本b点的x坐标,yi为原训练样本a点的y坐标,yj为原训练样本b点的y坐标,θ表示随机生成的权重,θ∈[0,1]。
[0028]
作为优选方案,所述cspresnet网络用于提取图像样本特征并转换为特征图矩阵;所述cspresnet网络包括cbn模块和repvggblock模块;所述cbn模块包括3
×
3且步距为1的卷积核和正则化输入函数;所述repvggblock模块包括3x3且步距为1的卷积核和一个1x1且步距为1的卷积核。
[0029]
作为优选方案,所述repvggblock模块还包括激活函数;所述激活函数为silu激活函数。
[0030]
作为优选方案,所述ese注意力机制用于采用线性组合的方式对通道信息特征矩阵进行赋权,所述通道信息特征矩阵表示为:
[0031][0032]
其中,x∈rc×w×h,a
ch
(x)∈rc×1×1,rc×w×h表示c通道、宽为w、高为h的三维数组,c、w和h分别为特征图的通道数、宽度和高度;w
c/r
和wc分别表示两个全连接层的权重,w
c/r
,wc∈rc×1×1;δ是非线性激活函数relu函数,σ为sigmoid函数。
[0033]
作为优选方案,所述建立目标检测模型还包括:使用csppan网络作为所述路径聚合网络模块;所述csppan网络用于根据通道信息特征矩阵输出三个head矩阵,并对三个head矩阵进行随机赋权加和得到加和结果。
[0034]
作为优选方案,所述ca注意力机制用于对输入特征图进行计算赋权;所述计算赋权包括步骤:
[0035]
将输入特征图分为高度和宽度两个方向的特征图,分别进行全局平均池化;
[0036]
拼接组合所述两个方向的特征图,并通过卷积模块将特征图降低维度得到融合特征;
[0037]
将所述融合特征沿空间维数分解为两个单独的张量和;
[0038]
利用两个卷积核分别将所述张量和变换为具有相同通道数的张量的输入,得到注意力权重;
[0039]
根据所述注意力权重得到输出结果。
[0040]
作为优选方案,所述分类定位模块用于计算整体损失并调整模型内部参数,得到目标检测模型;所述整体损失表示为:
[0041][0042]
其中,α,β和γ分别为vfl交叉熵损失函数、dfl损失函数和giou损失函数的权重,n
pos
为正样本的数量,loss
vfl
为vfl交叉熵损失函数,loss
dfl
为dfl交叉熵损失函数,loss
giou
为giou损失函数,表示标准化后的目标分数
[0043]
与现有技术相比,本发明具有如下有益效果:
[0044]
本方法在目标检测算法模型上使用cspresnet网络作为主干网络、ese注意力机制作为backbone注意力机制、csppan网络作为路径聚合网络模块、ca注意力机制作为neck注意力机制的组合方式,与现有的ppyoloe模型相比提升了map指标,并在配电线路实际工程环境下达到更佳的泛化性和鲁棒性。
[0045]
本方法通过抽帧实际工程环境中的监控图像,精细化图像样本的标注,对所有与业务逻辑相关的识别目标进行应标尽标,在数据增强处理方面使用了缩放处理、随机扩展、随机翻转和随机锐化等手段,并在得到端对端结果后,通过对业务逻辑的分析,总结出了识别项之间的联系,并对算法输出结果进行了后处理,解决了以往配电线路目标检测任务中
图像逻辑模糊、样本质量低、样本集场景过于相似等问题。
附图说明
[0046]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0047]
图1为本发明的基于ppyoloe的配电设备目标检测方法的流程示意图;
[0048]
图2为本发明的目标检测模型的输入模块的结构示意图;
[0049]
图3为本发明的ese注意力机制的结构示意图。
具体实施方式
[0050]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0051]
请参阅图1,本发明提供了一种基于ppyoloe的配电设备目标检测方法,包括步骤:
[0052]
s1、采集图像样本,并根据业务逻辑对所述图像样本进行标注处理;
[0053]
s2、对所述图像样本进行数据增强处理;
[0054]
s3、建立目标检测模型,并通过所述图像样本训练所述目标检测模型;
[0055]
s4、使用所述目标检测模型计算得到端对端结果,并根据所述业务逻辑对所述端对端结果进行后处理。
[0056]
其中,所述目标检测模型基于ppyoloe模型,包括输入模块、分类定位模块;所述输入模块包括主干网络、backbone注意力机制、路径聚合网络模块和neck注意力机制。输入模块用于根据图像样本得到图像的特征矩阵。分类定位模块用于根据输入特征进行计算得到计算结果,并根据计算结果对模型内部参数调整得到最终模型。
[0057]
本发明配电设备目标检测方法的具体步骤如下:
[0058]
s1、采集图像样本,对所述图像样本进行标注处理;
[0059]
s11、从实际电网系统的摄像头中,固定某时间点采集图像,挑选其中没有明显遮挡、没有大面积背光和违章动作典型的图片作为高质量的图像样本。
[0060]
s12、对图像样本进行标注规范统一,细分如异物(风筝、塑料袋、浓烟)、工作环境(高处单杆、高处双杆、供电箱平台)等标注类型而非统一以“异物”标签进行标注。
[0061]
s2、对所述图像样本进行数据增强处理,具体为
[0062]
对图像样本进行颜色三通道、像素640x640的缩放处理,即将不同分辨率和颜色模式的图像进行统一处理,便于后续计算操作;
[0063]
采用[123.675,116.28,103.53]的填充因子对样本进行随机扩展;
[0064]
对含高空抛物逻辑以外的样本以0.5的比率进行随机翻转,并以0.5的比率进行随机锐化处理。
[0065]
数据增强处理使训练集中的图像得到扩充,模型泛化性、鲁棒性得到提升。
[0066]
s3、建立目标检测模型,并通过所述图像样本训练所述目标检测模型。
[0067]
作为本发明实施例的优选方案,所述通过所述图像样本训练所述目标检测模型之前还包括:
[0068]
对于数据增强后的样本,设定训练的图像批大小为16,在同批次里,图像以32像素为间隔,在[320,768]的大小范围进行随机缩放,随机缩放的过程中像素之间采用双线性随机插值的方式进行补全,同时保留样本中向量之间的比例。设定点a(xi,yi),b(xj,yj)为训练数据中随机抽取的两个样本,求以a、b作为对角形成的矩形中某点的插值,随机插值的公式如下所示:
[0069][0070][0071]
θ∈[0,1]
[0072]
其中,为p点的x坐标插值,为p点的y坐标插值,xi为原训练样本a的x坐标,xj为原训练样本b的x坐标,yi为原训练样本a的y坐标,yj为原训练样本b的y坐标,θ表示随机生成的权重。
[0073]
请结合图2,本发明的步骤s3中,建立目标检测模型具体为:
[0074]
s31、使用cspresnet网络作为主干网络,cspresnet网络是一种卷积神经网络,用于提取了送入算法的图片的特征,并转换为特征图矩阵供后续的网络使用。cspresnet网络是一个将跨阶段局部网络(cspnet)方法应用于resnet网络的网络,跨阶段局部网络将基本层的特征图分为两部分,然后通过跨阶段层次结构将它们合并,其拆分和合并策略的使用增加了通过网络的梯度流。cspresnet网络由一个cbn模块和一个repvggblock模块组成。其中,cbn模块由一个3
×
3、步距为1的卷积核和一个batchnorm函数(正则化输入函数)组成。batchnorm函数的均值为[0.485,0.456,0.406],标准差为[0.229,0.224,0.225];repvggblock模块由一个3x3且步距为1的卷积核和一个1x1且步距为1的卷积核共同组成。
[0075]
在本发明一优选实施例中,repvggblock模块将现有技术中的relu激活函数替换为了silu激活函数,silu激活函数公式如下:
[0076]
f(x)=x
·
sigmoid(x)
[0077]
其中
[0078]
repvggblock模块通过采用silu激活函数使其避免了神经元的死亡。由于部分场景(如变电站着火、室内冒烟、杆塔松动或倒塌等等)难以采集充足数据,而使用silu函数具有更多的非线性,在小数据集上得到了充分的拟合,对这些场景下的样本指标均有1%-3%不等的map指标提升。
[0079]
s32、使用ese注意力机制作为backbone注意力机制。在cspresnet主干网络中得出的特征后,采用ese注意力机制。ese注意力机制是一种高效的视觉注意力机制。具体的,如图2所示,ese注意力机制为单个全连接层构成的注意力,在全连接层采用线性组合的方式对特征矩阵进行赋权。ese注意力机制通过对通道信息特征矩阵的赋权,提升通道信息上的特征保留能力,并进行通道信息特征矩阵的权重赋值。对x∈rc×w×h的特征图,通道信息特征矩阵a
ch
(x)∈rc×1×1有如下计算公式:
[0080][0081]
其中,是一个通道敏感的全局均值池化函数,具体的,是一个通道敏感的全局均值池化函数,具体的,rc×w×h表示c通道、宽为w、高为h的三维数组,c、w和h分别为特征图的通道数、宽度和高度。w
c/r
,wc∈rc×1×1,w
c/r
和wc分别表示两个全连接层的权重,δ是非线性激活函数relu函数,σ为sigmoid函数。
[0082]
s33、使用csppan网络作为路径聚合网络模块。csppan网络用于根据通道信息特征矩阵输出三个head矩阵,并对三个head矩阵进行随机赋权加和。
[0083]
s34、使用ca注意力机制作为所述neck注意力机制。
[0084]
ca注意力机制用于对加和后的结果进行计算赋权。
[0085]
将上述加和后的结果作为输入特征图。将输入特征图分为高度和宽度两个方向,分别进行全局平均池化,公式如下:
[0086][0087][0088]
其中,为高度方向第c通道的输出,为宽度方向第c通道的输出,xc()为第c通道的输入特征图,h为特征图高度,w为特征图宽度。
[0089]
将以上两个方向的特征图通过直接拼接组合在一起,然后用1x1的卷积模块将其维度降低为原来的1/16,并将其进行特征融合变换操作得到融合特征。融合特征的表示如下:
[0090]
f=δ(f1([zh,zw]))
[0091]
其中δ为relu非线性激活函数,f1为空间维数的容和操作,zh,zw为对空间信息在水平方向和垂直方向进行编码的中间特征映射。然后沿空间维数将f分解为两个单独的张量和,利用两个卷积核分别将张量和变换为具有相同通道数的张量的输入,得到如下结果:
[0092]gh
=σ(fh(fh))
[0093]gw
=σ(fw(fw))
[0094]
其中gh,gw分别为高度和宽度方向的注意力权重,σ为sigmoid激活函数,fh,fw分别为张量沿高度、宽度方向的切分函数,fh,fw分别为融合特征在高度、宽度上的映射。则最终ca注意力机制输出的结果y如以下公式所示:
[0095][0096]
其中c为第c通道。
[0097]
通过ca注意力提高图像对宽度和高度的理解能力。
[0098]
进一步地,步骤s3还包括:s35、设计分类定位模块。分类定位模块通过模型初始的内部参数对输入特征进行计算得到计算结果,并根据图像的实际结果进行loss计算得到模型计算结果和实际结果的误差。然后用loss值为参考,对模型内部参数进行调整,使得模型
的结果通过如上一轮又一轮的调整不断地接近实际结果,最终得到一套与实际结果最接近的参数,这套参数就形成最终模型。利用得到的模型去对训练集之外的图像进行检测,观察是否能对不同场景下的目标都能正确检测。如若不行,则对模型进行相应的改进和调整,来提升模型的泛化能力和鲁棒性。
[0099]
分类定位模块可分为分类模块和定位模块。分类模块采用vfl(varifocal loss)交叉熵损失函数计算对正样本loss的权重,以让算法在高质量的正样本上侧重更多的权重,从而达到提升高质量样本贡献的结果。此外,定位模块采用dfl(distribution focal loss)损失函数和giou损失函数。其中,giou损失函数为更优的一种iou计算方法,其公式如下:
[0100][0101]
其中,iou是预测框和目标框的交并比。a和b分别代表预测框和目标框在最小凸包内的面积,c是最小凸包的面积。giou损失函数通过iou减去c中未覆盖a和b的面积占总面积的比值,从而得到更准确的iou判定方法。
[0102]
设定表示标准化后的目标分数,整体损失loss的表示如下所示:
[0103][0104]
其中,α,β和γ分别为vfl交叉熵损失函数、dfl损失函数和giou损失函数的权重,n
pos
为正样本的数量,loss
vfl
为vfl交叉熵损失。loss
giou
=1-giou,loss
dfl
为dfl交叉熵损失函数,loss
giou
为giou损失函数,loss
giou
和loss
dfl
共同组成了锚框定位的交叉熵损失。
[0105]
s4、使用所述目标检测模型计算得到端对端结果,并根据具体业务逻辑对所述端对端结果进行后处理。
[0106]
经过目标检测模型所计算可以得出基础的端对端结果,若需要结合多个标签进行判断输出,则根据相关的业务逻辑,对标签之间的组合或互斥关系进行分析总结,并通过结论对输出的结果进行后处理。
[0107]
在一实施例中,后处理具体为:
[0108]
在有无人扶梯的场景中,若有人扶梯和无人扶梯同时被检测出来,则对输出结果的矩阵坐标进行判断,如果有人扶梯的候选框与无人扶梯的候选框的ciou值超过0.8,且有人扶梯的置信度不低于(无人扶梯置信度
–
0.1),则不会报警;又如结果若包含多个无人扶梯,只要有任何一个无人扶梯未被覆盖则还是会报警。
[0109]
在另一实施例中,室内小动物场景中,若有施工人员在室内活动,在地上放的小瓶子等很容易被识别成某种小动物,而在真实场景中有施工人员一般不太需要检测小动物等功能,故在输出结果中,若带有施工人员的标签,则屏蔽一些诸如小动物告警等不必要的选项。
[0110]
上述实施例中置信度差等指标并非固定值,需根据工程经验和实际模型表现具体分析、调整。
[0111]
下面结合实验对本发明的效果做进一步的说明:
[0112]
首先,在目标检测模型的模型结构和主干网络的选择上,本发明测试了ppyoloe、mask-rcnn、ppyolov2、yolov5和faster-rcnn基础代表模型结构,计算结果如表1所示。
[0113]
表1
[0114]
模型结构主干网络map/%fpsmask-rcnnresnet50vd42.153.79faster-rcnnresnet50vd//ppyolov2cspresnet48.5311.63yolov5darknet5047.9811.09ppyoloecspresnet52.1812.22
[0115]
然后,本发明测试了在模型中各个位置添加eca、ese、cbam、simam等注意力对结果表现的改善,计算结果如表2所示。
[0116]
表2
[0117]
主干网络深度/宽度倍数backbone注意力neck注意力map/%fpscspdarknet1/1//72.818.14swintransformer1/1//68.894.22cspresnet1/1//73.898.27cspresnet1.33/1.25//72.137.99cspresnet1/1cbam/74.758.18cspresnet1/1ese/77.418.22cspresnet1/1/ca74.688.28cspresnet1/1eca/75.157.69cspresnet1/1eseca82.588.87
[0118]
上述实验的计算结果为用安全监督场景下的数据集在rtx3090显卡下的计算结果,计算结果包括map和fps。map是目标检测中评估模型性能的平均精度,以百分为单位;fps是在rtx3090下一秒钟可以检测出的图片数量。
[0119]
根据结果分析可知,采用ppyoloe模型结构,以cspresnet网络作为主干网络,ese注意力机制作为backbone注意力机制、ca注意力机制作为neck注意力机制可以对配电线路场景下的监控图像起到最大的提升作用。
[0120]
本方法通过采用基于paddle框架的ppyoloe的算法模型,提升了基础模型在配电线路环境下的目标检测任务能力,对于安全帽佩戴、安全带佩戴、高空抛物等安全监督性质的场景发挥了更好的效果。本方法通过抽帧实际工程环境中的监控图像,精细化图像样本的标注,对所有与业务逻辑相关的识别目标进行应标尽标,在数据增强处理方面使用了缩放处理、随机扩展、随机翻转和随机锐化等手段,并在得到端对端结果后,通过对业务逻辑的分析,总结出了识别项之间的联系,并对算法输出结果进行了后处理,解决了以往配电线路目标检测任务中图像逻辑模糊、样本质量低、样本集场景过于相似等问题。
[0121]
在目标检测算法模型上通过使用cspresnet网络作为主干网络、ese注意力机制作为backbone注意力机制、csppan网络作为路径聚合网络模块、ca注意力机制作为neck注意力机制的组合方式,与现有的ppyoloe模型相比提升了map指标,并在配电线路实际工程环境下的到了更佳的泛化性和鲁棒性。
[0122]
本发明的研究得到广东省高水平创新研究院项目支持的资助,项目标号为2021b090905008。
[0123]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0124]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0125]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0126]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0127]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
技术特征:
1.基于ppyoloe的配电设备目标检测方法,其特征在于:包括:采集图像样本,并根据业务逻辑对所述图像样本进行标注处理;对所述图像样本进行数据增强处理;建立目标检测模型,并通过所述图像样本训练所述目标检测模型;使用所述目标检测模型计算得到端对端结果,并根据所述业务逻辑对所述端对端结果进行后处理;其中,所述目标检测模型包括输入模块、分类定位模块;所述输入模块包括主干网络、backbone注意力机制、路径聚合网络模块和neck注意力机制;所述建立目标检测模型包括:使用cspresnet网络作为所述主干网络;使用ese注意力机制作为所述backbone注意力机制;使用ca注意力机制作为所述neck注意力机制。2.根据权利要求1所述的配电设备目标检测方法,其特征在于:所述对所述图像样本进行数据增强处理,包括:对所述图像样本进行缩放处理;采用填充因子对所述图像样本进行随机扩展;对所述图像样本进行随机翻转和随机锐化处理。3.根据权利要求1所述的配电设备目标检测方法,其特征在于:所述通过所述图像样本训练所述目标检测模型之前还包括:设定训练的图像批大小和图像间隔;根据所述图像批大小和图像间隔将所述图像样本进行随机缩放,随机缩放的过程中像素之间使用双线性随机插值补全,同时保留所述图像样本的向量之间的比例。4.根据权利要求3所述的配电设备目标检测方法,其特征在于:所述双线性随机插值的公式表示如下:公式表示如下:其中,为p点的x坐标插值,为p点的y坐标插值;p点表示以设定的原训练样本a点和原训练样本b点为对角形成的矩形中的随机点;x
i
为原训练样本a点的x坐标,x
j
为原训练样本b点的x坐标,y
i
为原训练样本a点的y坐标,y
j
为原训练样本b点的y坐标,θ表示随机生成的权重,θ∈[0,1]。5.根据权利要求1所述的配电设备目标检测方法,其特征在于:所述cspresnet网络用于提取图像样本特征并转换为特征图矩阵;所述cspresnet网络包括cbn模块和repvggblock模块;所述cbn模块包括3
×
3且步距为1的卷积核和正则化输入函数;所述repvggblock模块包括3x3且步距为1的卷积核和一个1x1且步距为1的卷积核。6.根据权利要求5所述的配电设备目标检测方法,其特征在于:所述repvggblock模块还包括激活函数;所述激活函数为silu激活函数。7.根据权利要求1所述的配电设备目标检测方法,其特征在于:所述ese注意力机制用于采用线性组合的方式对通道信息特征矩阵进行赋权,所述通道信息特征矩阵表示为:
其中,x∈r
c
×
w
×
h
,a
ch
(x)∈r
c
×1×1,r
c
×
w
×
h
表示c通道、宽为w、高为h的三维数组,c、w和h分别为特征图的通道数、宽度和高度;w
c/r
和w
c
分别表示两个全连接层的权重,w
c/r
,w
c
∈r
c
×1×1;δ是非线性激活函数relu函数,σ为sigmoid函数。8.根据权利要求1所述的配电设备目标检测方法,其特征在于:所述建立目标检测模型还包括:使用csppan网络作为所述路径聚合网络模块;所述csppan网络用于根据通道信息特征矩阵输出三个head矩阵,并对三个head矩阵进行随机赋权加和得到加和结果。9.根据权利要求1所述的配电设备目标检测方法,其特征在于:所述ca注意力机制用于对输入特征图进行计算赋权;所述计算赋权包括步骤:将输入特征图分为高度和宽度两个方向的特征图,分别进行全局平均池化;拼接组合所述两个方向的特征图,并通过卷积模块将特征图降低维度得到融合特征;将所述融合特征沿空间维数分解为两个单独的张量和;利用两个卷积核分别将所述张量和变换为具有相同通道数的张量的输入,得到注意力权重;根据所述注意力权重得到输出结果。10.根据权利要求1所述的配电设备目标检测方法,其特征在于:所述分类定位模块用于计算整体损失并调整模型内部参数,得到目标检测模型;所述整体损失表示为:其中,α,β和γ分别为vfl交叉熵损失函数、dfl损失函数和giou损失函数的权重,n
pos
为正样本的数量,loss
vfl
为vfl交叉熵损失函数,loss
dfl
为dfl交叉熵损失函数,loss
giou
为giou损失函数,表示标准化后的目标分数。
技术总结
本发明公开了一种基于PPYoloe的配电设备目标检测方法,属于计算机视觉技术领域。所述方法包括:采集图像样本,并对所述图像样本进行标注处理;对所述图像样本进行数据增强处理;建立目标检测模型,并通过所述图像样本训练所述目标检测模型;使用所述目标检测模型计算得到端对端结果,并根据所述业务逻辑对所述端对端结果进行后处理。本方法在目标检测算法模型上使用CSPResNet网络、ESE注意力机制、CSPPAN网络和CA注意力机制的组合方式,提升了模型的平均精度,并在配电线路实际工程环境下达到更佳的泛化性和鲁棒性;还通过数据标注、数据增强以及后处理,解决了图像逻辑模糊、样本质量低、样本集场景相似的问题。样本集场景相似的问题。样本集场景相似的问题。
技术研发人员:严体华 陈在新 杨粟 汪晶 贺露莹 张茜
受保护的技术使用者:西安电子科技大学广州研究院
技术研发日:2023.04.19
技术公布日:2023/8/9
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/