基于频域注意力的SAR图像舰船尾迹检测方法

未命名 09-22 阅读:66 评论:0

基于频域注意力的sar图像舰船尾迹检测方法
技术领域
1.本发明涉及合成孔径雷达(sar)目标检测技术领域,特别是涉及一种基于频域注意力的sar图像舰船尾迹检测方法。


背景技术:

2.合成孔径雷达(sar)不受光照、天气等条件的影响,具有全天时、全天候的强大监视能力,已经被广泛应用于海洋港口和海战场指挥等场景。sar通过检测舰船尾迹来实现准确、高效的舰船定位。舰船尾迹不仅可以帮助检测舰船,还可以通过尾流特征来反演舰船状态,包括航速、航向等信息。因此开展sar图像舰船尾迹检测的研究,在维护海洋安全、监管海上交通等方面具有广阔的应用前景。
3.近年来,深度学习方法已成功应用于sar图像中的目标检测。然而,传统的检测方法在sar图像舰船尾迹检测仍然存在很大的问题。相比于海洋背景下的舰船定位,舰船尾迹的条纹常常与海岸线、溢油和海洋内波等线性结构特征相混淆。单纯的舰船检测方法只能识别舰船目标,获取舰船信息有限,并不能有效利用尾迹信息。因此如何高效准确的检测sar图像舰船尾迹是一项亟需解决的重要问题。


技术实现要素:

4.本发明目的是为了解决现有技术中的问题,提出了一种基于频域注意力的sar图像舰船尾迹检测方法。
5.本发明是通过以下技术方案实现的,本发明提出基于频域注意力的sar图像舰船尾迹检测方法,所述方法包括:
6.步骤1:对数据集进行预处理增强,将增强后的数据集按照比例划分为训练集、验证集以及测试集;
7.步骤2:对输入图像进行特征提取,选取fcanet为骨干网络,通过离散余弦变换从输入图像中提取频域信息;
8.步骤3:改进金字塔特征提取模块fpn,在金字塔的三层至七层上进行特征融合,在三层至五层上应用msam,通过卷积层转换到相邻特征图,从而融合信息;
9.步骤4:使用包含多个卷积核的分类头和obb回归头对特征进行多任务回归,并赋予权重系数以适应舰船尾迹的场景,最终得到检测结果并进行可视化。
10.进一步地,在步骤1中,所述数据集为高分三号舰船尾迹数据集,对使用的数据集进行旋转、平移和翻转预处理操作来增强数据。
11.进一步地,在步骤2中,通过fcanet在卷积过程中执行离散余弦变换以选择性的提取图像特征,fcanet骨干网络将通道划分成n等分,先分别计算出通道注意力中每个频率分量的结果,再根据所得结果筛选出k个性能最佳的频率分量。
12.进一步地,在步骤3中,利用特征金字塔提取目标的多尺度特征,改进特征金字塔网络中的特征融合步骤,在特征图的每个元素中进行具有相邻尺度间空间相关性的上下文
信息加权编码,msam对高层特征图和浅层特征图进行卷积,生成具有相同通道数的特征图,然后重塑为长向量并通过全连接层。
13.进一步地,2d离散余弦变换dct有:
[0014][0015]
其中x(i,j)是输入,h是输入图像的高,w是输入图像的宽;相应的2d离散余弦逆变换idct可以写成:
[0016][0017]
通道注意力机制通过标量来表示并评估每个通道的重要程度,输入特征x∈rh×w×c沿通道维度分为m组,x∈rh×w×c[x0,x1,x2…
x
m-1
],每组中的通道数为使用2d-dct计算出对应每个部分的频率分量:
[0018][0019]
其中freqn∈rc是计算得到的频率分量,通过级联来获得整个通道的注意力权重为:
[0020]
w=sigmoid(fc(compress([x0,x1,x2…
x
m-1
]))
[0021]
=sigmoid(fc(conactenation([freq0,freq1,freq2…
freq
m-1
]))
[0022]
其中sigmoid是sigmoid函数,fc表示映射函数。
[0023]
进一步地,在fpn的c
3-c7进行特征融合,并在c
3-c5应用msam,通过卷积层转换相邻特征图,并将它们融合到一起,对高层信息和浅层信息进行变换;首先分别对高层特征图ch和浅层特征图c
l
进行1
×
1卷积,生成具有相同通道数的特征图mh和m
l
,然后将mh和m
l
重塑为长向量并通过全连接层得到bh和(b
l
)
t
,接下来通过softmax函数计算相邻特征图之间的注意力权重分布h:
[0024][0025]
其中分别为对应特征图的x位置,a=h
×
w代表特征图所有点的总数;最后对h进行重塑和矩阵乘法以及softmax层来获得空间注意力映射,并与低级特征图m
l
进行相加得到输出p
l

[0026]
p
l
=rs(h
tah
)+m
l
[0027]
通过上式将fpn的高层信息和浅层信息进行聚合,通过学习权重矩阵将全局特征与原始特征图结合来获得具有上下文关系的特征。
[0028]
进一步地,分类头的损失函数为:
[0029][0030]
其中,a表示检测结果,a

表示真实值标签,n表示锚框的总数,l
focal
为聚焦损失:
[0031]
l
focal
(ai,a
′i)=-(1-a
′i)
η
log(a
′i)
[0032][0033]
其中η为超参数。
[0034]
进一步地,obb回归的参数包括预定义锚框参数(x0,y0,w0,h0,θ0)和预测框参数(x,y,w,h,θ),预测框与预定义锚框输出结果的偏移量offset=(xs,ys,ws,hs,θs)为:
[0035][0036][0037]
θs=tan(θ-θ0)
[0038]
其中x,x0分别为预测框和预定义锚框的中心点横坐标,y,y0分别为预测框和预定义锚框的中心点纵坐标,w,w0分别为预测框和预定义锚框的宽度,h,h0分别为预测框和预定义锚框的高度,θ,θ0分别为预测框和预定义锚框的旋转角度;
[0039]
真实值框参数(x

,y

,w

,h



),预测框与预定义锚框输出结果的偏移量offset

=(x
′s,y
′s,w
′s,h
′s,θ
′s)为:
[0040][0041][0042]
θ
′s=tan(θ
′‑
θ0)
[0043]
其中x

为真实值框的中心点横坐标,y

为真实值框的中心点纵坐标,w

为真实值框的宽度,h

为真实值框的高度,θ

为真实值框的旋转角度;
[0044]
使用五参数损失函数l
obb

[0045][0046]
l
smooth1
=l(x
′s,xs)+l(y
′s,ys)+l(w
′s,ws)+l(h
′s,hs)+l(θ
′s,θs)
[0047]
l
smooth2
=l(x
′s,xs)+l(y
′s,ys)+l(w
′s,hs)+l(h
′s,ws)+l(θ
′s,θ
s-π/2)
[0048]
其中l
smooth1,2
为平滑损失由此得到网络模型在训练阶段的损失函数为:
[0049]
l(a,b)=αl
class
(a,a

)+βl
obb
(b,b

)
[0050]
其中a,b表示检测结果,a

,b

表示真实值标签α,β为超参数。
[0051]
本发明提出一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述基于频域注意力的sar图像舰船尾迹检测方法
的步骤。
[0052]
本发明提出一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时实现所述基于频域注意力的sar图像舰船尾迹检测方法的步骤。
[0053]
与现有技术相比,本发明的有益效果是:
[0054]
本发明提出了一种基于频域注意力的sar图像舰船尾迹检测方法,所述方法用于舰船尾迹检测,该方法通过图像的频域信息来提取尾流特征。然后通过特征金字塔产生多尺度的特征表示,增强了相邻特征图间的信息融合。实现了高效准确的检测sar图像舰船尾迹。
附图说明
[0055]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0056]
图1为基于频域注意力的sar图像舰船尾迹检测方法的流程示意图。
[0057]
图2为深度学习网络的结构框架图。
[0058]
图3为实施例中输入数据图像。
[0059]
图4为实施例中输出数据可视化图像。
具体实施方式
[0060]
下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0061]
本发明提出了一种新的基于卷积神经网络的sar图像舰船尾迹自动检测方法。为了更好地提取舰船以及尾迹的特征信息,该方法基于有锚框的单阶段检测器。fcanet骨干网络模型不仅可以提取不同频率的特征信息,还可以通过增加通道注意力间接提取舰船的频域特征。此外,为了有效地提取不同层次特征图之间的空间信息,本发明引入了多尺度注意力模块(msam)。该方法通过改进特征金字塔网络(feature pyramid network,fpn)中的特征融合步骤,在特征图的每个元素中进行具有相邻尺度间空间相关性的上下文信息加权编码,从而提高了fpn在不同尺度下的识别能力。
[0062]
本发明提出基于频域注意力的sar图像舰船尾迹检测方法,所述方法包括:
[0063]
步骤1:对数据集进行预处理增强,将增强后的数据集按照比例划分为训练集、验证集以及测试集;
[0064]
步骤2:对输入图像进行特征提取,选取fcanet为骨干网络,通过离散余弦变换从输入图像中提取频域信息;
[0065]
步骤3:改进金字塔特征提取模块fpn,在金字塔的三层至七层上进行特征融合,在三层至五层上应用msam,通过卷积层转换到相邻特征图,从而融合信息;
[0066]
步骤4:使用包含多个卷积核的分类头和obb回归头对特征进行多任务回归,并赋
予权重系数以适应舰船尾迹的场景,最终得到检测结果并进行可视化。
[0067]
在步骤1中,所述数据集为高分三号舰船尾迹数据集,首先对使用的数据集进行旋转、平移和翻转预处理操作来增强数据,接下来将数据集划分为训练集、验证集和测试集。最后设置训练参数。
[0068]
在步骤2中,通过fcanet在卷积过程中执行离散余弦变换(dct)以选择性的提取图像特征,fcanet骨干网络将通道划分成n等分,先分别计算出通道注意力中每个频率分量的结果,再根据所得结果筛选出k个性能最佳的频率分量。
[0069]
2d离散余弦变换dct有:
[0070][0071]
其中x(i,j)是输入,h是输入图像的高,w是输入图像的宽;相应的2d离散余弦逆变换idct可以写成:
[0072][0073]
通道注意力机制通过标量来表示并评估每个通道的重要程度,输入特征x∈rh×w×c沿通道维度分为m组,x∈rh×w×c[x0,x1,x2…
x
m-1
],每组中的通道数为使用2d-dct计算出对应每个部分的频率分量:
[0074][0075]
其中freqn∈rc是计算得到的频率分量,通过级联来获得整个通道的注意力权重为:
[0076]
w=sigmoid(fc(compress([x0,x1,x2…
x
m-1
]))
[0077]
=sigmoid(fc(conactenation([freq0,freq1,freq2…
freq
m-1
]))
[0078]
其中sigmoid是sigmoid函数,fc表示映射函数
[0079]
在步骤3中,利用特征金字塔提取目标的多尺度特征,改进特征金字塔网络中的特征融合步骤,在特征图的每个元素中进行具有相邻尺度间空间相关性的上下文信息加权编码,msam对高层特征图和浅层特征图进行卷积,生成具有相同通道数的特征图,然后重塑为长向量并通过全连接层。
[0080]
在fpn的c
3-c7进行特征融合,并在c
3-c5应用msam,通过卷积层转换相邻特征图,并将它们融合到一起,对高层信息和浅层信息进行变换;首先分别对高层特征图ch和浅层特征图c
l
进行1
×
1卷积,生成具有相同通道数的特征图mh和m
l
,然后将mh和m
l
重塑为长向量并通过全连接层得到bh和(b
l
)
t
,接下来通过softmax函数计算相邻特征图之间的注意力权重分布h:
[0081][0082]
其中分别为对应特征图的x位置,a=h
×
w代表特征图所有点的总数;最后
对h进行重塑和矩阵乘法以及softmax层来获得空间注意力映射,并与低级特征图m
l
进行相加得到输出p
l

[0083]
p
l
=rs(h
tah
)+m
l
[0084]
通过上式将fpn的高层信息和浅层信息进行聚合,通过学习权重矩阵将全局特征与原始特征图结合来获得具有上下文关系的特征。
[0085]
步骤4使用的是检测任务中常见的分类头和obb回归头,第一个分支负责分类,另一个分支负责obb回归。在此基础上,本发明还增加了一个包含rt层的子网络,用于预测尾流尖端位置和开尔文臂方向。
[0086]
在步骤4中,分类头的损失函数为:
[0087][0088]
其中,a表示检测结果,a

表示真实值标签,n表示锚框的总数,l
focal
为聚焦损失:
[0089]
l
focal
(ai,a
′i)=-(1-a
′i)
η
log(a
′i)
[0090][0091]
其中η为超参数。
[0092]
obb回归的参数包括预定义锚框参数(x0,y0,w0,h0,θ0)和预测框参数(x,y,w,h,θ),预测框与预定义锚框输出结果的偏移量offset=(xs,ys,ws,hs,θs)为:
[0093][0094][0095]
θs=tan(θ-θ0)
[0096]
其中x,x0分别为预测框和预定义锚框的中心点横坐标,y,y0分别为预测框和预定义锚框的中心点纵坐标,w,w0分别为预测框和预定义锚框的宽度,h,h0分别为预测框和预定义锚框的高度,θ,θ0分别为预测框和预定义锚框的旋转角度;
[0097]
真实值框参数(x

,y

,w

,h



),预测框与预定义锚框输出结果的偏移量offset

=(x
′s,y
′s,w
′s,h
′s,θ
′s)为:
[0098][0099][0100]
θ
′s=tan(θ
′‑
θ0)
[0101]
其中x

为真实值框的中心点横坐标,y

为真实值框的中心点纵坐标,w

为真实值框的宽度,h

为真实值框的高度,θ

为真实值框的旋转角度;
[0102]
使用五参数损失函数l
obb

[0103][0104]
l
smooth1
=l(x
′s,xs)+l(y
′s,ys)+l(w
′s,ws)+l(h
′s,hs)+l(θ
′s,θs)
[0105]
l
smooth2
=l(x
′s,xs)+l(y
′s,ys)+l(w
′s,hs)+l(h
′s,ws)+l(θ
′s,θ
s-π/2)
[0106]
其中l
smooth1,2
为平滑损失由此得到网络模型在训练阶段的损失函数为:
[0107]
l(a,b)=αl
class
(a,a

)+βl
obb
(b,b

)
[0108]
其中a,b表示检测结果,a

,b

表示真实值标签α,β为超参数。
[0109]
实施例
[0110]
本发明的目的是解决sar图像舰船尾迹的问题,并通过尾迹反演船舶导航信息。利用深度学习网络对舰船尾迹进行高效准确的自动化检测。为了实现以上所提目的,本发明实例提供了一种基于sar图像舰船尾迹检测的方法,其基本流程如图1所示,包括:
[0111]
步骤1:对数据集进行预处理增强,将增强后的数据集按照比例划分为训练集、验证集以及测试集。
[0112]
步骤2:对输入图像进行特征提取,选取fcanet为骨干网络,通过离散余弦变换从输入图像中提取频域信息。
[0113]
步骤3:改进金字塔特征提取模块,在金字塔的三层至七层上进行特征融合,在三层至五层上应用msam,通过卷积层转换到相邻特征图,从而融合信息。
[0114]
步骤4:使用包含多个卷积核的分类头和obb回归头对特征进行多任务回归,并赋予权重系数以适应舰船尾迹的场景,最终得到检测结果并进行可视化。
[0115]
步骤1中使用的数据集为高分三号舰船尾迹数据集,共485张图像(862对舰船和尾迹目标)。首先对使用的数据集进行预处理,包括旋转、平移、缩放、裁剪、翻转、图像混合、拼接等来增强数据。接下来进行数据集的划分,训练集占图像总数的80%,测试集占图像总数的20%(训练集和测试集随机生成),训练集中随机选择一部分作为验证集。训练时,输入图像固定为416
×
416。训练批次大小为3,训练迭代次数为100。
[0116]
步骤2中通过fcanet在卷积过程中执行dct以选择性的提取图像特征。对于2d离散余弦变换有:
[0117][0118]
其中x(i,j)是输入,h是输入图像的高,w是输入图像的宽。相应的2d离散余弦逆变换(idct)可以写成:
[0119][0120]
通道注意力机制通过标量来表示并评估每个通道的重要程度,输入特征x∈rh×w×c沿通道维度分为m组,x∈rh×w×c[x0,x1,x2…
x
m-1
],每组中的通道数为使用2d-dct可以计算出对应每个部分的频率分量:
[0121][0122]
其中freqn∈rc是计算得到的频率分量,可以通过级联来获得整个通道的注意力权重为:
[0123]
w=sigmoid(fc(compress([x0,x1,x2…
x
m-1
]))
[0124] =sigmoid(fc(conactenation([freq0,freq1,freq2…
freq
m-1
]))
[0125]
其中sigmoid是sigmoid函数,fc表示映射函数,通常全局平均池化是最常用的压缩方法,除此之外还有全局最大值池化和全局标准差池化等方法。
[0126]
步骤3中利用特征金字塔提取目标的多尺度特征,从而增强密集目标的检测能力,在fpn的c
3-c7进行特征融合,并在c
3-c5应用msam,通过卷积层转换相邻特征图,并将它们融合到一起,对高层信息和浅层信息进行变换。首先分别对高层特征图ch和浅层特征图c
l
进行1
×
1卷积,生成具有相同通道数的特征图mh和m
l
,然后将mh和m
l
重塑为长向量并通过全连接层得到bh和(b
l
)
t
,接下来通过softmax函数计算相邻特征图之间的注意力权重分布h:
[0127][0128]
其中分别为对应特征图的x位置,a=h
×
w代表特征图所有点的总数。最后对h进行重塑和矩阵乘法以及softmax层来获得空间注意力映射,并与低级特征图m
l
进行相加得到输出p
l

[0129]
p
l
=rs(h
tah
)+m
l
[0130]
通过上式将fpn的高层信息和浅层信息进行聚合,通过学习权重矩阵将全局特征与原始特征图结合来获得具有上下文关系的特征。
[0131]
步骤4为了得到较好的鲁棒性和稳定性本发明使用的是检测任务中常见的分类头和obb回归头,首先头部包含4个3
×
3的卷积核,接着通过1个3
×
3的卷积核以降低通道维度,第一个分支负责分类,另一个分支负责obb回归。分类头的损失函数为:
[0132][0133]
其中,a表示检测结果,a

表示真实值标签,n表示锚框的总数,l
focal
为聚焦损失:
[0134]
l
focal
(ai,a
′i)=-(1-a
′i)
η
log(a
′i)
[0135][0136]
其中η为超参数,在本发明中设置为2.0。obb回归的参数包括预定义锚框参数(x0,y0,w0,h0,θ0),预测框参数(x,y,w,h,θ),预测框与预定义锚框输出结果的偏移量offset=(xs,ys,ws,hs,θs)为:
prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic ram,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddr sdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synchlink dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,drram)。应注意,本发明描述的方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
[0154]
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,高密度数字视频光盘(digital video disc,dvd))、或者半导体介质(例如,固态硬盘(solid state disc,ssd))等。
[0155]
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本技术实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
[0156]
应注意,本技术实施例中的处理器可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本技术实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
[0157]
以上对本发明所提出的一种基于频域注意力的sar图像舰船尾迹检测方法进行了
详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

技术特征:
1.基于频域注意力的sar图像舰船尾迹检测方法,其特征在于:所述方法包括:步骤1:对数据集进行预处理增强,将增强后的数据集按照比例划分为训练集、验证集以及测试集;步骤2:对输入图像进行特征提取,选取fcanet为骨干网络,通过离散余弦变换从输入图像中提取频域信息;步骤3:改进金字塔特征提取模块fpn,在金字塔的三层至七层上进行特征融合,在三层至五层上应用msam,通过卷积层转换到相邻特征图,从而融合信息;步骤4:使用包含多个卷积核的分类头和obb回归头对特征进行多任务回归,并赋予权重系数以适应舰船尾迹的场景,最终得到检测结果并进行可视化。2.根据权利要求1所述的方法,其特征在于:在步骤1中,所述数据集为高分三号舰船尾迹数据集,对使用的数据集进行旋转、平移和翻转预处理操作来增强数据。3.根据权利要求2所述的方法,其特征在于:在步骤2中,通过fcanet在卷积过程中执行离散余弦变换以选择性的提取图像特征,fcanet骨干网络将通道划分成n等分,先分别计算出通道注意力中每个频率分量的结果,再根据所得结果筛选出k个性能最佳的频率分量。4.根据权利要求3所述的方法,其特征在于:在步骤3中,利用特征金字塔提取目标的多尺度特征,改进特征金字塔网络中的特征融合步骤,在特征图的每个元素中进行具有相邻尺度间空间相关性的上下文信息加权编码,msam对高层特征图和浅层特征图进行卷积,生成具有相同通道数的特征图,然后重塑为长向量并通过全连接层。5.根据权利要求3所述的方法,其特征在于:2d离散余弦变换dct有:其中x(i,j)是输入,h是输入图像的高,w是输入图像的宽;相应的2d离散余弦逆变换idct可以写成:通道注意力机制通过标量来表示并评估每个通道的重要程度,输入特征x∈r
h
×
w
×
c
沿通道维度分为m组,x∈r
h
×
w
×
c
[x0,x1,x2…
x
m-1
],每组中的通道数为使用2d-dct计算出对应每个部分的频率分量:其中freq
n
∈r
c
是计算得到的频率分量,通过级联来获得整个通道的注意力权重为:w=sigmoid(fc(compress([x0,x1,x2…
x
m-1
]))=sigmoid(fc(conactenation([freq0,freq1,freq2…
freq
m-1
]))其中sigmoid是sigmoid函数,fc表示映射函数。6.根据权利要求4所述的方法,其特征在于:在fpn的c
3-c7进行特征融合,并在c
3-c5应用msam,通过卷积层转换相邻特征图,并将它们融合到一起,对高层信息和浅层信息进行变换;首先分别对高层特征图c
h
和浅层特征图c
l
进行1
×
1卷积,生成具有相同通道数的特征图
m
h
和m
l
,然后将m
h
和m
l
重塑为长向量并通过全连接层得到b
h
和(b
l
)
t
,接下来通过softmax函数计算相邻特征图之间的注意力权重分布h:其中分别为对应特征图的x位置,a=h
×
w代表特征图所有点的总数;最后对h进行重塑和矩阵乘法以及softmax层来获得空间注意力映射,并与低级特征图m
l
进行相加得到输出p
l
:p
l
=rs(h
t
a
h
)+m
l
通过上式将fpn的高层信息和浅层信息进行聚合,通过学习权重矩阵将全局特征与原始特征图结合来获得具有上下文关系的特征。7.根据权利要求1所述的方法,其特征在于:分类头的损失函数为:其中,a表示检测结果,a

表示真实值标签,n表示锚框的总数,l
focal
为聚焦损失:l
focal
(a
i
,a

i
)=-(1-a

i
)
η
log(a

i
)其中η为超参数。8.根据权利要求7所述的方法,其特征在于:obb回归的参数包括预定义锚框参数(x0,y0,w0,h0,θ0)和预测框参数(x,y,w,h,θ),预测框与预定义锚框输出结果的偏移量offset=(x
s
,y
s
,w
s
,h
s

s
)为:)为:θ
s
=tan(θ-θ0)其中x,x0分别为预测框和预定义锚框的中心点横坐标,y,y0分别为预测框和预定义锚框的中心点纵坐标,w,w0分别为预测框和预定义锚框的宽度,h,h0分别为预测框和预定义锚框的高度,θ,θ0分别为预测框和预定义锚框的旋转角度;真实值框参数(x

,y

,w

,h



),预测框与预定义锚框输出结果的偏移量offset

=(x

s
,y

s
,w

s
,h

s


s
)为:)为:θ

s
=tan(θ
′‑
θ0)其中x

为真实值框的中心点横坐标,y

为真实值框的中心点纵坐标,w

为真实值框的
宽度,h

为真实值框的高度,θ

为真实值框的旋转角度;使用五参数损失函数l
obb
:l
smooth1
=l(x

s
,x
s
)+l(y

s
,y
s
)+l(w

s
,w
s
)+l(h

s
,h
s
)+l(θ

s

s
)l
smooth2
=l(x

s
,x
s
)+l(y

s
,y
s
)+l(w

s
,h
s
)+l(h

s
,w
s
)+l(θ

s

s-π/2)其中l
smooth1,2
为平滑损失由此得到网络模型在训练阶段的损失函数为:l(a,b)=αl
class
(a,a

)+βl
obb
(b,b

)其中a,b表示检测结果,a

,b

表示真实值标签α,β为超参数。9.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-8任一项所述方法的步骤。10.一种计算机可读存储介质,用于存储计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1-8任一项所述方法的步骤。

技术总结
本发明提出基于频域注意力的SAR图像舰船尾迹检测方法。所述方法用于舰船尾迹检测,该方法通过图像的频域信息来提取尾流特征。然后通过特征金字塔产生多尺度的特征表示,增强了相邻特征图间的信息融合。实现了高效准确的检测SAR图像舰船尾迹。测SAR图像舰船尾迹。测SAR图像舰船尾迹。


技术研发人员:王路 刘浩东 亓宇航 李开誉 赵春晖
受保护的技术使用者:哈尔滨工程大学
技术研发日:2023.06.30
技术公布日:2023/9/20
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐