基于图像检索模型的处理方法、装置及其存储介质

未命名 08-18 阅读:110 评论:0


1.本发明涉及图像处理领域,特别涉及一种基于图像检索模型的处理方法、装置及其存储介质。


背景技术:

2.侨居建筑图像是研究侨居地区近现代文化、历史背景、人类生活和思想状况的有力依据,它通常包括壁画、装饰纹样、灯引纹样、建筑风格等几种类型图像。近年来不少学者针对侨居建筑开展了调研与分析工作,但是目前的研究都是通过手动查阅相关的资料或者实地探访进行,并且大多都是零散的侨居文化的调研与追踪,缺少一个对侨居历史和文化系统的、整体的研究方法,不能达到文化数据库的保存和缺失文化图像的修复的目的。
3.近数年来,采用传统方法的检索技术已经获得巨大的进展,它利用图片本身的底层特性,如色彩、图形、纹路、构造等,通过将它们融合在一起,构建出一个完整的全局特征描述符,从而实现了快速、准确的检索,但是常用的全局特征描述符进行检索容易受到多种因素的直接影响,比如裁剪、图片变形等常见的因素,从而导致图像检索准确率的降低。相关技术中推出了基于深度学习的图像检索技术,但是该检索方法对计算机硬件的要求较高,特征向量的维度较高,不仅限制了搜索的速度,而且也大大延长了搜索的时间。


技术实现要素:

4.本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种基于图像检索模型的处理方法、装置及其存储介质,能够提高图像检索的准确率,缩短图像检索时间,从而提高图像检索的效率。
5.本发明第一方面提出一种基于图像检索模型的处理方法,包括:
6.获取待训练的目标图像样本;
7.基于目标分类网络对所述目标图像样本进行分类,得到目标图像集;
8.构建目标检索网络;
9.通过所述目标检索网络对所述目标图像集进行特征提取和特征关注,得到融合图像特征;
10.利用对比损失函数对所述融合图像特征进行训练,得到图像检索模型;
11.获取待检索建筑图像,基于所述图像检索模型识别与所述待检索建筑图像相似的目标建筑图像,得到目标检索结果。
12.根据本发明提供的基于图像检索模型的处理方法,至少具有如下有益效果:获取待训练的目标图像样本;基于目标分类网络对所述目标图像样本进行分类,得到目标图像集;构建目标检索网络;通过所述目标检索网络对所述目标图像集进行特征提取和特征关注,得到融合图像特征;利用对比损失函数对所述融合图像特征进行训练,得到图像检索模型;获取待检索建筑图像,基于所述图像检索模型识别与所述待检索建筑图像相似的目标建筑图像,得到目标检索结果。根据本发明的技术方案,能够根据目标分类网络和目标检索
网络构建图像检索模型,通过图像检索模型识别与待检索建筑图像相似的目标建筑图像,得到目标检索结果,实现建筑图像的快速检索功能,能够提高图像检索的准确率,缩短图像检索时间,从而提高图像检索的效率。
13.根据本发明的一些实施例,所述目标分类网络包括依次连接的输入层、卷积层、池化层、全连接层和输出层,所述基于目标分类网络对所述目标图像样本进行分类,得到目标图像集,包括:
14.将所述目标图像样本依次输入至所述输入层、所述卷积层、所述池化层、所述全连接层,利用所述全连接层对所述目标图像样本进行分类得到分类结果并输入至所述输出层;
15.在所述输出层输出所述目标图像样本的分类结果;
16.根据所述分类结果得到所述目标图像集。
17.根据本发明的一些实施例,所述目标检索网络包括特征提取模块、通道注意力模块和空间注意力模块,所述通过所述目标检索网络对所述目标图像集进行特征提取和特征关注,得到融合图像特征,包括:
18.通过所述特征提取模块对所述目标图像集进行特征提取,得到目标图像特征;
19.将所述目标图像特征输入至所述通道注意力模块进行特征关注,得到通道注意力特征;
20.将所述通道注意力特征输入至所述空间注意力模块进行特征关注,得到融合注意力特征,并将所述融合注意力特征确定为融合图像特征。
21.根据本发明的一些实施例,所述将所述目标图像特征输入至所述通道注意力模块进行特征关注,得到通道注意力特征,包括:
22.将所述目标图像特征输入至所述通道注意力模块进行特征关注,得到通道注意力权重;
23.将所述通道注意力权重乘以所述目标图像特征,得到通道注意力特征。
24.根据本发明的一些实施例,所述将所述通道注意力特征输入至所述空间注意力模块进行特征关注,得到融合注意力特征,包括:
25.将所述通道注意力特征输入至所述空间注意力模块进行特征关注,得到空间注意力权重;
26.将所述空间注意力权重乘以所述目标图像特征,得到融合注意力特征。
27.根据本发明的一些实施例,所述获取待检索建筑图像,基于所述图像检索模型识别与所述待检索建筑图像相似的目标建筑图像,得到目标检索结果,包括:
28.响应于建筑图像的上传操作,得到第一待检索建筑图像;
29.基于所述图像检索模型识别与所述第一待检索建筑图像相似的第一目标建筑图像,得到第一目标检索结果;
30.在检索页面显示所述第一目标检索结果,并在服务器中预存所述第一待检索建筑图像和所述第一目标建筑图像的对应关系。
31.根据本发明的一些实施例,所述处理方法还包括:
32.响应于建筑图像的上传操作,得到第二待检索建筑图像;
33.将所述第二待检索建筑图像与预存的所述第一待检索建筑图像进行对比,得到对
比结果;
34.当所述对比结果显示不相同,基于所述图像检索模型识别与所述第二待检索建筑图像相似的第二目标建筑图像,得到第二目标检索结果。
35.根据本发明的一些实施例,所述处理方法还包括:
36.响应于建筑图像的上传操作,得到第三待检索建筑图像;
37.将所述第三待检索建筑图像与预存的所述第一待检索建筑图像进行对比,得到对比结果;
38.当所述对比结果显示相同,根据所述对应关系调取所述服务器中预存的所述第一目标建筑图像,得到第三目标检索结果。
39.本发明第二方面实施例提供一种运行装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面实施例所述的基于图像检索模型的处理方法。
40.根据本发明提供的运行装置,至少具有如下有益效果:获取待训练的目标图像样本;基于目标分类网络对所述目标图像样本进行分类,得到目标图像集;构建目标检索网络;通过所述目标检索网络对所述目标图像集进行特征提取和特征关注,得到融合图像特征;利用对比损失函数对所述融合图像特征进行训练,得到图像检索模型;获取待检索建筑图像,基于所述图像检索模型识别与所述待检索建筑图像相似的目标建筑图像,得到目标检索结果。根据本发明的技术方案,能够根据目标分类网络和目标检索网络构建图像检索模型,通过图像检索模型识别与待检索建筑图像相似的目标建筑图像,得到目标检索结果,实现建筑图像的快速检索功能,能够提高图像检索的准确率,缩短图像检索时间,从而提高图像检索的效率。
41.本发明第三方面实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于执行如第一方面实施例所述的基于图像检索模型的处理方法。
42.根据本发明提供的计算机可读存储介质,至少具有如下有益效果:获取待训练的目标图像样本;基于目标分类网络对所述目标图像样本进行分类,得到目标图像集;构建目标检索网络;通过所述目标检索网络对所述目标图像集进行特征提取和特征关注,得到融合图像特征;利用对比损失函数对所述融合图像特征进行训练,得到图像检索模型;获取待检索建筑图像,基于所述图像检索模型识别与所述待检索建筑图像相似的目标建筑图像,得到目标检索结果。根据本发明的技术方案,能够根据目标分类网络和目标检索网络构建图像检索模型,通过图像检索模型识别与待检索建筑图像相似的目标建筑图像,得到目标检索结果,实现建筑图像的快速检索功能,能够提高图像检索的准确率,缩短图像检索时间,从而提高图像检索的效率。
附图说明
43.本发明的附加方面和优点结合下面附图对实施例的描述中将变得明显和容易理解,其中:
44.图1是本发明一个实施例提供的基于图像检索模型的处理方法的流程图;
45.图2是本发明一个实施例提供的构建图像检索模型的流程图;
46.图3是图1中步骤s120的具体方法的流程图;
47.图4是图1中步骤s140的具体方法的流程图;
48.图5是图4中步骤s320的具体方法的流程图;
49.图6是图4中步骤s330的具体方法的流程图;
50.图7是图1中步骤s160的具体方法的流程图;
51.图8是本发明另一实施例提供的基于图像检索模型的处理方法的流程图;
52.图9是本发明又一实施例提供的基于图像检索模型的处理方法的流程图;
53.图10是本发明一个实施例的图像识别与检索模块的程序流程图;
54.图11是本发明一个实施例提供的运行装置的结构图。
具体实施方式
55.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
56.可以理解的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书、权利要求书或上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
57.本发明提供一种基于图像检索模型的处理方法、装置及其存储介质,能够提高图像检索的准确率,缩短图像检索时间,从而提高图像检索的效率。
58.下面结合附图,对本发明实施例作进一步阐述。
59.如图1和图2所示,本发明实施例提供的基于图像检索模型的处理方法可以包括但不限于有步骤s110、步骤s120、步骤s130、步骤s140、步骤s150和步骤s160。
60.步骤s110:获取待训练的目标图像样本;
61.步骤s120:基于目标分类网络对目标图像样本进行分类,得到目标图像集;
62.步骤s130:构建目标检索网络;
63.步骤s140:通过目标检索网络对目标图像集进行特征提取和特征关注,得到融合图像特征;
64.步骤s150:利用对比损失函数对融合图像特征进行训练,得到图像检索模型;
65.步骤s160:获取待检索建筑图像,基于图像检索模型识别与待检索建筑图像相似的目标建筑图像,得到目标检索结果。
66.可以理解的是,根据本发明的技术方案,能够根据目标分类网络和目标检索网络构建图像检索模型,通过图像检索模型识别与待检索建筑图像相似的目标建筑图像,得到目标检索结果,实现建筑图像的快速检索功能;相较于相关技术的基于模拟人脑的视觉皮质的图像检索模型的处理方法,本发明的处理方法不仅能够降低对计算机硬件的要求,还能够提高图像检索的准确率,缩短图像检索时间,从而提高图像检索的效率。
67.需要说明的是,在一个实施例中,目标图像样本可以是建筑图像样本,目标分类网络可以是深度残差网络(transfer learning-resnet50,tl-resnet50)。基于tl-resnet50的目标分类网络对建筑图像样本进行分类,得到目标图像集,便于后续根据目标图像集构
建图像检索模型。tl-resnet50目标分类网络加入残差学习的思想,能够解决深层网络中梯度弥散和精度下降的问题,能够提高图像分类的精度和速度。
68.需要说明的是,在一个实施例中,构建基于cbam(convolutional block attention module)的目标检索网络用于检索目标图像样本的特征,通过cbam目标检索网络对目标图像集进行特征提取和特征关注,得到融合图像特征,利用对比损失函数对融合图像特征进行训练,得到图像检索模型,基于目标检索模型识别与待检索建筑图像相似的目标检索图像,可以得到目标检索结果,从而实现建筑图像的快速检索功能,提高图像检索的效率和速度。采用cbam目标检索网络对建筑图像进行检索,cbam目标检索网络的融合注意力机制可以让图像检索模型自适应关注特征本身,突出图像的特征,能够提高图像检索的精确度。
69.需要说明的是,为了便于构建图像检索模型,需要对目标图像样本进行尺寸的归一化操作,即令建筑图像图片保持统一的尺寸。具体地,在一个实施例中,目标图像样本的图像尺寸设置为224*224*3。另外,需要采用四种数据增强的方法进行增广数据集,具体地,在一个实施例中,采用引入高斯噪声、椒盐噪声、直方图均衡以及限制对比度自适应直方图均衡的图像增广方式对目标图像样本进行图像增广处理,能够得到增广图像。图像增广技术通过对训练图像做一系列随机改变,来产生相似但又不同的训练样本,能够扩大训练数据集的规模,降低模型对某些属性的依赖,从而提高模型的泛化能力。
70.需要说明的是,利用对比损失函数对融合图像特征进行训练,能够提高类内图像的相似度。具体地,在一个实施例中,对比损失函数由以下计算公式得到:
[0071][0072]
其中,目标图像与增广图像构成正样本对,目标图像与其他图像构成负样本对,公式中的d
ij
为样本对间的欧式距离,y
ij
=1为正样本对,y
ij
=0为负样本对,[m-d
ij
]
+
=max(0,m-d
ij
)。在得到融合图像特征后,利用对比损失函数计算样本间的欧式距离,训练图像检索模型,能够基于图像检索模型识别与待检索建筑图像相似的目标建筑图像,得到目标检索结果,从而提高建筑图像检索的准确性。
[0073]
如图3所示,在一个实施例中,对基于图像检索模型的处理方法进行进一步的说明,目标分类网络包括依次连接的输入层、卷积层、池化层、全连接层和输出层,步骤s120可以包括但不限于有步骤s210、步骤s220和步骤s230。
[0074]
步骤s210:将目标图像样本依次输入至输入层、卷积层、池化层、全连接层,利用全连接层对目标图像样本进行分类得到分类结果并输入至输出层;
[0075]
步骤s220:在输出层输出目标图像样本的分类结果;
[0076]
步骤s230:根据分类结果得到目标图像集。
[0077]
可以理解的是,本发明使用tl-resnet50作为目标分类网络,可以基于tl-resnet50目标分类网络对目标图像样本进行分类,得到目标图像集。即将目标图像样本依次输入至输入层、卷积层、池化层、全连接层,利用全连接层对目标图像样本进行分类得到分类结果并输入至输出层,能够在输出层输出目标图像样本的分类结果,以得到目标图像集。
[0078]
例如,采用目标分类网络对侨居建筑图像进行分类,可以将侨居建筑图像分为壁
画、装饰纹样、灯引纹样、建筑风格等多种类型,根据分类结果可以得到目标图像集;目标图像集包括有多个目标图像特征信息,能够扩大图像特征分布的空间,提升图像特征的识别能力。
[0079]
如图4所示,在一个实施例中,对基于图像检索模型的处理方法进行进一步的说明,目标检索网络包括特征提取模块、通道注意力模块和空间注意力模块,步骤s140可以包括但不限于步骤s310、步骤s320和步骤s330。
[0080]
步骤s310:通过特征提取模块对目标图像集进行特征提取,得到目标图像特征;
[0081]
步骤s320:将目标图像特征输入至通道注意力模块进行特征关注,得到通道注意力特征;
[0082]
步骤s330:将通道注意力特征输入至空间注意力模块进行特征关注,得到融合注意力特征,并将融合注意力特征确定为融合图像特征。
[0083]
可以理解的是,通过目标检索网络的特征提取模块进行特征提取,以及通过通道注意力模块和空间注意力模块进行特征关注,可以得到融合注意力特征(融合图像特征)。利用vgg16网络作为骨干网络,在特征提取模块中融合注意力机制让图像检索模型自适应关注特征本身,能够突出目标图像的特征,从而提高图像检索的精确度。
[0084]
如图5所示,在一个实施例中,对基于图像检索模型的处理方法进行进一步的说明,步骤s320可以包括但不限于步骤s410和步骤s420。
[0085]
步骤s410:将目标图像特征输入至通道注意力模块进行特征关注,得到通道注意力权重;
[0086]
步骤s420:将通道注意力权重乘以目标图像特征,得到通道注意力特征。
[0087]
如图6所示,在一个实施例中,对基于图像检索模型的处理方法进行进一步的说明,步骤s330可以包括但不限于步骤s510和步骤s520。
[0088]
步骤s510:将通道注意力特征输入至空间注意力模块进行特征关注,得到空间注意力权重;
[0089]
步骤s520:将空间注意力权重乘以目标图像特征,得到融合注意力特征。
[0090]
可以理解的是,通过特征提取模块对目标图像集进行特征提取后,可以得到目标图像特征;将目标图像特征输入至通道注意力模块(channel attention module,cam),可以得到通道注意力权重,将获得的一系列通道注意力权重乘以输入的目标图像特征,可以得到通道注意力特征;将通道注意力特征输入至空间注意力模块(spatial attention module,sam),可以得到空间注意力权重,将获得的空间注意力权值乘以输入的目标图像特征,可以得到融合注意力特征。最后将输出的融合注意力特征通过与相同类别图像的特征向量进行距离度量,和排序,使用对比损失函数对融合注意力特征(融合图像特征)进行训练,可以得到图像检索模型,进而根据检索模型识别待检索建筑图像,能够返回距离最近的几组检索结果。
[0091]
如图7所示,在一个实施例中,对基于图像检索模型的处理方法进行进一步的说明,步骤s160可以包括但不限于步骤s610、步骤s620和步骤s630。
[0092]
步骤s610:响应于建筑图像的上传操作,得到第一待检索建筑图像;
[0093]
步骤s620:基于图像检索模型识别与第一待检索建筑图像相似的第一目标建筑图像,得到第一目标检索结果;
[0094]
步骤s630:在检索页面显示第一目标检索结果,并在服务器中预存第一待检索建筑图像和第一目标建筑图像的对应关系。
[0095]
可以理解的是,在一个实施例中,响应于建筑图像的上传操作,可以得到第一待检索建筑图像,基于图像检索模型识别与第一待检索建筑相似的第一目标建筑图像,可以得到第一目标检索结果,在检索页面显示第一目标检索结果,能够基于图像检索模型实现建筑图像的快速检索功能。另外,将第一待检索建筑图像和第一目标建筑图像预存在服务器中,可以缩短图像检索的速度,在实时待检索建筑图像与服务器中预存的历史待检索建筑图像相同的情况下,可以根据对应关系直接调取历史检索结果作为目标检索结果,能够提高图像检索的效率。
[0096]
如图8所示,在一个实施例中,对基于图像检索模型的处理方法进行进一步的说明,处理方法还包括但不限于步骤s710、步骤s720和步骤s730。
[0097]
步骤s710:响应于建筑图像的上传操作,得到第二待检索建筑图像;
[0098]
步骤s720:将第二待检索建筑图像与预存的第一待检索建筑图像进行对比,得到对比结果;
[0099]
步骤s730:当对比结果显示不相同,基于图像检索模型识别与第二待检索建筑图像相似的第二目标建筑图像,得到第二目标检索结果。
[0100]
可以理解的是,响应于建筑图像的上传操作后,可以得到第二待检索建筑图像,将第二待检索建筑图像与预存的第一待检索建筑图像进行对比,判断该第二待检索建筑图像是否已经检索,得到对比结果,当对比结果不相同(表示第二待检索建筑图像未被检索),进而采用图像检索模型识别与第二待检索建筑图像相似的第二目标建筑图像,得到第二目标检索结果。
[0101]
需要说明的是,当对比结果显示不相同的情况下,第二待检索建筑图像和第二目标建筑图像的对应关系也需要预存在服务器中,以便于后续重复检索时检索结果的及时调取,从而缩短图像检索的时间。
[0102]
如图9所示,在一个实施例中,对基于图像检索模型的处理方法进行进一步的说明,处理方法还包括但不限于步骤s810、步骤s820和步骤s830。
[0103]
步骤s810:响应于建筑图像的上传操作,得到第三待检索建筑图像;
[0104]
步骤s820:将第三待检索建筑图像与预存的第一待检索建筑图像进行对比,得到对比结果;
[0105]
步骤s830:当对比结果显示相同,根据对应关系调取服务器中预存的第一目标建筑图像,得到第三目标检索结果。
[0106]
可以理解的是,响应于建筑图像的上传操作后,可以得到第三待检索建筑图像,将第三待检索建筑图像与预存的第一待检索建筑图像进行对比,判断该第三待检索建筑图像是否已经检索,得到对比结果,当对比结果相同(表示第三待检索建筑图像已被检索),此时根据对应关系直接调取服务器中预存的第一目标建筑图像,即可得到第三目标检索结果,能够缩短图像检索的时间,提高图像检索的效率。由于第三待检索建筑图像与预存的第一待检索建筑图像相同,因此此时的第三目标检索结果与第一目标检索结果也相同。
[0107]
具体地,如图10所示,图10是本发明实施例的图像识别与检索模块的程序流程图。在一个实施例中,选择待检索建筑图像,点击搜索,判断待检索建筑图像是否已经检索;如
果判断结果为否,则调用图像检索模型识别与待检索建筑图像相似的目标建筑图像,将目标建筑图像显示在检索页面中,得到目标检索结果;如果判断结果为是,则根据对应关系直接调取服务器中预存的目标建筑图像,并将目标建筑图像显示在检索页面中,得到目标检索结果。本实施例采用实时检索和预存数据的方法对建筑图像进行检索,能够缩短图像检索的时间,提高图像检索的效率。
[0108]
需要说明的是,响应于建筑图像的上传操作,得到待检索建筑图像,上传图像后,服务器需要判断建筑图像是否已经上传,如果没有上传则将该建筑图像信息存至数据库中,如果建筑图像已经上传,则会在前端页面中提示该建筑图像已经存在,不会重新录入建筑图像信息。响应于检索页面的搜索操作,可以返回最相似的十张目标建筑图像作为目标检索结果,可以实现建筑图像的快速检索功能。另外,还可以对数据库的建筑图像信息进行增删改查操作。因此,本发明的技术方案可以提高图像检索的准确率,缩短图像检索时间,从而提高图像检索的效率。
[0109]
如图11所示,本发明第二方面实施例提供一种运行装置900,包括:存储器910、处理器920及存储在存储器910上并可在处理器920上运行的计算机程序,处理器920执行计算机程序时实现如第一方面实施例的基于图像检索模型的处理方法。
[0110]
处理器920和存储器910可以通过总线或者其他方式连接。
[0111]
实现上述实施例的基于图像检索模型的处理方法所需的非暂态软件程序以及指令存储在存储器910中,当被处理器920执行时,执行上述实施例中的基于图像检索模型的处理方法,例如,执行以上描述的图1中的方法步骤s110至方法步骤s160、图2中的方法步骤s210至步骤s230、图3中的方法步骤s310至步骤s330、图4中的方法步骤s410至方法步骤s420、图5中的方法步骤s510至方法步骤s520,图6中的方法步骤s610至方法步骤s630,图7中的方法步骤s710至方法步骤s730,图8中的方法步骤s810至方法步骤s830。
[0112]
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0113]
本发明第三方面实施例提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个处理器或控制器执行,例如,被上述运行装置900实施例中的一个处理器920执行,可使得上述处理器920执行上述实施例中的基于图像检索模型的处理方法,例如,执行以上描述的图1中的方法步骤s110至方法步骤s160、图2中的方法步骤s210至步骤s230、图3中的方法步骤s310至步骤s330、图4中的方法步骤s410至方法步骤s420、图5中的方法步骤s510至方法步骤s520,图6中的方法步骤s610至方法步骤s630,图7中的方法步骤s710至方法步骤s730,图8中的方法步骤s810至方法步骤s830。
[0114]
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、基站系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可
读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器910技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
[0115]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0116]
以上是对本发明的较佳实施进行了具体说明,但本发明并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的前提下还可作出种种的等同变形或替换,这些等同的变形或替换均包含在本发明权利要求所限定的范围内。

技术特征:
1.一种基于图像检索模型的处理方法,其特征在于,包括:获取待训练的目标图像样本;基于目标分类网络对所述目标图像样本进行分类,得到目标图像集;构建目标检索网络;通过所述目标检索网络对所述目标图像集进行特征提取和特征关注,得到融合图像特征;利用对比损失函数对所述融合图像特征进行训练,得到图像检索模型;获取待检索建筑图像,基于所述图像检索模型识别与所述待检索建筑图像相似的目标建筑图像,得到目标检索结果。2.根据权利要求1所述的基于图像检索模型的处理方法,其特征在于,所述目标分类网络包括依次连接的输入层、卷积层、池化层、全连接层和输出层,所述基于目标分类网络对所述目标图像样本进行分类,得到目标图像集,包括:将所述目标图像样本依次输入至所述输入层、所述卷积层、所述池化层、所述全连接层,利用所述全连接层对所述目标图像样本进行分类得到分类结果并输入至所述输出层;在所述输出层输出所述目标图像样本的分类结果;根据所述分类结果得到所述目标图像集。3.根据权利要求1所述的基于图像检索模型的处理方法,其特征在于,所述目标检索网络包括特征提取模块、通道注意力模块和空间注意力模块,所述通过所述目标检索网络对所述目标图像集进行特征提取和特征关注,得到融合图像特征,包括:通过所述特征提取模块对所述目标图像集进行特征提取,得到目标图像特征;将所述目标图像特征输入至所述通道注意力模块进行特征关注,得到通道注意力特征;将所述通道注意力特征输入至所述空间注意力模块进行特征关注,得到融合注意力特征,并将所述融合注意力特征确定为融合图像特征。4.根据权利要求3所述的基于图像检索模型的处理方法,其特征在于,所述将所述目标图像特征输入至所述通道注意力模块进行特征关注,得到通道注意力特征,包括:将所述目标图像特征输入至所述通道注意力模块进行特征关注,得到通道注意力权重;将所述通道注意力权重乘以所述目标图像特征,得到通道注意力特征。5.根据权利要求4所述的基于图像检索模型的处理方法,其特征在于,所述将所述通道注意力特征输入至所述空间注意力模块进行特征关注,得到融合注意力特征,包括:将所述通道注意力特征输入至所述空间注意力模块进行特征关注,得到空间注意力权重;将所述空间注意力权重乘以所述目标图像特征,得到融合注意力特征。6.根据权利要求1所述的基于图像检索模型的处理方法,其特征在于,所述获取待检索建筑图像,基于所述图像检索模型识别与所述待检索建筑图像相似的目标建筑图像,得到目标检索结果,包括:响应于建筑图像的上传操作,得到第一待检索建筑图像;基于所述图像检索模型识别与所述第一待检索建筑图像相似的第一目标建筑图像,得
到第一目标检索结果;在检索页面显示所述第一目标检索结果,并在服务器中预存所述第一待检索建筑图像和所述第一目标建筑图像的对应关系。7.根据权利要求6所述的基于图像检索模型的处理方法,其特征在于,所述处理方法还包括:响应于建筑图像的上传操作,得到第二待检索建筑图像;将所述第二待检索建筑图像与预存的所述第一待检索建筑图像进行对比,得到对比结果;当所述对比结果显示不相同,基于所述图像检索模型识别与所述第二待检索建筑图像相似的第二目标建筑图像,得到第二目标检索结果。8.根据权利要求6所述的基于图像检索模型的处理方法,其特征在于,所述处理方法还包括:响应于建筑图像的上传操作,得到第三待检索建筑图像;将所述第三待检索建筑图像与预存的所述第一待检索建筑图像进行对比,得到对比结果;当所述对比结果显示相同,根据所述对应关系调取所述服务器中预存的所述第一目标建筑图像,得到第三目标检索结果。9.一种运行装置,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至8任意一项所述的基于图像检索模型的处理方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于执行如权利要求1至8任意一项所述的基于图像检索模型的处理方法。

技术总结
本发明提出一种基于图像检索模型的处理方法、装置及其存储介质,其中基于图像检索模型的处理方法包括:获取待训练的目标图像样本;基于目标分类网络对所述目标图像样本进行分类,得到目标图像集;构建目标检索网络;通过所述目标检索网络对所述目标图像集进行特征提取和特征关注,得到融合图像特征;利用对比损失函数对所述融合图像特征进行训练,得到图像检索模型;获取待检索建筑图像,基于所述图像检索模型识别与所述待检索建筑图像相似的目标建筑图像,得到目标检索结果。根据本发明的技术方案,能够提高图像检索的准确率,缩短图像检索时间,从而提高图像检索的效率。从而提高图像检索的效率。从而提高图像检索的效率。


技术研发人员:高乐 杨田 吴炎青 张鑫
受保护的技术使用者:五邑大学
技术研发日:2023.05.05
技术公布日:2023/8/16
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐