一种基于深度多模型协同的半监督行人重识别方法及系统与流程
未命名
08-27
阅读:147
评论:0
1.本发明涉及半监督学习技术领域,具体涉及一种基于深度多模型协同的半监督行人重识别方法及系统。
背景技术:
2.行人再识别是实现智能安防的一项关键技术,给定一个场景中的一幅或者多幅行人的图像,行人再识别技术要求能够在其他不相邻的场景中找到与该图像匹配的行人的所有图像。在不同的场景中,光照条件的不同、行人姿态的变化、图像背景的变动、成像质量的差异通常会导致同一行人类内的变化大于不同行人类间的变化,这给行人再识别任务带来了严峻的挑战。
3.近年来,行人重识别技术在大规模数据集上达到了优秀的识别准确度,但是大多数方法都是在全监督学习的基础上提出的,由于需要大量人工标记的训练数据,监督学习在实际环境和工业场景中的价值本质是有限的。而现实情境下,在所有应用环境(比如大型购物中心、城市社区街道)中都进行大量数据标记是十分困难的,可以想象标注人员通过观看一组参数不同的相机在不同时间和不同地点拍摄到的视频记录并搜索定位同一个行人有多困难,因此,实际场景中行人重识别首先需要面对的问题就是标记数据的严重缺乏。为了克服全监督学习方法对大规模数据的严重依赖,已经出现了一些半监督或无监督学习方法,其中,半监督行人重识别方法通过结合少量标记数据和大量未标记数据,最大化利用监督信息并充分挖掘无监督信息,实现行人检索的目标。
技术实现要素:
4.针对现有技术中的缺陷,本发明提供一种基于深度多模型协同的半监督行人重识别方法及系统。
5.第一方面,一种基于深度多模型协同的半监督行人重识别方法,包括:
6.获取多个视图数据,根据所述多个视图数据构建训练样本集,所述训练样本集包括有标签训练样本和无标签训练样本;
7.获取多个异构神经网络模型,根据所述训练样本集对多个异构神经网络模型进行一次训练,得到初始模型;
8.基于所述初始模型交替迭代进行无标签训练样本的伪标签生成和多个异构神经网络模型的二次训练,直至生成目标伪标签。
9.进一步地,所述获取多个异构神经网络模型,根据所述训练样本集对多个异构神经网络模型进行一次训练,得到初始模型,具体为:
10.获取多个结构不同的深度神经网络模型,并训练所述多个深度神经网络模型作为多个视图下的特征提取器,以获取多个异构神经网络模型;
11.根据所述训练样本集对多个异构神经网络模型进行特征聚类,并得到无标签训练样本的伪标签;
12.基于带有所述伪标签的无标签训练样本和部分有标签训练样本对多个异构神经网络模型进行一次训练,以对所述多个异构神经网络模型的网络结构进行一次微调;
13.根据一次训练结果交替更新所述多个异构神经网络模型的网络结构和无标签训练样本的伪标签,得到初始模型。
14.进一步地,所述基于所述初始模型交替迭代进行无标签训练样本的伪标签生成和多个异构神经网络模型的二次训练,直至生成目标伪标签,包括:
15.基于所述初始模型对无标签训练样本进行特征提取,根据所提取的特征运用自适应权重多视图聚类方法对无标签训练样本进行特征聚类,得到无标签训练样本的初始伪标签;
16.根据所述有标签训练样本和带有所述初始伪标签的无标签训练样本进行数据融合,得到融合训练数据;
17.根据所述融合训练数据对多个异构神经网络模型进行二次训练,以二次微调所述多个异构神经网络模型的网络结构。
18.进一步地,所述基于所述初始模型交替迭代进行无标签训练样本的伪标签生成和多个异构神经网络模型的二次训练,直至生成目标伪标签,还包括:
19.交替迭代进行对无标签训练样本的特征聚类和对多个异构神经网络模型的二次训练,以更新所述初始伪标签和多个异构神经网络模型,直至所述初始伪标签不再更新,生成目标伪标签。
20.第二方面,一种基于深度多模型协同的半监督行人重识别系统,包括:
21.样本构建模块:用于获取多个视图数据,根据所述多个视图数据构建训练样本集,所述训练样本集包括有标签训练样本和无标签训练样本;
22.一次训练模块:用于获取多个异构神经网络模型,根据所述训练样本集对多个异构神经网络模型进行一次训练,得到初始模型;
23.二次训练模块:用于基于所述初始模型交替迭代进行无标签训练样本的伪标签生成和多个异构神经网络模型的二次训练,直至生成目标伪标签。
24.进一步地,所述一次训练模块具体用于:
25.获取多个结构不同的深度神经网络模型,并训练所述多个深度神经网络模型作为多个视图下的特征提取器,以获取多个异构神经网络模型;
26.根据所述训练样本集对多个异构神经网络模型进行特征聚类,并得到无标签训练样本的伪标签;
27.基于带有所述伪标签的无标签训练样本和部分有标签训练样本对多个异构神经网络模型进行一次训练,以对所述多个异构神经网络模型的网络结构进行一次微调;
28.根据一次训练结果交替更新所述多个异构神经网络模型的网络结构和无标签训练样本的伪标签,得到初始模型。
29.进一步地,所述二次训练模块具体用于:
30.基于所述初始模型对无标签训练样本进行特征提取,根据所提取的特征运用自适应权重多视图聚类方法对无标签训练样本进行特征聚类,得到无标签训练样本的初始伪标签;
31.根据所述有标签训练样本和带有所述初始伪标签的无标签训练样本进行数据融
合,得到融合训练数据;
32.根据所述融合训练数据对多个异构神经网络模型进行二次训练,以二次微调所述多个异构神经网络模型的网络结构。
33.进一步地,所述二次训练模块还用于:
34.交替迭代进行对无标签训练样本的特征聚类和对多个异构神经网络模型的二次训练,以更新所述初始伪标签和多个异构神经网络模型,直至所述初始伪标签不再更新,生成目标伪标签。
35.第三方面,一种基于深度多模型协同的半监督行人重识别系统,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如第一方面所述的方法。
36.第四方面,一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如第一方面所述的方法。
37.本发明的有益效果体现在:通过多个视图的训练样本对多个异构神经网络模型进行训练,训练过程中只需利用部分有标签训练样本和大量无标签训练样本进行训练,节省了大量有标签数据,并发挥多个异构神经网络特征的多样性对无标签训练样本进行特征提取,同时利用自适应权重多视图聚类方法对多个异构神经网络进行特征聚类,从而得到具有较好精确度的伪标签,能够在一个端到端的学习过程中实现标记数据的特征学习和未标记数据的伪标签估计,能够标记更多有质量的数据来提升特征学习的性能,取得更为突出的行人重识别性能。
附图说明
38.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
39.图1为本发明实施例一提供的一种基于深度多模型协同的半监督行人重识别方法的流程图;
40.图2为本发明实施例一提供的一种基于深度多模型协同的半监督行人重识别方法的示意图;
41.图3为本发明实施例一提供的一种基于深度多模型协同的半监督行人重识别系统的模块框图;
42.图4为本发明实施例二提供的一种基于深度多模型协同的半监督行人重识别系统的结构图。
具体实施方式
43.下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
44.需要注意的是,除非另有说明,本技术使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
45.如图1所示,一种基于深度多模型协同的半监督行人重识别方法,包括:
46.s1:获取多个视图数据,根据所述多个视图数据构建训练样本集,所述训练样本集包括有标签训练样本和无标签训练样本;
47.s2:获取多个异构神经网络模型,根据所述训练样本集对多个异构神经网络模型进行一次训练,得到初始模型;
48.s3:基于所述初始模型交替迭代进行无标签训练样本的伪标签生成和多个异构神经网络模型的二次训练,直至生成目标伪标签。
49.具体地,如图2所示,获取多个视图数据,所述多个视图数据包括有标签数据和无标签数据,根据多个视图数据构建训练样本集,并基于有无标签将训练数据集划分为有标签训练样本和无标签训练样本。
50.进一步地,获取多个结构不同的深度神经网络模型,并训练所述多个结构不同的深度神经网络模型作为多个视图下的特征提取器,以获取多个异构神经网络模型。所述神经网络模型的函数包括:
[0051][0052]
式中,m表示神经网络模型有m种形态的特征,x
l
和xu分别代表有标签和无标签的训练样本。n
l
和nu分别代表有标签和无标签训练样本的数目。w
υ
代表第υ个深度神经网络中的参数,y
l
和yu分别代表有标签的标签和无标签数据的伪标签。为深度神经网络的损失函数,代表多视图估计伪标签损失函数。
[0053]
本实施例中,深度神经网络的损失函数主要依据识别任务和验证任务,损失函数可表示为:
[0054][0055]
对于基础的特征区分性学习,将识别任务看作是一个多分类的任务,可以表示为:
[0056][0057]
式中,为预测概率,p为目标概率。
[0058]
针对深度神经网络的损失函数的验证任务部分,本实施例没有采用对比损失函数,对比损失函数强制相同的类别尽可能的距离相近。当训练样本集属于每一类的样本较少时,这可能会使得深度神经网络倾向于过拟合。本实施例验证损失是一个二值的逻辑回归损失函数,定义图像特征对为(φ(xa,w),φ(xb,w))。可以表示为:
[0059][0060]
式中,是预测概率,若图像特征对预测结果为同一个人,那么q1=1,q2=0,反之q1=0,q2=1。
[0061]
根据所述训练样本集,对所述多个异构神经网络模型进行特征聚类,并得到无标签训练样本的伪标签。优选地,对深度神经网络模型进行特征聚类最直接的方法是将无标签训练样本多个视图的特征拼接成一个特征,然后执行标准的聚类算法。但是,在这种情况下,重要视图下和次重要视图下的特征被同等对待,导致聚类算法结果不是最优的。理想情况是将不同视图下的特征同时聚类并且将每个视图下的结果联合起来得到最终的结果,为了达到这个目标,本实施例的多视图伪标签估计损失函数可以写成如下形式:
[0062][0063][0064]
式中,代表无标签数据组合成的矩阵,矩阵的每一列为一个无标签数据;代表第υ个视图的深度卷积网络特征;为第υ个视图下的中心点矩阵;满足1-of-ku的形式;ku为期望聚类的数目;a
υ
为第υ个视图下的权重因子。
[0065]
进一步地,基于带有所述伪标签的无标签训练样本和部分有标签训练样本对多个异构神经网络模型进行一次训练,以对所述多个异构神经网络模型的网络结构进行一次微调;根据一次训练结果交替更新所述多个异构神经网络模型的网络结构和无标签训练样本的伪标签,得到初始模型。
[0066]
进一步地,得到初始模型后,基于所述初始模型对无标签训练样本进行特征提取,运用自适应权重多视图聚类方法对无标签训练样本进行特征聚类,得到无标签训练样本的初始伪标签;根据所述有标签训练样本和带有所述初始伪标签的无标签训练样本进行数据融合,得到融合训练数据;采用所述融合训练数据对多个异构神经网络模型进行二次训练,以二次微调所述多个异构神经网络模型的网络结构。
[0067]
优选地,交替迭代进行对无标签训练样本的特征聚类和对多个异构神经网络模型的二次训练,以更新无标签数据的初始伪标签,直至初始伪标签不再更新,生成无标签数据的目标伪标签。
[0068]
为方便理解,生成无标签数据的目标伪标签具体流程如下:
[0069]
初始化:初始化w
υ
采用部分有标签训练样本训练多个不同结构的深度卷积网络,以获取初始模型。b通过单个视图的kmeans聚类初始化,权重因子α
υ
=1/m。
[0070]
更新b:通多最小化如下的子问题来更新b:
[0071]
[0072][0073]
为了优化式(6),将其写为:
[0074][0075]
其中:
[0076]hυ
=tr{((φ
υ-c
υbt
)d
υ
((φ
υ-c
υbt
)
t
},
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0077][0078]
其中e
(υ)i
是如下矩阵的第i行:
[0079]eυ
=(φ
υ
)
t-b(c
υ
)
t
.
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
[0080]
固定参数b,d
υ
,α
υ
,更新每个视图下的聚类中心c
υ
,对于j计算关于c
υ
的倒数,可以得到:
[0081][0082]
其中:
[0083]
令式(11)为零,c
υ
有如下表示:
[0084][0085]
固定参数c
υ
,d
υ
,α
υ
,更新聚类中心矩阵b:
[0086][0087]
为了优化式(14),固定i,向量最小化如下的问题:
[0088][0089]
式中,是对角矩阵的第i个元素,b满足1-of-ku的形式,对于式(15)有ku个后选值,每一个为矩阵的第ku列,具体来说,做一个详尽的搜索找出式(15)的最优解:
[0090][0091]
其中ku为:
[0092][0093]
固定参数c
υ
,b,α
υ
,根据式(9)和(10)更新d
υ
,固定参数c
υ
,b,d
υ
,更新α
υ
:
[0094][0095]
要使式(18)达到局部最小,α
υ
有如下表示:
[0096][0097]
交替迭代c
υ
,b,d
υ
,α
υ
,并且重复以上过程直到式(6)收敛。
[0098]
更新yu:这一步骤用来更新无标签训练样本的伪标签。当得到b,就得到每一个无标签训练样本的伪标签ku。无标签训练样本总的类别数目为ku,有标签训练样本总的类别数目为k
l
。yu有如下表示:
[0099]yu
=ku+k
l
.
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(20)
[0100]
更新w
υ
:利用有标签训练样本以及带有伪标签的剩余训练样本训练深度卷积神经网络。更新w
υ
通过最小化下式:
[0101][0102]
对于式(21),采用随机梯度下降优化w
υ
。
[0103]
基于相同的发明构思,本发明实施例提供了一种基于深度多模型协同的半监督行人重识别系统,如图3所示,包括:
[0104]
样本构建模块:获取多个视图数据,根据所述多个视图数据构建训练样本集,所述训练样本集包括有标签训练样本和无标签训练样本;
[0105]
一次训练模块:获取多个异构神经网络模型,根据所述训练样本集对多个异构神经网络模型进行一次训练,得到初始模型;
[0106]
二次训练模块:基于所述初始模型交替迭代进行无标签训练样本的伪标签生成和多个异构神经网络模型的二次训练,直至生成目标伪标签。
[0107]
进一步地,所述一次训练模块具体用于:
[0108]
获取多个结构不同的深度神经网络模型,并训练所述多个结构不同的深度神经网络模型作为多个视图下的特征提取器,以获取多个异构神经网络模型;
[0109]
根据所述训练样本集,对所述多个异构神经网络模型进行特征聚类,并得到无标签训练样本的伪标签;
[0110]
基于带有所述伪标签的无标签训练样本和部分有标签训练样本对多个异构神经网络模型进行一次训练,以对所述多个异构神经网络模型的网络结构进行一次微调;
[0111]
根据一次训练结果交替更新所述多个异构神经网络模型的网络结构和无标签训练样本的伪标签,得到初始模型。
[0112]
进一步地,所述二次训练模块具体用于:
[0113]
基于所述初始模型对无标签训练样本进行特征提取,运用自适应权重多视图聚类方法对无标签训练样本进行特征聚类,得到无标签训练样本的初始伪标签;
[0114]
根据所述有标签训练样本和带有所述初始伪标签的无标签训练样本进行数据融合,得到融合训练数据;
[0115]
采用所述融合训练数据对多个异构神经网络模型进行二次训练,以二次微调所述多个异构神经网络模型的网络结构。
[0116]
进一步地,所述二次训练模块还用于:
[0117]
交替迭代进行对无标签训练样本的特征聚类和对多个异构神经网络模型的二次训练,以更新所述初始伪标签,直至所述初始伪标签不再更新,生成目标伪标签。
[0118]
需要说明的是,关于基于深度多模型协同的半监督行人重识别系统更为具体的工作流程,请参考前述方法实施例部分,在此不在赘述。
[0119]
本发明通过多个视图的训练样本对多个异构神经网络模型进行训练,训练过程中只需利用部分有标签训练样本和大量无标签训练样本进行训练,节省了大量有标签数据,并发挥多个异构神经网络特征的多样性对无标签训练样本进行特征提取,同时利用自适应权重多视图聚类方法对多个异构神经网络进行特征聚类,从而得到具有较好精确度的伪标签,能够在一个端到端的学习过程中实现标记数据的特征学习和未标记数据的伪标签估计,能够标记更多有质量的数据来提升特征学习的性能,取得更为突出的行人重识别性能。
[0120]
可选地,在本发明的另一优选实施例中,如图4所示,该基于深度多模型协同的半监督行人重识别系统可以包括:一个或多个处理器101、一个或多个输入设备102、一个或多个输出设备103和存储器104,上述处理器101、输入设备102、输出设备103和存储器104通过总线105相互连接。存储器104用于存储计算机程序,所述计算机程序包括程序指令,所述处理器101被配置用于调用所述程序指令执行上述方法实施例部分的方法。
[0121]
应当理解,在本发明实施例中,所称处理器101可以是中央处理单元(central processing unit,cpu),深度学习显卡(如:华为npu,英伟达gpu,谷歌tpu)该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0122]
输入设备102可以包括键盘等,输出设备103可以包括显示器(lcd等)、扬声器等。
[0123]
该存储器104可以包括只读存储器和随机存取存储器,并向处理器101提供指令和数据。存储器104的一部分还可以包括非易失性随机存取存储器。例如,存储器104还可以存储设备类型的信息。
[0124]
具体实现中,本发明实施例中所描述的处理器101、输入设备102、输出设备103可执行本发明实施例提供的基于深度多模型协同的半监督行人重识别方法实施例中所描述的实现方式,在此不再赘述。
[0125]
需要说明的是,本发明实施例中基于深度多模型协同的半监督行人重识别装置更为具体工作流程及相关细节,请参考前述方法实施例部分,在此不再赘述。
[0126]
进一步地,对应于前述方法及装置,本发明实施例还提供了一种可读存储介质存
储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现:上述基于深度多模型协同的半监督行人重识别方法。
[0127]
所述计算机可读存储介质可以是前述任一实施例所述的系统的内部存储单元,例如系统的硬盘或内存。所述计算机可读存储介质也可以是所述系统的外部存储设备,例如所述系统上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述计算机可读存储介质还可以既包括所述系统的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述系统所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
[0128]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0129]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
[0130]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
[0131]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0132]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0133]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利
要求的保护范围为准。
技术特征:
1.一种基于深度多模型协同的半监督行人重识别方法,其特征在于,包括:获取多个视图数据,根据所述多个视图数据构建训练样本集,所述训练样本集包括有标签训练样本和无标签训练样本;获取多个异构神经网络模型,根据所述训练样本集对多个异构神经网络模型进行一次训练,得到初始模型;基于所述初始模型交替迭代进行无标签训练样本的伪标签生成和多个异构神经网络模型的二次训练,直至生成目标伪标签。2.根据权利要求1所述的一种基于深度多模型协同的半监督行人重识别方法,其特征在于,所述获取多个异构神经网络模型,根据所述训练样本集对多个异构神经网络模型进行一次训练,得到初始模型,具体为:获取多个结构不同的深度神经网络模型,并训练所述多个深度神经网络模型作为多个视图下的特征提取器,以获取多个异构神经网络模型;根据所述训练样本集对多个异构神经网络模型进行特征聚类,并得到无标签训练样本的伪标签;基于带有所述伪标签的无标签训练样本和部分有标签训练样本对多个异构神经网络模型进行一次训练,以对所述多个异构神经网络模型的网络结构进行一次微调;根据一次训练结果交替更新所述多个异构神经网络模型的网络结构和无标签训练样本的伪标签,得到初始模型。3.根据权利要求2所述的一种基于深度多模型协同的半监督行人重识别方法,其特征在于,所述基于所述初始模型交替迭代进行无标签训练样本的伪标签生成和多个异构神经网络模型的二次训练,直至生成目标伪标签,包括:基于所述初始模型对无标签训练样本进行特征提取,根据所提取的特征运用自适应权重多视图聚类方法对无标签训练样本进行特征聚类,得到无标签训练样本的初始伪标签;根据所述有标签训练样本和带有所述初始伪标签的无标签训练样本进行数据融合,得到融合训练数据;根据所述融合训练数据对多个异构神经网络模型进行二次训练,以二次微调所述多个异构神经网络模型的网络结构。4.根据权利要求3所述的一种基于深度多模型协同的半监督行人重识别方法,其特征在于,所述基于所述初始模型交替迭代进行无标签训练样本的伪标签生成和多个异构神经网络模型的二次训练,直至生成目标伪标签,还包括:交替迭代进行对无标签训练样本的特征聚类和对多个异构神经网络模型的二次训练,以更新所述初始伪标签和多个异构神经网络模型,直至所述初始伪标签不再更新,生成目标伪标签。5.一种基于深度多模型协同的半监督行人重识别系统,其特征在于,包括:样本构建模块:用于获取多个视图数据,根据所述多个视图数据构建训练样本集,所述训练样本集包括有标签训练样本和无标签训练样本;一次训练模块:用于获取多个异构神经网络模型,根据所述训练样本集对多个异构神经网络模型进行一次训练,得到初始模型;二次训练模块:用于基于所述初始模型交替迭代进行无标签训练样本的伪标签生成和
多个异构神经网络模型的二次训练,直至生成目标伪标签。6.根据权利要求5所述的一种基于深度多模型协同的半监督行人重识别系统,其特征在于,所述一次训练模块具体用于:获取多个结构不同的深度神经网络模型,并训练所述多个深度神经网络模型作为多个视图下的特征提取器,以获取多个异构神经网络模型;根据所述训练样本集对多个异构神经网络模型进行特征聚类,并得到无标签训练样本的伪标签;基于带有所述伪标签的无标签训练样本和部分有标签训练样本对多个异构神经网络模型进行一次训练,以对所述多个异构神经网络模型的网络结构进行一次微调;根据一次训练结果交替更新所述多个异构神经网络模型的网络结构和无标签训练样本的伪标签,得到初始模型。7.根据权利要求6所述的一种基于深度多模型协同的半监督行人重识别系统,其特征在于,所述二次训练模块具体用于:基于所述初始模型对无标签训练样本进行特征提取,根据所提取的特征运用自适应权重多视图聚类方法对无标签训练样本进行特征聚类,得到无标签训练样本的初始伪标签;根据所述有标签训练样本和带有所述初始伪标签的无标签训练样本进行数据融合,得到融合训练数据;根据所述融合训练数据对多个异构神经网络模型进行二次训练,以二次微调所述多个异构神经网络模型的网络结构。8.根据权利要求7所述的一种基于深度多模型协同的半监督行人重识别系统,其特征在于,所述二次训练模块还用于:交替迭代进行对无标签训练样本的特征聚类和对多个异构神经网络模型的二次训练,以更新所述初始伪标签和多个异构神经网络模型,直至所述初始伪标签不再更新,生成目标伪标签。9.一种基于深度多模型协同的半监督行人重识别系统,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-4任一项所述的方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-4任一项所述的方法。
技术总结
本发明公开了一种基于深度多模型协同的半监督行人重识别方法及系统,包括:获取多个视图数据,根据所述多个视图数据构建训练样本集,所述训练样本集包括有标签训练样本和无标签训练样本;获取多个异构神经网络模型,根据所述训练样本集对多个异构神经网络模型进行一次训练,得到初始模型;基于所述初始模型交替迭代进行无标签训练样本的伪标签生成和多个异构神经网络模型的二次训练,直至生成目标伪标签。本发明利用部分有标签样本和大量无标签样本对多个异构神经网络模型进行训练,并发挥多个异构神经网络特征的多样性对无标签训练样本进行特征提取,同时利用自适应权重多视图聚类方法进行神经网络特征聚类,从而得到具有较好精确度的伪标签。有较好精确度的伪标签。有较好精确度的伪标签。
技术研发人员:黄文丽 王子豪 逯丽芬
受保护的技术使用者:苏州凌图科技有限公司
技术研发日:2023.04.28
技术公布日:2023/8/24
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
