一种多目标跟踪识别方法、装置、电子设备及介质与流程

未命名 07-12 阅读:67 评论:0


1.本发明涉及识别算法领域,尤其涉及一种多目标跟踪识别方法、装置、电子设备及介质。


背景技术:

2.在监控平台中,经常需要对一些目标进行分析,例如在一些场景中需要对人的行为进行监控,包括后厨中人是否戴帽子,防疫中是否戴口罩,公共场所中是否抽烟等。如果人工对视频中目标的违规行为进行实时观察,将会花大量的时间和精力,为此就诞生了智能监控,引入机器分析来减少人力耗损,人工只需要检查经过机器分析后判定为违规的图片。
3.但是,上述智能监控的方法通常是对单帧图像中的单目标进行静态分析,无法追踪目标的动态过程。因此,如何实现同时对视频中的多目标进行精准动态追踪,就成为了行业内需要解决的技术问题。


技术实现要素:

4.本发明所要解决的技术问题是:如何设计出一种多目标跟踪识别方法,能够实现同时对视频中的多目标进行精准动态追踪。
5.为解决上述问题,第一方面,本发明提出一种多目标跟踪识别方法,所述方法包括:从待处理视频对象中截取视频帧图像,作为第一目标图像;从所述待处理视频对象中截取所述第一目标图像的下一帧图像,作为第二目标图像;分别将所述第一目标图像以及所述第二目标图像输入至预设的目标检测模型中,获得所述第一目标图像的第一检测框组以及所述第二目标图像的第二检测框组,所述第一检测框组包括至少一个第一检测框,所述第二检测框组包括至少一个第二检测框;从所述第一检测框组中选取第一检测框作为第一目标检测框;从所述第二检测框组中选取与所述第一目标检测框匹配的第二检测框作为第二目标检测框;获取所述第一目标检测框与所述第二目标检测框之间的几何信息,根据所述几何信息获取所述第一检测框与所述第二检测框之间的物理位置匹配分值。
6.依据预设的特征提取算法,分别获取所述第一目标检测框限定的图像的第一图像特征向量以及所述第二目标检测框限定的图像的第二图像特征向量;根据所述第一图像特征向量以及所述第二图像特征向量,获取所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的特征度匹配分值;根据所述物理位置匹配分值与所述特征度匹配分值,获取所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的相似度分值。
7.判断所述相似度分值是否大于预设的分数阈值;若所述相似度分值大于所述分数阈值,判定所述第一目标检测框框出的目标与所述第二目标检测框框出的目标相同;判断所述第一检测框组中是否存在未被选取的第一检测框;若所述第一检测框组中存在未被选取的第一检测框,转到所述从所述第一检测框组中选取第一检测框作为第一目标检测框的
步骤;若所述第一检测框组不存在未被选取的第一检测框,将所述第二目标图像作为新的第一目标图像,转到所述从所述待处理视频对象中截取所述第一目标图像的下一帧图像作为第二目标图像的步骤。
8.其进一步的技术方案为,所述获取所述第一目标检测框与所述第二目标检测框之间的几何信息,包括:获取所述第一目标检测框与所述第二目标检测框之间的交并比、中心点距离比、宽度比以及高度比。
9.其进一步的技术方案为,所述根据所述几何信息获取所述第一检测框与所述第二检测框之间的物理位置匹配分值,包括:
10.根据公式p
score
=iou-((c
dis
/c)+(w
dis
/w)+(h
dis
/h))计算所述第一检测框与所述第二检测框之间的物理位置匹配分值。
11.其中,iou为交并比,c
dis
/c为中心点距离比,w
dis
/w为宽度比,h
dis
/h为高度比,p
score
为物理位置匹配分值。
12.其进一步的技术方案为,所述根据所述第一图像特征向量以及所述第二图像特征向量,获取所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的特征度匹配分值,包括:
13.根据公式计算所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的特征度匹配分值。
14.其中,(x1,x2,...,xn)为第一特征向量,(y1,y2,...,yn)为第二特征向量。
15.其进一步的技术方案为,所述根据所述物理位置匹配分值与所述特征度匹配分值,获取所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的相似度分值,包括:将所述物理位置匹配分值与预设的第一加权系数相乘,得到物理位置加权分值;将所述特征度匹配分值与预设的第二加权系数相乘,得到特征度加权分值;将所述物理位置加权分值与所述特征度加权分值相加,得到所述相似度分值。
16.其进一步的技术方案为,所述从所述第二检测框组中选取与所述第一目标检测框匹配的第二检测框作为第二目标检测框,包括:从所述第二检测框组中选取至少一个子检测框,其中,所述子检测框的面积与所述第一目标检测框的面积之比大于预设的面积比阈值;将所述子检测框设定为第二目标检测框。
17.其进一步的技术方案为,判断所述第一目标检测框框出的目标是否为预设的违规目标;若所述第一目标检测框框出的目标为预设的违规目标,从所述待处理视频对象中获取所有包含所述目标的视频帧图像,得到违规图像集合;分别获取所述违规图像集合中的视频帧图像的违规特征相似度,所述违规特征相似度为所述违规图像集合中的视频帧图像的特征与预设的违规标准图像的特征之间的相似程度的数值;从所述违规图像集合中选取违规特征相似度最大的视频帧图像作为违规图像,并将所述违规图像上传到预设的监控终端。
18.第二方面,本发明提出一种多目标跟踪识别装置,所述多目标跟踪识别装置包括用于执行如第一方面所述方法的单元。
19.第三方面,本发明提出一种电子设备,包括:存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现如第一方面所述方法的步骤。
20.第四方面,本发明提出计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时可实现如第一方面所述的方法。
21.本发明的有益效果为:
22.本发明中,从待处理视频对象中连续截取相邻的第一目标图像以及第二目标图像,获取第一目标图像的第一检测框以及第二目标图像的第二检测框,针对第一目标图像中的每一个第一检测框,均从第二目标图像中选取一个相匹配的第二检测框,并利用第一检测框与相匹配的第二检测框的物理位置匹配分值、特征度匹配分值来精准衡量二者框出的目标是否相同,从而实现对第一检测框框出的目标在第二目标图像中的追踪;之后,以第二目标图像作为新的第一目标图像,以第二目标图像的后一帧图像作为新的第二目标图像,并循环进行上述处理过程,从而能够实现同时对多个目标在视频对象中的精准追踪。
附图说明
23.此处的附图被并入说明书中并构成本说明书的一部分,展示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
24.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
25.图1为本发明实施例提供的一种多目标跟踪识别方法的流程示意图。
26.图2为本发明实施例提供的一种多目标跟踪识别方法的另一流程示意图。
27.图3为本发明实施例提供的一种多目标跟踪识别装置的框图。
28.图4为本发明实施例提供的一种多目标跟踪识别装置的另一框图。
29.图5为本发明实施例提供的一种电子设备的框图。
具体实施方式
30.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
31.应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
32.还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
33.还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或任何组合以及所有可能组合,并且包括这些组合。
34.如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确
定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0035]
实施例1
[0036]
请参阅图1-图5,图1为本发明实施例提供的一种多目标跟踪识别方法的流程示意图。本发明实施例提出一种多目标跟踪识别方法,所述方法能够实现对第一检测框框出的目标在第二目标图像中的追踪,追踪目标的动态过程;所述方法的第一目标图像与第二目标图像不是固定不变的,而是随着处理过程的循环不断进行迭代更新的。该多目标跟踪识别方法可以用于摄像机或者监控摄像头,所述摄像机或监控摄像头的位置可以为固定位置,所述方法包括:
[0037]
s101,从待处理视频对象中截取视频帧图像,作为第一目标图像。
[0038]
上述方案中,所述待处理视频对象,可以为实时监控视频流,也可以为存储的视频文件。所述从待处理视频对象中截取视频帧图像,作为第一目标图像,可以为从待处理视频对象中截取第一帧的视频帧图像,作为第一目标图像。
[0039]
s102,从所述待处理视频对象中截取所述第一目标图像的下一帧图像,作为第二目标图像。
[0040]
其中,所述第一目标图像可以为待处理视频的第一帧的视频帧图像,所述第二目标图像可以为待处理视频的第二帧的视频帧图像,也就是说,所述多目标跟踪识别方法可以从整个待处理视频对象的第一帧开始。在一实施例中,对待处理视频进行连续截帧,获取两个目标图像,然后从两个目标图像当中提取相邻的视频帧图像,获取第一目标图像以及第二目标图像。
[0041]
从时间上看,第一目标图像对应的帧与第二目标图像对应的帧是相邻的;从图像的位置上看,第一目标图像与第二目标图像是相邻的,即在用户看来,第一目标图像位于靠前的位置,第二目标图像位于靠后的位置且紧靠第二目标图像。
[0042]
此外,第一目标图像与第二目标图像是可变的,具体地,本方案的处理过程基于第一目标图像与第二目标图像进行,且本实施例是会不断循环进行的,在一个循环结束后,将以第二目标图像作为新的第一目标图像,以第二目标图像的后一帧图像作为新的第二目标图像循环执行本实施例的处理过程,因此第一目标图像与第二目标图像不是固定不变的,而是随着处理过程的循环不断进行迭代更新的。
[0043]
s103,分别将所述第一目标图像以及所述第二目标图像输入至预设的目标检测模型中,获得所述第一目标图像的第一检测框组以及所述第二目标图像的第二检测框组。
[0044]
其中,所述第一检测框组包括至少一个第一检测框,所述第二检测框组包括至少一个第二检测框;所述第一检测框可以为矩形框,所述第二检测框可以为矩形框。所述第一检测框组的数量可以一个或多个,具体由目标检测模型的识别结果确定,所述第二检测框组的数量也可以为一个或多个,具体由目标检测模型的识别结果确定。
[0045]
具体实施中,预先对目标检测模型进行训练,使得目标检测模型具有识别第一目标图像之后获得第一检测框组的能力,且目标检测模型具有识别第二目标图像之后获得第二检测框组的能力。本实施例中,目标检测模型具体选用yolox模型,本领域技术人员也可以采用其它类型的目标检测模型,本发明对此不做具体限定。
[0046]
s104,从所述第一检测框组中选取第一检测框作为第一目标检测框。
[0047]
其中,第一目标检测框即本次追踪识别过程中需要一直追踪目标的框。从所述第
一检测框组中选取第一检测框作为第一目标检测框,即选取任意一个或多个第一检测框作为目标,后续步骤均围绕选中目标展开,后续步骤也会持续追踪这个目标。
[0048]
本方案所述多目标跟踪识别方法最终会实现对多个目标的追踪,在实现的过程中,根据设备的处理能力,可选取一个第一检测框作为第一目标检测框,执行本实施例的处理过程,或者选取多个第一检测框作为第一目标检测框,并同时对多个第一目标检测框行执行本实施例的处理过程。在完成了对上述第一目标检测框的追踪之后,还要判断所述第一检测框组中是否存在未被选取的第一检测框,确保第一检测框组中不存在遗漏;接下来,所述第一目标图像当中的信息都处理完成以后,再从所述待处理视频对象中截取所述第一目标图像的下一帧图像,作为第二目标图像,继续对所述第二目标图像进行追踪。
[0049]
s105,从所述第二检测框组中选取与所述第一目标检测框匹配的第二检测框作为第二目标检测框。
[0050]
其中,所述从所述第二检测框组中选取与所述第一目标检测框匹配的第二检测框作为第二目标检测框,具体包括,从所述第二检测框组中选取至少一个子检测框,其中,所述子检测框的参数与所述第一目标检测框的参数之比均大于预设的参数比阈值;将所述子检测框设定为第二目标检测框。上述步骤中,所述参数可以为面积,所述参数也可以根据需求进行选取;依据预设的参数比阈值为条件选出子检测框的过程,相当于对所述第二检测框组进行初步筛选,选出符合条件的所有框,数量为一个或多个,均作为第二目标检测框。
[0051]
在一实施例中,所述从所述第二检测框组中选取与所述第一目标检测框匹配的第二检测框作为第二目标检测框,具体包括,从所述第二检测框组中选取至少一个子检测框,其中,所述子检测框的面积与所述第一目标检测框的面积之比均大于预设的面积比阈值,数值可以设定为95%-100%之间的任意数值,即可以依据工程师的经验进行设定,范围包括80%-100%。如此一来,所有第二目标检测框的面积,均与第一目标检测框的面积接近,无论符合条件的框的数量为一个还是多个,其包含的目标都可能与第一目标检测框的目标相同;因此,为了避免遗漏,上述一个或多个框均定义为第二目标检测框。
[0052]
s106,获取所述第一目标检测框与所述第二目标检测框之间的几何信息,根据所述几何信息获取所述第一检测框与所述第二检测框之间的物理位置匹配分值。
[0053]
其中,所述获取所述第一目标检测框与所述第二目标检测框之间的几何信息,具体包括获取所述第一目标检测框与所述第二目标检测框之间的交并比、中心点距离比、宽度比以及高度比;所述交并比即两个框的交集和并集之比,所述中心点距离可以为两个框的中心点坐标距离、两个框的最小闭包区域的对角线距离,二者之间的比值。
[0054]
所述根据所述几何信息获取所述第一检测框与所述第二检测框之间的物理位置匹配分值,即交并比、中心点距离比、宽度比以及高度比经过计算得出所述几何信息具体包括:
[0055]
根据公式p
score
=iou-((c
dis
/c)+(w
dis
/w)+(h
dis
/h))计算所述第一检测框与所述第二检测框之间的物理位置匹配分值。
[0056]
其中,iou为交并比,c
dis
/c为中心点距离比,w
dis
/w为宽度比,h
dis
/h为高度比,p
score
为物理位置匹配分值。
[0057]
s107,依据预设的特征提取算法,分别获取所述第一目标检测框限定的图像的第一图像特征向量以及所述第二目标检测框限定的图像的第二图像特征向量。
[0058]
其中,所述第一目标检测框限定的图像,与第一目标检测框有区别,具体指框内图像;所述第二目标检测框限定的图像,与第二目标检测框有区别,具体也是指框内图像;所述预设的特征提取算法为本领域技术人员所熟知,具体的特征提取算法可以包括:hog、lbp或者harr等特征提取算法。
[0059]
s108,根据所述第一图像特征向量以及所述第二图像特征向量,获取所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的特征度匹配分值。
[0060]
其中,上述步骤即获取框内的图像特征的相似度,在所述特征度匹配分值的获取过程中,可以为通过传统图像特征提取算法,提取到固定维数的第一图像特征向量a
feature
(x1,x2,...,xn)以及固定维数的第二图像特征向量b
feature
(y1,y2,...,yn),使用余弦相似度来计算所述第一图像特征向量以及所述第二图像特征向量之间的相似程度,具体包括:
[0061]
根据公式计算所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的特征度匹配分值。
[0062]
其中,x1,x2,...,xn为第一特征向量的坐标,y1,y2,...,yn为第二特征向量的坐标。(x1,x2,...,xn)为第一特征向量,(y1,y2,...,yn)为第二特征向量。
[0063]
s109,根据所述物理位置匹配分值与所述特征度匹配分值,获取所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的相似度分值。
[0064]
其中,所述相似度分值的获取过程,包括:将所述物理位置匹配分值与预设的第一加权系数相乘,得到物理位置加权分值;将所述特征度匹配分值与预设的第二加权系数相乘,得到特征度加权分值;将所述物理位置加权分值与所述特征度加权分值相加,得到所述相似度分值。
[0065]
所述相似度分值的获取的计算过程包括:
[0066]
total
score
=αp
score
+βf
score

[0067]
其中α,β表示位置匹配度、特征相似度两者权重值,位置匹配度为p
score
,特征相似度为f
score
,相似度分值为total
score

[0068]
s110,判断所述相似度分值是否大于预设的分数阈值。
[0069]
其中,预设的分数阈值可以由工程师根据自身经验而设定,所述预设的分数阈值用于衡量第一次识别到的目标,与第二次识别到的目标,是否为同一个目标,省去了人工追踪识别造成的人力成本消耗。
[0070]
s111,若所述相似度分值大于所述分数阈值,判定所述第一目标检测框框出的目标与所述第二目标检测框框出的目标相同。
[0071]
其中,所述第一目标检测框框出的目标,主要包括三个部分,即第一目标检测框、第一目标检测框的图像、第一目标检测框的目标;所述第二目标检测框框出的目标,主要包括三个部分,即第二目标检测框、第二目标检测框的图像、第二目标检测框的目标。第一目标检测框、第二目标检测框,分属于不同的视频帧图像,因此是明显不同的;第一目标检测框的图像、第二目标检测框的图像,受到截帧时间的间隙的影响,存在一定的相似性,但是这一相似性无法客观判断出,两个图像当中的目标是否相同;第一目标检测框的目标、第二目标检测框的目标,理想状态下应当为同一目标,或者说同一物体。上述步骤的作用在于,通过判断所述相似度分值与所述分数阈值之间的关系,来客观判断第一目标检测框的目标
与第二目标检测框的目标是否如理想状态那样相同。
[0072]
s112,判断所述第一检测框组中是否存在未被选取的第一检测框。
[0073]
其中,从所述第二检测框组中选取与所述第一目标检测框匹配的第二检测框作为第二目标检测框的步骤之后,即可以判断所述第一检测框组中是否存在未被选取的第一检测框。其目的在于,需要针对所述第一检测框组中的所有第一检测框,进行遍历跟踪,确保没有遗漏,才可以启动对第二目标图像的跟踪工作;否则,第一检测框组中遗留着未处理的第一检测框,相当于整个多目标跟踪识别方法的精准度降低,不利于实现本发明所述的技术效果。
[0074]
上述步骤s112之后,若所述第一检测框组中存在未被选取的第一检测框,则转到s104的步骤,即转到从所述第一检测框组中选取第一检测框作为第一目标检测框的步骤。其中,转到所述从所述第一检测框组中选取第一检测框作为第一目标检测框的步骤,即选择一个还没有被选取的第一检测框,也就是选择一个第一检测框组中还没有被选取的检测框。其原因在于,整个第一检测框组中所有的第一检测框,都需要有作为第一目标检测框的步骤,才能实现多目标跟踪识别方法的最优效果。
[0075]
上述步骤s112之后,若所述第一检测框组不存在未被选取的第一检测框,则执行s113步骤,将所述第二目标图像作为新的第一目标图像。
[0076]
将所述第二目标图像作为新的第一目标图像之后,转到s102的步骤,即转到从所述待处理视频对象中截取所述第一目标图像的下一帧图像作为第二目标图像的步骤。其目的在于,若针对所述第一检测框组中的所有第一检测框进行遍历跟踪之后,针对第一检测框组的工作就已经完成,相当于针对第一目标图像的工作也已经完成;此时,追踪工作的重心从第一目标图像转移到了第二目标图像,也就是将所述第二目标图像作为新的第一目标图像。
[0077]
上述s101-s113的技术方案,若所述第一检测框组不存在未被选取的第一检测框,将所述第二目标图像作为新的第一目标图像,转到所述从所述待处理视频对象中截取所述第一目标图像的下一帧图像作为第二目标图像的步骤,也就是继续截取所述第二目标图像的下一帧图像作为第三目标图像。由于第三目标图像与第二目标图像的关系,相当于第二目标图像与第一目标图像的关系,所以整个方法可以持续推进,不仅可以判断所述第一目标检测框框出的目标与所述第二目标检测框框出的目标是否相同,而且可以判断所述第二目标检测框框出的目标与所述第三目标检测框框出的目标是否相同,进而可以判断所述第三目标检测框框出的目标与所述第四目标检测框框出的目标是否相同,也就是所述方案实现了跟踪识别的作用。其中,连续截取第一目标图像以及第二目标图像,获取第一目标检测框以及第二目标检测框,将这两个目标检测框之间的关系用物理位置匹配分值、特征度匹配分值来精准衡量,最后判断衡量的结果是否符合预期的分数阈值,这里物理位置匹配分值、特征度匹配分值与现有技术相比更加细化、更加精准,即实现了能够减少误识别的几率的技术效果;在符合预期的情况下判定第一目标检测框所框出的目标、第二目标检测框所框出的目标之间相同,这里判定相同意味着不用重复上报,即实现了能够同时对多个目标进行准确追踪。
[0078]
上述方案的有益效果为,连续截取第一目标图像以及第二目标图像,获取第一目标检测框以及第二目标检测框,将这两个目标检测框之间的关系用物理位置匹配分值、特
征度匹配分值来精准衡量,最后判断衡量的结果是否符合预期的分数阈值,且在符合预期的情况下判定第一目标检测框所框出的目标、第二目标检测框所框出的目标之间相同;即实现了在目标跟踪过程中不仅能够减少误识别的几率,而且能够同时对多个目标进行准确追踪。
[0079]
在一实施例中,所述多目标跟踪识别方法还包括以下步骤:
[0080]
s201,判断所述第一目标检测框框出的目标是否为预设的违规目标。
[0081]
其中,所述预设的违规目标属于本领域技术人员可以自定义的,根据预设的违规目标的特征、第一目标检测框框出的目标的特征,二者之间的匹配程度是否超过阈值,可以判断出所述目标是否为预设的违规目标,具体的判断方式为本领域技术人员所知晓,本发明对此不做具体限定。
[0082]
s202,若所述第一目标检测框框出的目标为预设的违规目标,从所述待处理视频对象中获取所有包含所述目标的视频帧图像,得到违规图像集合。
[0083]
其中,所有包含所述目标的视频帧图像为一个数据量大、处理成本高的图像集合,也就是说所述违规图像集合的处理成本高,长期上传或存储这一类图像集合,相当于增加了不必要的工作量。
[0084]
s203,分别获取所述违规图像集合中的视频帧图像的违规特征相似度,所述违规特征相似度为所述违规图像集合中的视频帧图像的特征与预设的违规标准图像的特征之间的相似程度的数值。
[0085]
其中,预设的违规标准图像属于本领域技术人员可以自定义的,其特征也可以根据现有技术手段获得;所述违规特征相似度相当于一个量化数值,用于衡量所述违规图像集合中的视频帧图像的违规程度。
[0086]
s204,从所述违规图像集合中选取违规特征相似度最大的视频帧图像作为违规图像,并将所述违规图像上传到预设的监控终端。
[0087]
其中,选取违规特征相似度最大的视频帧图像作为违规图像,即选取一个代表图像,该代表图像全面覆盖了所述违规图像集合,对代表图像的上传或存储成本较低,避免违规图像集合的重复累赘导致资源浪费。
[0088]
现有技术中的目标跟踪识别方法,一旦遇到更为复杂的场景,识别准确程度将直线下降,识别成本也会大幅提升。具体而言,一方面现有技术容易出现误识别,另一方面现有技术容易造成重复累赘,例如在一个人在一段时间内违规,结果现有技术的方案就上报此人在这段时间内的所有违规的图像,导致重复上报成本偏高。
[0089]
上述方案s201-s204的有益效果为,连续截取第一目标图像以及第二目标图像,获取第一目标检测框以及第二目标检测框,将这两个目标检测框之间的关系用物理位置匹配分值、特征度匹配分值来精准衡量,最后判断衡量的结果是否符合预期的分数阈值,且在符合预期的情况下判定第一目标检测框所框出的目标、第二目标检测框所框出的目标之间相同,最后从所述违规图像集合中选取违规特征相似度最大的视频帧图像作为违规图像,并将所述违规图像作为唯一图像,上传到预设的监控终端;即实现了在目标跟踪过程中不仅能够减少误识别的几率,而且能够减少重复累赘导致资源浪费。
[0090]
在一实施例中,所述步骤s106-s108具体可以包括以下过程,其技术效果为,所述方法可以进一步精准实现对第一检测框框出的目标在第二目标图像中的追踪,具体而言,
从待处理视频对象中连续截取相邻的第一目标图像以及第二目标图像,获取第一目标图像的第一检测框以及第二目标图像的第二检测框,针对第一目标图像中的每一个第一检测框,均从第二目标图像中选取一个相匹配的第二检测框,并利用第一检测框与相匹配的第二检测框的物理位置匹配分值、特征度匹配分值来精准衡量二者框出的目标是否相同,物理位置匹配分值、特征度匹配分值的计算过程参照了优选参数以及优选计算方法,因此与现有技术相比可以进一步精准实现对第一检测框框出的目标在第二目标图像中的追踪;以第二目标图像作为新的第一目标图像,以第二目标图像的后一帧图像作为新的第二目标图像,并循环进行上述处理过程,从而能够实现同时对多个目标在视频对象中的精准追踪。
[0091]
此外,上述步骤s106-s108具体涉及的以下过程,应用于目标持续出现在待处理视频当中的场景,包括连续截取第一目标图像以及第二目标图像,获取第一目标检测框以及第二目标检测框,将这两个目标检测框之间的关系用物理位置匹配分值、特征度匹配分值来精准衡量,最后判断衡量的结果是否符合预期的分数阈值,且在符合预期的情况下判定第一目标检测框所框出的目标、第二目标检测框所框出的目标之间相同;即实现了在目标跟踪过程中不仅能够减少误识别的几率,而且能够同时对多个目标进行准确追踪。
[0092]
第一检测框的a矩形的左上角和右下角的点分别为:
[0093]
p
a0
=(x
a0
,y
a0
),p
a1
=(x
a1
,y
a1
);
[0094]
第二检测框的b矩形的左上角和右下角的点分别为:
[0095]
p
a0
=(x
a0
,y
a0
),p
a1
=(x
a1
,y
a1
);
[0096]
第一检测框的a矩形与第二检测框的b矩形的相交部分左上角坐标为:
[0097]
x1=max(x
a0
,x
b0
),y1=max(y
a0
,y
b0
);
[0098]
第一检测框的a矩形与第二检测框的b矩形的相交部分右下角坐标为:
[0099]
x2=min(x
a1
,x
b1
),y2=min(y
a1
,y
b1
);
[0100]
那么,第一检测框的a矩形与第二检测框的b矩形的相交部分的面积,其计算公式为:
[0101]
intersection=max(x
2-x1+1.0,0)
×
max(y
2-y1+1.0,0);
[0102]
所述第一检测框的a矩形的面积为:
[0103]
sa=(x
a1-x
a0
+1.0)
×
(y
a1-y
a0
+1.0);
[0104]
所述第二检测框的b矩形的面积为:
[0105]
sb=(x
b1-x
b0
+1.0)
×
(y
b1-y
b0
+1.0);
[0106]
那么,第一检测框的a矩形与第二检测框的b矩形的相比部分的面积,其计算公式为:
[0107]
union=sa+s
b-intersection;
[0108]
综上所述,交并比的计算公式为:
[0109][0110]
其中iou为交并比,intersection为相交部分的面积,union相比部分的面积。
[0111]
在完成了交并比的计算之后,还需要完成中心距离比的计算;
[0112]
第一检测框的a矩形的中心点为(a
cx
,a
cy
)、第二检测框的b矩形的中心点为(b
cx
,b
cy
),第一检测框的a矩形的中心点、第二检测框的b矩形的中心点之间的中心点距离为c
dis

[0113]acx
=(x
a0
+x
a1
)/2.0;a
cy
=(y
a0
+y
a1
)/2.0;
[0114]bcx
=(x
b0
+x
b1
)/2.0;b
cy
=(y
b0
+y
b1
)/2.0;
[0115][0116]
包含第一检测框的a矩形、第二检测框的b矩形的最小闭包区域的对角线距离为c,所述最小闭包区域即是两个框的最小外接矩形,最小闭包区域的宽度为w,最小闭包区域的高度为h;
[0117]
w=max(x
a1
,x
b1
)-min(x
a0
,x
b0
);
[0118]
h=max(y
a1
,y
b1
)-min(y
a0
,y
b0
);
[0119][0120]
第一检测框的a矩形、第二检测框的b矩形的宽度差为w
dis
,第一检测框的a矩形、第二检测框的b矩形的高度差为h
dis

[0121]wdis
=(x
a1-x
a0
)-(x
b1-x
b0
);
[0122]hdis
=(y
a1-y
a0
)-(y
b1-y
b0
);
[0123]
综上所述,最终的物理位置匹配分值的计算公式为:
[0124]
p
score
=iou-((c
dis
/c)+(w
dis
/w)+(h
dis
/h));
[0125]
上述步骤中,物理位置匹配分值等于交并比减去其它三项之和,其它三项具体包括,c
dis
/c为中心点距离比,w
dis
/w为宽度比,h
dis
/h为高度比;此外,iou为交并比,p
score
为物理位置匹配分值。
[0126]
在所述特征度匹配分值的获取过程中,可以为通过传统图像特征提取算法,例如hog,lbp或者harr特征提取算法,提取到固定维数的第一图像特征向量a
feature
(x1,x2,...,xn)以及固定维数的第二图像特征向量b
feature
(y1,y2,...,yn),使用余弦相似度来计算所述第一图像特征向量以及所述第二图像特征向量之间的相似程度,具体包括以下公式:
[0127][0128]
其中,x1,x2,...,xn为第一特征向量的坐标,y1,y2,...,yn为第二特征向量的坐标。(x1,x2,...,xn)为第一特征向量,(y1,y2,...,yn)为第二特征向量。
[0129]
上述计算中,位置匹配度p
score
数值越大表示越匹配,特征相似度f
score
取值范围可以是[-1,1],特征相似度的数值越大表示越相似。
[0130]
将所述物理位置匹配分值与预设的第一加权系数相乘,得到物理位置加权分值p
score
,即位置匹配度;将所述特征度匹配分值与预设的第二加权系数相乘,得到特征度加权分值f
score
,即特征相似度;将所述物理位置加权分值与所述特征度加权分值相加,得到所述相似度分值total
score

[0131]
位置匹配度p
score
与特征相似度f
score
两者相结合,得到相似度分值total
score
,具体公式可以表示为:
[0132]
total
score
=αp
score
+βf
score

[0133]
其中α,β表示位置匹配度、特征相似度两者权重值,依据实际场景设定。
[0134]
上述方案的技术效果为,将两个目标检测框之间的关系用物理位置匹配分值、特
征度匹配分值来精准衡量,并通过权重值进一步提升精准程度,最后判断衡量结果是否符合预期的分数阈值,该衡量结果与现有技术相比更准确,有利于实现同时对多个目标在视频对象中的进一步精准追踪。
[0135]
实施例2
[0136]
参见图3,图3为本发明实施例提供的多目标跟踪识别装置的框图。对应于以上多目标跟踪识别方法,本发明还提供一种多目标跟踪识别装置10,所述装置可以实现对第一检测框框出的目标在第二目标图像中的追踪。该多目标跟踪识别装置10包括用于执行上述多目标跟踪识别方法的单元,该装置可以被配置于台式电脑、平板电脑、手提电脑等终端中,其具体包括:
[0137]
第一视频截取单元11,用于从待处理视频对象中截取视频帧图像,作为第一目标图像。
[0138]
第二视频截取单元12,用于从所述待处理视频对象中截取所述第一目标图像的下一帧图像,作为第二目标图像。
[0139]
检测框组获取单元13,用于分别将所述第一目标图像以及所述第二目标图像输入至预设的目标检测模型中,获得所述第一目标图像的第一检测框组以及所述第二目标图像的第二检测框组,所述第一检测框组包括至少一个第一检测框,所述第二检测框组包括至少一个第二检测框。
[0140]
第一目标选取单元14,用于从所述第一检测框组中选取第一检测框作为第一目标检测框。
[0141]
第二目标选取单元15,用于从所述第二检测框组中选取与所述第一目标检测框匹配的第二检测框作为第二目标检测框。
[0142]
物理位置匹配单元16,用于获取所述第一目标检测框与所述第二目标检测框之间的几何信息,根据所述几何信息获取所述第一检测框与所述第二检测框之间的物理位置匹配分值。
[0143]
特征向量获取单元17,用于依据预设的特征提取算法,分别获取所述第一目标检测框限定的图像的第一图像特征向量以及所述第二目标检测框限定的图像的第二图像特征向量。
[0144]
特征度匹配单元18,用于根据所述第一图像特征向量以及所述第二图像特征向量,获取所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的特征度匹配分值。
[0145]
相似度获取单元19,用于根据所述物理位置匹配分值与所述特征度匹配分值,获取所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的相似度分值。
[0146]
分数阈值判断单元20,用于判断所述相似度分值是否大于预设的分数阈值。
[0147]
目标判定单元21,用于实现若所述相似度分值大于所述分数阈值,判定所述第一目标检测框框出的目标与所述第二目标检测框框出的目标相同。
[0148]
检测框判断单元22,用于判断所述第一检测框组中是否存在未被选取的第一检测框;若所述第一检测框组中存在未被选取的第一检测框,转到所述从所述第一检测框组中选取第一检测框作为第一目标检测框的步骤;若所述第一检测框组不存在未被选取的第一检测框,将所述第二目标图像作为新的第一目标图像,转到所述从所述待处理视频对象中
截取所述第一目标图像的下一帧图像作为第二目标图像的步骤。
[0149]
在一实施例中,所述获取所述第一目标检测框与所述第二目标检测框之间的几何信息,包括:获取所述第一目标检测框与所述第二目标检测框之间的交并比、中心点距离比、宽度比以及高度比。
[0150]
在一实施例中,所述根据所述几何信息获取所述第一检测框与所述第二检测框之间的物理位置匹配分值,包括:
[0151]
p
score
=iou-((c
dis
/c)+(w
dis
/w)+(h
dis
/h));
[0152]
其中,iou为交并比,c
dis
/c为中心点距离比,w
dis
/w为宽度比,h
dis
/h为高度比,p
score
为物理位置匹配分值。
[0153]
在一实施例中,所述根据所述第一图像特征向量以及所述第二图像特征向量,获取所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的特征度匹配分值,包括:
[0154][0155]
其中,x1,x2,...,xn为第一特征向量的坐标,y1,y2,...,yn为第二特征向量的坐标。(x1,x2,...,xn)为第一特征向量,(y1,y2,...,yn)为第二特征向量。
[0156]
在一实施例中,所述根据所述物理位置匹配分值与所述特征度匹配分值,获取所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的相似度分值,包括:将所述物理位置匹配分值与预设的第一加权系数相乘,得到物理位置加权分值;将所述特征度匹配分值与预设的第二加权系数相乘,得到特征度加权分值;将所述物理位置加权分值与所述特征度加权分值相加,得到所述相似度分值。
[0157]
在一实施例中,所述从所述第二检测框组中选取与所述第一目标检测框匹配的第二检测框作为第二目标检测框,包括:从所述第二检测框组中选取至少一个子检测框,其中,所述子检测框的面积与所述第一目标检测框的面积之比均大于预设的面积比阈值;将所述子检测框设定为第二目标检测框。
[0158]
其技术效果为,提出一种多目标跟踪识别装置,所述装置一方面可以减少误识别的几率和避免重复上报导致成本偏高,另一方面可以从待处理视频对象中连续截取相邻的第一目标图像以及第二目标图像,获取第一目标图像的第一检测框以及第二目标图像的第二检测框,针对第一目标图像中的每一个第一检测框,均从第二目标图像中选取一个相匹配的第二检测框,并利用第一检测框与相匹配的第二检测框的物理位置匹配分值、特征度匹配分值来精准衡量二者框出的目标是否相同,从而实现对第一检测框框出的目标在第二目标图像中的追踪;以第二目标图像作为新的第一目标图像,以第二目标图像的后一帧图像作为新的第二目标图像,并循环进行上述处理过程,从而能够实现同时对多个目标在视频对象中的精准追踪。
[0159]
实施例3
[0160]
参见图4,图4为本发明另一个实施例提供的多目标跟踪识别装置的框图。对应于以上多目标跟踪识别方法,本发明还提供一种多目标跟踪识别装置70,该装置可以被配置于台式电脑、平板电脑、手提电脑等终端中,所述多目标跟踪识别装置70在实施例2的多目标跟踪识别装置10的基础上,还包括:
[0161]
目标判断单元71,用于判断所述第一目标检测框框出的目标是否为预设的违规目标。
[0162]
集合获取单元72,用于实现若所述第一目标检测框框出的目标为预设的违规目标,从所述待处理视频对象中获取所有包含所述目标的视频帧图像,得到违规图像集合。
[0163]
相似度获取单元73,用于分别获取所述违规图像集合中的视频帧图像的违规特征相似度,所述违规特征相似度为所述违规图像集合中的视频帧图像的特征与预设的违规标准图像的特征之间的相似程度的数值。
[0164]
选取上传单元74,用于从所述违规图像集合中选取违规特征相似度最大的视频帧图像作为违规图像,并将所述违规图像上传到预设的监控终端。
[0165]
在一实施例中,判断所述第一目标检测框框出的目标是否为预设的违规目标。其中,所述预设的违规目标属于本领域技术人员可以自定义的,根据预设的违规目标的特征、第一目标检测框框出的目标的特征,二者之间的匹配程度是否超过阈值,可以判断出所述目标是否为预设的违规目标,具体的判断方式为本领域技术人员所知晓,本发明对此不做具体限定。
[0166]
在一实施例中,若所述第一目标检测框框出的目标为预设的违规目标,从所述待处理视频对象中获取所有包含所述目标的视频帧图像,得到违规图像集合。其中,所有包含所述目标的视频帧图像为一个数据量大、处理成本高的图像集合,也就是说所述违规图像集合的处理成本高,长期上传或存储这一类图像集合,相当于增加了不必要的工作量。
[0167]
在一实施例中,分别获取所述违规图像集合中的视频帧图像的违规特征相似度,所述违规特征相似度为所述违规图像集合中的视频帧图像的特征与预设的违规标准图像的特征之间的相似程度的数值。其中,预设的违规标准图像属于本领域技术人员可以自定义的,其特征也可以根据现有技术手段获得;所述违规特征相似度相当于一个量化数值,用于衡量所述违规图像集合中的视频帧图像的违规程度。
[0168]
在一实施例中,从所述违规图像集合中选取违规特征相似度最大的视频帧图像作为违规图像,并将所述违规图像上传到预设的监控终端。其中,选取违规特征相似度最大的视频帧图像作为违规图像,即选取一个代表图像,该代表图像全面覆盖了所述违规图像集合,对代表图像的上传或存储成本较低,避免违规图像集合的重复累赘导致资源浪费。
[0169]
所述多目标跟踪识别装置70的有益效果为,所述装置可以连续截取第一目标图像以及第二目标图像,获取第一目标检测框以及第二目标检测框,将这两个目标检测框之间的关系用物理位置匹配分值、特征度匹配分值来精准衡量,最后判断衡量的结果是否符合预期的分数阈值,且在符合预期的情况下判定第一目标检测框所框出的目标、第二目标检测框所框出的目标之间相同,最后从所述违规图像集合中选取违规特征相似度最大的视频帧图像作为违规图像,并将所述违规图像作为唯一图像,上传到预设的监控终端;即实现了在目标跟踪过程中不仅能够减少误识别的几率,而且能够减少重复累赘导致资源浪费。
[0170]
实施例4
[0171]
请参阅图5,图5为本发明提供的一种电子设备的框图。该电子设备可以是终端,也可以是服务器,其中,终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。所述电子设备包括处理器111、通信接口112、存储器113、通信总线114,其中,处理器111,通信接口112,存储器113通过通信总线114完成
相互间的通信;
[0172]
存储器113,用于存放计算机程序;
[0173]
在本发明一个实施例中,处理器111,用于执行存储器113上所存放的程序时,实现前述任意一个方法实施例提供的方法。
[0174]
应当理解,在本技术实施例中,处理器111可以是中央处理单元(centra lprocessing unit,cpu),该处理器502还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0175]
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该计算机程序被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
[0176]
因此,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述任意一个方法实施例提供的方法的步骤。
[0177]
所述存储介质为实体的、非瞬时性的存储介质,例如可以是u盘、移动硬盘、只读存储器(read-on ly memory,rom)、磁碟或者光盘等各种可以存储程序代码的实体存储介质。所述计算机可读存储介质可以是非易失性,也可以是易失性。
[0178]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0179]
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
[0180]
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
[0181]
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
[0182]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述
的部分,可以参见其他实施例的相关描述。
[0183]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,尚且本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
[0184]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

技术特征:
1.一种多目标跟踪识别方法,其特征在于,所述方法包括:从待处理视频对象中截取视频帧图像,作为第一目标图像;从所述待处理视频对象中截取所述第一目标图像的下一帧图像,作为第二目标图像;分别将所述第一目标图像以及所述第二目标图像输入至预设的目标检测模型中,获得所述第一目标图像的第一检测框组以及所述第二目标图像的第二检测框组,所述第一检测框组包括至少一个第一检测框,所述第二检测框组包括至少一个第二检测框;从所述第一检测框组中选取第一检测框作为第一目标检测框;从所述第二检测框组中选取与所述第一目标检测框匹配的第二检测框作为第二目标检测框;获取所述第一目标检测框与所述第二目标检测框之间的几何信息,根据所述几何信息获取所述第一检测框与所述第二检测框之间的物理位置匹配分值;依据预设的特征提取算法,分别获取所述第一目标检测框限定的图像的第一图像特征向量以及所述第二目标检测框限定的图像的第二图像特征向量;根据所述第一图像特征向量以及所述第二图像特征向量,获取所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的特征度匹配分值;根据所述物理位置匹配分值与所述特征度匹配分值,获取所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的相似度分值;判断所述相似度分值是否大于预设的分数阈值;若所述相似度分值大于所述分数阈值,判定所述第一目标检测框框出的目标与所述第二目标检测框框出的目标相同;判断所述第一检测框组中是否存在未被选取的第一检测框;若所述第一检测框组中存在未被选取的第一检测框,转到所述从所述第一检测框组中选取第一检测框作为第一目标检测框的步骤;若所述第一检测框组不存在未被选取的第一检测框,将所述第二目标图像作为新的第一目标图像,转到所述从所述待处理视频对象中截取所述第一目标图像的下一帧图像作为第二目标图像的步骤。2.根据权利要求1所述的多目标跟踪识别方法,其特征在于,所述获取所述第一目标检测框与所述第二目标检测框之间的几何信息,包括:获取所述第一目标检测框与所述第二目标检测框之间的交并比、中心点距离比、宽度比以及高度比。3.根据权利要求1所述的多目标跟踪识别方法,其特征在于,所述根据所述几何信息获取所述第一检测框与所述第二检测框之间的物理位置匹配分值,包括:根据公式p
score
=iou-((c
dis
/c)+(w
dis
/w)+(h
dis
/h))计算所述第一检测框与所述第二检测框之间的物理位置匹配分值;其中,iou为交并比,c
dis
/c为中心点距离比,w
dis
/w为宽度比,h
dis
/h为高度比,p
score
为物理位置匹配分值。4.根据权利要求1所述的多目标跟踪识别方法,其特征在于,所述根据所述第一图像特征向量以及所述第二图像特征向量,获取所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的特征度匹配分值,包括:
根据公式计算所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的特征度匹配分值;其中,(x1,x2,...,x
n
)为第一特征向量,(y1,y2,...,y
n
)为第二特征向量。5.根据权利要求1所述的多目标跟踪识别方法,其特征在于,所述根据所述物理位置匹配分值与所述特征度匹配分值,获取所述第一目标检测框限定的图像与所述第二目标检测框限定的图像之间的相似度分值,包括:将所述物理位置匹配分值与预设的第一加权系数相乘,得到物理位置加权分值;将所述特征度匹配分值与预设的第二加权系数相乘,得到特征度加权分值;将所述物理位置加权分值与所述特征度加权分值相加,得到所述相似度分值。6.根据权利要求1所述的多目标跟踪识别方法,其特征在于,所述从所述第二检测框组中选取与所述第一目标检测框匹配的第二检测框作为第二目标检测框,包括:从所述第二检测框组中选取至少一个子检测框,其中,所述子检测框的面积与所述第一目标检测框的面积之比大于预设的面积比阈值;将所述子检测框设定为第二目标检测框。7.根据权利要求1所述的多目标跟踪识别方法,其特征在于,所述方法还包括:判断所述第一目标检测框框出的目标是否为预设的违规目标;若所述第一目标检测框框出的目标为预设的违规目标,从所述待处理视频对象中获取所有包含所述目标的视频帧图像,得到违规图像集合;分别获取所述违规图像集合中的视频帧图像的违规特征相似度,所述违规特征相似度为所述违规图像集合中的视频帧图像的特征与预设的违规标准图像的特征之间的相似程度的数值;从所述违规图像集合中选取违规特征相似度最大的视频帧图像作为违规图像,并将所述违规图像上传到预设的监控终端。8.一种多目标跟踪识别装置,其特征在于,所述多目标跟踪识别装置包括用于执行如权利要求1-7任一项所述方法的单元。9.一种电子设备,其特征在于,包括:存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一项所述方法的步骤。10.一种计算机可读存储介质,其特征在于:所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时可实现如权利要求1-7中任一项所述的方法。

技术总结
本发明涉及一种多目标跟踪识别方法、装置、电子设备及介质,涉及识别算法领域,包括从待处理视频对象中连续截取相邻的第一目标图像以及第二目标图像,获取第一目标图像的第一检测框以及第二目标图像的第二检测框,针对第一目标图像中的每一个第一检测框,均从第二目标图像中选取一个相匹配的第二检测框,并利用第一检测框与相匹配的第二检测框的物理位置匹配分值、特征度匹配分值来精准衡量二者框出的目标是否相同,从而实现对第一检测框框出的目标在第二目标图像中的追踪;以第二目标图像作为新的第一目标图像,以第二目标图像的后一帧图像作为新的第二目标图像,并循环进行上述处理过程,从而能够实现同时对多个目标在视频对象中的精准追踪。对象中的精准追踪。对象中的精准追踪。


技术研发人员:温职先
受保护的技术使用者:深圳市亚略特科技股份有限公司
技术研发日:2023.03.31
技术公布日:2023/7/7
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐