视频检测的方法、装置、电子设备及存储介质与流程
未命名
08-02
阅读:93
评论:0

技术领域:
:,具体涉及计算机视觉、视频处理、图像识别等
技术领域:
:。
背景技术:
::2.视频检测,即视频目标检测主要是对视频中每一帧图像的目标识别和定位。但是,与单纯对图片中的目标检测不同,由于视频自身的特有情况,视频目标检测还需要解决视频图像中的运动模糊,视频失焦,目标部分遮挡以及目标形变等问题。3.目前,相关技术中的视频检测方式可以包括基于网络结构优化的视频检测和基于知识蒸馏算法的视频检测等。技术实现要素:4.本公开提供了一种视频检测的方法、装置、电子设备及存储介质。5.根据本公开的一方面,提供了一种视频检测的方法,包括:6.获取待检测的视频数据;7.对所述视频数据进行分类处理,以获得所述视频数据中的模糊图像帧和第一清晰图像帧;8.对所述第一清晰图像帧进行检测处理,以获得所述第一清晰图像帧的目标检测结果;9.从所述第一清晰图像帧中选取用于替换所述模糊图像帧的第二清晰图像帧,以根据所述第一清晰图像帧的目标检测结果和所述第二清晰图像帧的目标检测结果,确定所述视频数据的目标检测结果。10.根据本公开的另一方面,提供了一种视频检测的装置,包括:11.获取单元,用于获取待检测的视频数据;12.分类单元,用于对所述视频数据进行分类处理,以获得所述视频数据中的模糊图像帧和第一清晰图像帧;13.检测单元,用于对所述第一清晰图像帧进行检测处理,以获得所述第一清晰图像帧的目标检测结果;14.确定单元,用于从所述第一清晰图像帧中选取用于替换所述模糊图像帧的第二清晰图像帧,以根据所述第一清晰图像帧的目标检测结果和所述第二清晰图像帧的目标检测结果,确定所述视频数据的目标检测结果。15.根据本公开的再一方面,提供了一种电子设备,包括:16.至少一个处理器;以及17.与所述至少一个处理器通信连接的存储器;其中,18.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方面和任一可能的实现方式的方法。19.根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的方面和任一可能的实现方式的方法。20.根据本公开的又一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方面和任一可能的实现方式的方法。21.由上述技术方案可知,本公开实施例可以通过对所获取的待检测的视频数据进行分类处理,以获得所述视频数据中的模糊图像帧和第一清晰图像帧,进而可以对所述第一清晰图像帧进行检测处理,以获得所述第一清晰图像帧的目标检测结果,使得能够从所述第一清晰图像帧中选取用于替换所述模糊图像帧的第二清晰图像帧,以根据所述第一清晰图像帧的目标检测结果和所述第二清晰图像帧的目标检测结果,确定所述视频数据的目标检测结果,由于通过先分出视频数据中的模糊图像帧和清晰图像帧,再对清晰图像帧进行目标检测处理,模糊图像帧可以仅需复用所选取的清晰图像帧的目标检测结果,便可以获得较有效地视频检测结果,尽可能地避免了模糊的视频图像帧对视频检测结果的不良影响,从而优化视频检测的可靠性。22.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明23.附图用于更好地理解本方案,不构成对本公开的限定。其中:24.图1是根据本公开第一实施例的示意图;25.图2是根据本公开第二实施例的示意图;26.图3是根据本公开第三实施例的示意图;27.图4是用来实现本公开实施例的视频检测的方法的电子设备的框图。具体实施方式28.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。29.显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。30.需要说明的是,本公开实施例中所涉及的终端设备可以包括但不限于手机、个人数字助理(personaldigitalassistant,pda)、无线手持设备、平板电脑(tabletcomputer)等智能设备;显示设备可以包括但不限于个人电脑、电视等具有显示功能的设备。31.另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。32.目前,通常的视频检测方式主要包括基于网络结构优化的视频检测方法和基于知识蒸馏算法的视频检测方法。具体地,基于网络结构优化的视频检测方法,例如,可以是使用残差网络(resnets),使得视频的目标检测模型可以越来越深、表达力越来越强,进而使得视频检测的效果越来越好。或者是,基于深度可分离卷积网络,降低视频的目标检测模型的参数量和计算量大大,从而提升视频检测的速度。33.但是,基于网络结构优化的视频检测方法,由于网络结构复杂,在实际应用中,需要多次的模型训练实验,非常耗费资源。而且,虽然通过对网络结构优化可以一定程度上提升检测速度,但还是不能很好的满足实际应用的效率需求。基于知识蒸馏算法的视频检测方法,由于目标检测往往是由多个模块的模型组成的,每一个模块都需要单独进行知识蒸馏,训练过程比较复杂的,实际上增益不佳。34.因此,亟需提供一种视频检测的方法,能够实现对视频中目标对象的高效地检测,从而优化视频检测的可靠性。具体执行以下步骤:35.图1是根据本公开第一实施例的示意图,如图1所示。36.101、获取待检测的视频数据。37.102、对所述视频数据进行分类处理,以获得所述视频数据中的模糊图像帧和第一清晰图像帧。38.103、对所述第一清晰图像帧进行检测处理,以获得所述第一清晰图像帧的目标检测结果。39.104、从所述第一清晰图像帧中选取用于替换所述模糊图像帧的第二清晰图像帧,以根据所述第一清晰图像帧的目标检测结果和所述第二清晰图像帧的目标检测结果,确定所述视频数据的目标检测结果。40.需要说明的是,模糊图像帧可以复用第二清晰图像帧的目标检测结果,即将第二清晰图像帧的目标检测结果作为对应的模糊图像帧的目标检测结果。换言之,第二清晰图像帧的目标检测结果可以是模糊图像帧的目标检测结果。后续,结合第一清晰图像帧的目标检测结果和模糊图像帧的目标检测结果,可以得到所述视频数据所有图像帧的目标检测结果,即所述视频数据的目标检测结果。41.需要说明的是,101~104的执行主体的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(softwaredevelopmentkit,sdk)等功能单元,或者还可以为位于网络侧服务器中的处理引擎,或者还可以为位于网络侧的分布式系统,例如,网络侧的视频检测平台中的处理引擎或者分布式系统等,本实施例对此不进行特别限定。42.可以理解的是,所述应用可以是安装在本地终端上的本地程序(nativeapp),或者还可以是本地终端上的浏览器的一个网页程序(webapp),本实施例对此不进行限定。43.这样,本公开实施例可以通过对所获取的待检测的视频数据进行分类处理,以获得所述视频数据中的模糊图像帧和第一清晰图像帧,进而可以对所述第一清晰图像帧进行检测处理,以获得所述第一清晰图像帧的目标检测结果,使得能够从所述第一清晰图像帧中选取用于替换所述模糊图像帧的第二清晰图像帧,以根据所述第一清晰图像帧的目标检测结果和所述第二清晰图像帧的目标检测结果,确定所述视频数据的目标检测结果,由于通过先分出视频数据中的模糊图像帧和清晰图像帧,再对清晰图像帧进行目标检测处理,模糊图像帧可以仅需复用所选取的清晰图像帧的目标检测结果,便可以获得较有效地视频检测结果,尽可能地避免了模糊的视频图像帧对视频检测结果的不良影响,从而优化视频检测的可靠性。44.可选地,在本实施例的一个可能的实现方式中,在102中,具体可以利用预设的分类模型,对所述视频数据进行分类处理,得到分类处理的结果,进而可以根据所述分类处理的结果,获得所述视频数据中的所述模糊图像帧和所述第一清晰图像帧。45.在本实现方式中,预设的分类模型可以包括基于卷积神经网络的轻量级模型。例如,预设的分类模型可以包括但不限于mobilenet系列的轻量级模型。该预设的分类模型可以用于分析图像的清晰情况,并基于图像的清晰情况对图像进行分类处理。46.在该实现方式的一个具体实现过程中,具体可以将待检测的视频数据输入预设的分类模型,可以输出得到视频数据中的模糊图像帧和第一清晰图像帧。47.具体地,该第一清晰图像帧可以是视频数据中的所有清晰的图像帧。该模糊图像帧可以是视频数据中的所有模糊的图像帧。48.这样,在本实现方式中,可以通过利用预设的分类模型,对视频数据进行分类处理,得到视频数据中的模糊图像帧和清晰图像帧,提升了对视频所有图像帧的分类的准确性和可靠性。并且,还可以便于后续可以通过对模糊图像帧和清晰图像帧目标检测处理,得到更加准确有效地视频的目标检测结果,从而提升了视频检测的可靠性。49.可选地,在本实施例的一个可能的实现方式中,在103中,具体可以利用预设的目标检测模型,对所述第一清晰图像帧进行检测处理,得到检测处理的结果,进而可以根据所述检测处理的结果,获得所述第一清晰图像帧的目标检测结果。50.在本实现方式中,预设的目标检测模型可以包括基于目标检测算法的模型。51.预设的目标检测模型还可以包括针对不同目标对象的目标检测模型。例如,预设的目标检测模型可以包括但不限于车牌检测模型、人脸检测模型等等。52.在该实现方式的一个具体实现过程中,具体可以将待检测的视频数据输入预设的分类模型,可以输出得到模糊图像帧和第一清晰图像帧。53.具体地,该第一清晰图像帧可以是视频数据中的所有清晰的图像帧。第一清晰图像帧的数量可以是至少一个,模糊图像帧的数量可以是至少一个。54.例如,第一清晰图像帧可以是清晰图像帧的集合,模糊图像帧可以是模糊图像帧的集合。55.可以理解的是,这里,目标检测算法可以是现有的能够实现目标检测功能的算法。在实际业务中,可以根据业务需求选择相应地目标检测算法,在此可以不做具体限定。56.这样,在本实现方式中,可以通过利用预设的目标检测模型,对第一清晰图像帧进行检测处理,得到第一清晰图像帧的目标检测结果,以便于后续可以仅需对清晰图像帧进行目标检测处理,减少了数据处理量的同时,也可以减少了模糊图像帧对目标检测结果的不利影响,从而进一步地提升了视频检测的可靠性。57.需要说明的是,基于本实现方式中所提供的多种具体实现过程,可以结合前述实现方式中所提供的多种实现方式中的多种具体实现过程,来实现本实施例的视频检测的方法。详细的描述可以参见前述实现方式中的相关内容,此处不再赘述。58.可选地,在本实施例的一个可能的实现方式中,在104中,具体地可以获取所述模糊图像帧与所述第一清晰图像帧之间的第一距离,进而可以响应于所述第一距离满足预设的距离条件,将所述第一清晰图像帧作为用于替换所述模糊图像帧的第二清晰图像帧。59.在本实现方式中,第一距离可以是当前模糊图像帧与一个第一清晰图像帧的距离,即两个图像帧的间距。60.例如,第一距离为5,可以表示一个模糊图像帧与一个第一清晰图像帧之间的相差5帧。61.在本实现方式中,预设的距离条件可以包括第一距离达到预设的距离阈值,或者,第一距离在预设的距离范围内等。62.具体地,预设的距离阈值可以根据待检测的视频数据中的目标对象的情况,进行预先配置。63.示例性的,目标对象的运动速度较快,可以预先配置较小的距离阈值,或,目标对象的运动速度较慢,可以预先配置较大的距离阈值。64.例如,目标对象是行驶的车辆,可以预先配置距离阈值为2帧。目标对象是行人,可以预先配置距离阈值为5帧。65.可选地,预设的距离范围可以根据待检测的视频数据中的目标对象的情况,进行预先配置。66.例如,目标对象是行驶的车辆,可以预先配置距离范围为2帧。目标对象是行人,可以预先配置距离范围为5帧。67.可以理解的是,这里是在与当前模糊图像帧相邻近的第一清晰图像帧中进行选择。例如,可以选取与当前模糊图像帧相距2帧的第一清晰图像帧。68.在该实现方式的一个具体实现过程中,针对任意一个当前模糊图像帧,若该当前模糊图像帧与任意一个第一清晰图像帧之间的第一距离达到预设的距离阈值,则可以将该第一清晰图像帧作为用于替换当前模糊图像帧的第二清晰图像帧。69.可以理解的是,用于替换当前模糊图像帧的第二清晰图像帧可以包括当前模糊图像帧之前的第一清晰图像帧和当前模糊图像帧之后的第一清晰图像帧中的至少一个。在实际应用中,可以根据实际业务需求,选取可以用于替换当前模糊图像帧的第二清晰图像帧。70.这样,在本实现方式中,可以通过获取模糊图像帧与第一清晰图像帧之间的第一距离,将第一距离满足预设的距离条件的第一清晰图像帧作为用于替换模糊图像帧的第二清晰图像帧。由此,可以选取出更加适合于替换模糊图像帧的第二清晰图像帧,以便于模糊图像帧复用该第二清晰图像帧的目标检测结果,无需再对模糊图像帧进行目标检测处理,提升了数据处理的效率,减少了模糊图像帧对目标检测结果的不利影响,从而进一步地提升了视频检测的可靠性和准确性。71.在该实现方式的另一个具体实现过程中,进一步地还可以获取所述模糊图像帧和替换所述模糊图像帧的第二清晰图像帧之间的第二距离,进而可以根据所述第二距离,对所述第二清晰图像帧的目标检测结果进行扩展处理,以获得扩展处理后的所述第二清晰图像帧的目标检测结果。72.在本实现方式中,第二距离可以是模糊图像帧和替换该模糊图像帧的第二清晰图像帧之间的相对距离。73.该具体实现过程的一个情况,具体可以获取第二清晰图像帧的目标检测结果中的目标检测框,进而可以根据所述第二距离,确定放大倍数,使得能够根据所述放大倍数,对所述目标检测框进行扩展处理。74.具体地,可以根据第二距离,以及第二距离与放大倍数的预设关系,确定第二距离对应的放大倍数。75.这里,第二距离与放大倍数的预设关系中,第二距离越大,对应的放大倍数可以越大,第二距离越小,对应的放大倍数可以越小。76.此外,还可以根据待检测的视频数据中的目标对象的运动情况,确定放大倍数。目标对象的运动速度越快,对应的放大倍数可以越大,目标对象的运动速度越慢,对应的放大倍数可以越小。77.可选地,还可以根据所述放大倍数,对所述目标检测框进行等比例的扩展处理。78.示例性的,若放大倍数为4,可以同时将目标检测框的长度和宽度扩展4倍。79.这样,可以通过根据模糊图像帧和替换模糊图像帧的第二清晰图像帧之间的第二距离,对第二清晰图像帧的目标检测结果进行扩展处理,得到扩展处理后的所述第二清晰图像帧的目标检测结果,可以有效地防止漏检问题的发生,从而进一步地提升了视频检测的可靠性和准确性。80.并且,可以通过根据第二距离对应的放大倍数,对第二清晰图像帧的目标检测结果中的目标检测框进行扩展,可以获得更加全面地目标检测结果,进一步地避免漏检,从而进一步地提升了视频检测的可靠性和准确性。81.可选地,在本实施例的一个可能的实现方式中,在101中,具体可以获取待检测的视频数据的每个图像帧,进而可以根据预设的缩小倍数,对所述每个图像帧进行缩小处理,以获得缩小处理后的所述视频数据。82.在该实现方式的一个具体实现过程中,首先,可以获取待检测的视频数据的每个图像帧。其次,根据预设的缩小倍数,对所述每个图像帧进行等比例的缩小处理,得到缩小处理的后的每个图像帧。再次,根据缩小处理的后的每个图像帧,获得缩小处理后的所述视频数据。83.在该实现方式的另一个具体实现过程中,首先,可以获取待检测的视频数据的每个图像帧。其次,根据预设的放大倍数,对所述每个图像帧进行等比例的放大处理,得到放大处理的后的每个图像帧。再次,根据放大处理的后的每个图像帧,获得放大处理后的所述视频数据。84.可以理解的是,可以根据实际业务场景的需求,确定对视频数据的每个图像帧进行缩小处理或者进行放大处理。85.例如,如果实际业务场景对视频检测的速度要求较高,可以对视频数据的每个图像帧进行缩小处理。如果实际业务场景对视频检测的准确性和效果要求较高,可以对视频数据的每个图像帧进行放大处理。86.这里,预设的缩小倍数和预设的放大倍数均可以是根据视频检测历史经验所预先配置的。87.这样,在本实现方式中,可以通过根据预设的缩小倍数,对视频数据每个图像帧进行缩小处理,得到缩小处理后的视频数据,可以有效地减少后续检测时所要处理的数据量,从而提升了视频检测的处理速度。88.此外,还可以通过根据预设的放大倍数,对视频数据每个图像帧进行放大处理,得到放大处理后的视频数据,由于放大后的的视频数据中的图像特征信息可能更加丰富和全面,后续对放大后的的视频数据进行目标检测时,可以获得更加有效地目标检测结果,从而提升了视频检测的效果。89.需要说明的是,基于本实现方式中所提供的多种具体实现过程,可以结合前述实现方式中所提供的多种实现方式中的多种具体实现过程,来实现本实施例的视频检测的方法。详细的描述可以参见前述实现方式中的相关内容,此处不再赘述。90.本实施例中,可以通过对所获取的待检测的视频数据进行分类处理,以获得所述视频数据中的模糊图像帧和第一清晰图像帧,进而可以对所述第一清晰图像帧进行检测处理,以获得所述第一清晰图像帧的目标检测结果,使得能够从所述第一清晰图像帧中选取用于替换所述模糊图像帧的第二清晰图像帧,以根据所述第一清晰图像帧的目标检测结果和所述第二清晰图像帧的目标检测结果,确定所述视频数据的目标检测结果,由于通过先分出视频数据中的模糊图像帧和清晰图像帧,再对清晰图像帧进行目标检测处理,模糊图像帧可以仅需复用所选取的清晰图像帧的目标检测结果,便可以获得较有效地视频检测结果,尽可能地避免了模糊的视频图像帧对视频检测结果的不良影响,从而优化视频检测的可靠性。91.另外,采用本实施例所提供的技术方案,可以通过利用预设的分类模型,对视频数据进行分类处理,得到视频数据中的模糊图像帧和清晰图像帧,提升了对视频图像帧的分类的准确性和可靠性。并且,还可以便于后续可以通过对模糊图像帧和清晰图像帧目标检测处理,得到更加准确有效地视频的目标检测结果,从而提升了视频检测的可靠性。92.另外,采用本实施例所提供的技术方案,可以通过利用预设的目标检测模型,对第一清晰图像帧进行检测处理,得到第一清晰图像帧的目标检测结果。由此,可以仅需对清晰图像帧进行目标检测处理,减少了数据处理量的同时,也可以减少了模糊图像帧对目标检测结果的不利影响,从而进一步地提升了视频检测的可靠性。93.另外,采用本实施例所提供的技术方案,可以通过获取模糊图像帧与第一清晰图像帧之间的第一距离,将第一距离满足预设的距离条件的第一清晰图像帧作为用于替换模糊图像帧的第二清晰图像帧。由此,可以选取出更加适合于替换模糊图像帧的第二清晰图像帧,以便于模糊图像帧复用该第二清晰图像帧的目标检测结果,无需再对模糊图像帧进行目标检测处理,提升了数据处理的效率,减少了模糊图像帧对目标检测结果的不利影响,从而进一步地提升了视频检测的可靠性和准确性。94.另外,采用本实施例所提供的技术方案,可以通过根据模糊图像帧和替换模糊图像帧的第二清晰图像帧之间的第二距离,对第二清晰图像帧的目标检测结果进行扩展处理,得到扩展处理后的所述第二清晰图像帧的目标检测结果,可以有效地防止漏检问题的发生,从而进一步地提升了视频检测的可靠性和准确性。95.并且,可以通过根据第二距离对应的放大倍数,对第二清晰图像帧的目标检测结果中的目标检测框进行扩展,可以获得更加全面地目标检测结果,进一步地避免漏检,从而进一步地提升了视频检测的可靠性和准确性。96.另外,采用本实施例所提供的技术方案,可以通过根据预设的缩小倍数,对视频数据每个图像帧进行缩小处理,得到缩小处理后的视频数据,可以有效地减少后续检测时所要处理的数据量,从而提升了视频检测的处理速度。97.图2是根据本公开第二实施例的示意图,如图2所示。98.在本实施例中,为了更好地理解本公开的视频检测的方法,现在结合应用实例对本公开的视频检测的方法进行详细说明。99.201、获取待检测的视频数据的每个图像帧。100.202、根据预设的缩小倍数或预设的放大倍数,对视频数据的每个图像帧进行等比例的缩小处理或等比例的放大处理,以获得缩小处理或放大处理后的视频数据。101.在本实施例中,视频数据是由一帧一帧连续的图像构成的,而每一帧图像的分辨率通常都是一样的,例如,可以都是1920像素(px)*1080像素(px)。102.这里,可以通过对视频数据的每个图像帧进行等比例缩放处理,以实现优化视频检测处理。103.示例性的,可以将大尺寸图像,即图像帧,如,1920px*1080px尺寸的图像,等比例的缩小到640px*360px,基于缩小后的图像进行视频检测,可以使得检测速度提高800倍。104.此外,示例性的,还可以将640px*360px尺寸的图片,等比例放大到840px*472px,基于放大后的图像进行视频检测,可以使得检测效果提升了20%。105.可以理解的是,可以按照实际应用场景,确定是对视频数据中的图像进行缩小处理或者是对图像进行放大处理。如果实际应用场景更加重视检测速度,则可以适当的对图像帧的尺寸进行等比例的缩小;如果实际应用场景更加重视检测效果,则可以适当的对图像帧的尺寸进行等比例的放大。106.203、利用预设的分类模型,对缩小处理或放大处理后的视频数据进行分类处理,得到视频数据中的模糊图像帧和第一清晰图像帧。107.204、利用预设的目标检测模型,对第一清晰图像帧进行检测处理,得到第一清晰图像帧的目标检测结果。108.在本实施例中,预设的分类模型可以包括但不限于mobilenet系列的轻量级模型。109.例如,预设的分类模型可以包括mobilenet-v1-0.25轻量级网络模型。110.在本实施例中,预设的目标检测模型可以包括针对不同目标对象的目标检测模型。例如,预设的目标检测模型可以包括但不限于车牌检测模型、人脸检测模型等等。111.由于目标检测模型对模糊图像帧的检测效果不佳,通常无法正确检测目标对象的,而且视频检测的时间较长。这里,可以利用预设的目标检测模型,仅对第一清晰图像帧进行检测处理。112.205、获取模糊图像帧与第一清晰图像帧之间的第一距离。113.206、若第一距离达到预设的距离阈值,则将该第一清晰图像帧作为用于替换该模糊图像帧的第二清晰图像帧。114.在本实施例中,针对任意一个当前模糊图像帧,若该当前模糊图像帧与任意一个第一清晰图像帧之间的第一距离达到预设的距离阈值,则可以将该第一清晰图像帧作为用于替换当前模糊图像帧的第二清晰图像帧。115.进一步地,首先,可以获取模糊图像帧和替换模糊图像帧的第二清晰图像帧之间的第二距离。其次,可以根据第二距离,以及第二距离与放大倍数的预设关系,确定第二距离对应的放大倍数。再次,获取第二清晰图像帧的目标检测结果中的目标检测框,再次,根据放大倍数,对目标检测框进行扩展处理,以获得扩展处理后的第二清晰图像帧的目标检测结果。116.具体地,第二距离可以是模糊图像帧和替换该模糊图像帧的第二清晰图像帧之间的相对距离。117.具体地,在第二距离与放大倍数的预设关系中,第二距离越大,对应的放大倍数可以越大,第二距离越小,对应的放大倍数可以越小。118.此外,还可以根据待检测的视频数据中的目标对象的运动情况,确定放大倍数。目标对象的运动速度越快,对应的放大倍数可以越大,目标对象的运动速度越慢,对应的放大倍数可以越小。119.可选地,还可以根据放大倍数,对目标检测框进行等比例的扩展处理。120.此外,可以理解的是,如果当前模糊图像帧不能满足实际应用场景的需求,则可以直接放弃该模糊图像帧。121.207、获取第二清晰图像帧的目标检测结果,以使得模糊图像帧复用第二清晰图像帧的目标检测结果。122.在本实施例中,基于前述204步骤的处理,可以得到所有清晰图像帧的目标检测结果,进而可以从所有清晰图像帧的目标检测结果中,获取到第二清晰图像帧的目标检测结果。123.这里,可以直接将第二清晰图像帧的目标检测结果作为模糊图像帧的目标检测结果,即模糊图像帧是复用该第二清晰图像帧的目标检测结果。124.208、根据第一清晰图像帧的目标检测结果和第二清晰图像帧的目标检测结果,确定视频数据的目标检测结果。125.在本实施例中,第二清晰图像帧的目标检测结果即是模糊图像帧的目标检测结果。126.这里,结合第一清晰图像帧的目标检测结果和模糊图像帧的目标检测结果,可以得到视频数据的目标检测结果。127.采用本实施例所提供的技术方案,可以通过先分出视频数据中的模糊图像帧和清晰图像帧,再对清晰图像帧进行目标检测处理,模糊图像帧仅需直接复用前后相邻的清晰图像帧的目标检测结果,再结合模糊图像帧的目标检测结果和其他清晰图像帧的目标检测结果,便可以获得较有效地视频检测结果,避免了模糊的视频图像帧对视频检测结果的不良影响,从而优化视频检测的可靠性。128.而且,采用本实施例所提供的技术方案,可以在视频检测的速度不变的情况下,对视频中的模糊图像帧的检测效果提升了90%,对整体视频的检测效果提升了10%。129.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受所描述的动作顺序的限制,因为依据本公开,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本公开所必须的。130.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。131.图3是根据本公开第三实施例的示意图,如图3所示。本实施例的视频检测的装置300可以包括获取单元301、分类单元302、检测单元303和确定单元304,其中,获取单元301,用于获取待检测的视频数据;分类单元302,用于对所述视频数据进行分类处理,以获得所述视频数据中的模糊图像帧和第一清晰图像帧;检测单元303,用于对所述第一清晰图像帧进行检测处理,以获得所述第一清晰图像帧的目标检测结果;确定单元304,用于从所述第一清晰图像帧中选取用于替换所述模糊图像帧的第二清晰图像帧,以根据所述第一清晰图像帧的目标检测结果和所述第二清晰图像帧的目标检测结果,确定所述视频数据的目标检测结果。132.需要说明的是,本实施例的视频检测的装置的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(softwaredevelopmentkit,sdk)等功能单元,或者还可以为位于网络侧服务器中的处理引擎,或者还可以为位于网络侧的分布式系统,例如,网络侧的视频检测平台中的处理引擎或者分布式系统等,本实施例对此不进行特别限定。133.可以理解的是,所述应用可以是安装在本地终端上的本地程序(nativeapp),或者还可以是本地终端上的浏览器的一个网页程序(webapp),本实施例对此不进行限定。134.可选地,在本实施例的一个可能的实现方式中,所述分类单元302,具体可以用于利用预设的分类模型,对所述视频数据进行分类处理,得到分类处理的结果,根据所述分类处理的结果,获得所述视频数据中的所述模糊图像帧和所述第一清晰图像帧。135.可选地,在本实施例的一个可能的实现方式中,所述检测单元303,具体可以用于利用预设的目标检测模型,对所述第一清晰图像帧进行检测处理,得到检测处理的结果,根据所述检测处理的结果,获得所述第一清晰图像帧的目标检测结果。136.可选地,在本实施例的一个可能的实现方式中,所述确定单元304,具体可以用于获取所述模糊图像帧与所述第一清晰图像帧之间的第一距离,响应于所述第一距离满足预设的距离条件,将所述第一清晰图像帧作为用于替换所述模糊图像帧的第二清晰图像帧。137.可选地,在本实施例的一个可能的实现方式中,所述确定单元304,还可以用于获取所述模糊图像帧和替换所述模糊图像帧的第二清晰图像帧之间的第二距离,根据所述第二距离,对所述第二清晰图像帧的目标检测结果进行扩展处理,以获得扩展处理后的所述第二清晰图像帧的目标检测结果。138.可选地,在本实施例的一个可能的实现方式中,所述确定单元304,还可以用于获取第二清晰图像帧的目标检测结果中的目标检测框,根据所述第二距离,确定放大倍数,根据所述放大倍数,对所述目标检测框进行扩展处理。139.可选地,在本实施例的一个可能的实现方式中,所述获取单元301,具体可以用于获取待检测的视频数据的每个图像帧,根据预设的缩小倍数,对所述每个图像帧进行缩小处理,以获得缩小处理后的所述视频数据。140.本实施例中,通过获取单元获取待检测的视频数据,进而可以由分类单元对所述视频数据进行分类处理,以获得所述视频数据中的模糊图像帧和第一清晰图像帧,由检测单元对所述第一清晰图像帧进行检测处理,以获得所述第一清晰图像帧的目标检测结果,使得确定单元能够从所述第一清晰图像帧中选取用于替换所述模糊图像帧的第二清晰图像帧,以根据所述第一清晰图像帧的目标检测结果和所述第二清晰图像帧的目标检测结果,确定所述视频数据的目标检测结果,由于通过先分出视频数据中的模糊图像帧和清晰图像帧,再对清晰图像帧进行目标检测处理,模糊图像帧仅需复用所选取的清晰图像帧的目标检测结果,便可以获得较有效地视频检测结果,尽可能地避免了模糊的视频图像帧对视频检测结果的不良影响,从而优化视频检测的可靠性。141.另外,采用本实施例所提供的技术方案,可以通过利用预设的分类模型,对视频数据进行分类处理,得到视频数据中的模糊图像帧和清晰图像帧,提升了对视频图像帧的分类的准确性和可靠性。并且,还可以便于后续可以通过对模糊图像帧和清晰图像帧目标检测处理,得到更加准确有效地视频的目标检测结果,从而提升了视频检测的可靠性。142.另外,采用本实施例所提供的技术方案,可以通过利用预设的目标检测模型,对第一清晰图像帧进行检测处理,得到第一清晰图像帧的目标检测结果。由此,可以仅需对清晰图像帧进行目标检测处理,减少了数据处理量的同时,也可以减少了模糊图像帧对目标检测结果的不利影响,从而进一步地提升了视频检测的可靠性。143.另外,采用本实施例所提供的技术方案,可以通过获取模糊图像帧与第一清晰图像帧之间的第一距离,将第一距离满足预设的距离条件的第一清晰图像帧作为用于替换模糊图像帧的第二清晰图像帧。由此,可以选取出更加适合于替换模糊图像帧的第二清晰图像帧,以便于模糊图像帧复用该第二清晰图像帧的目标检测结果,无需再对模糊图像帧进行目标检测处理,提升了数据处理的效率,减少了模糊图像帧对目标检测结果的不利影响,从而进一步地提升了视频检测的可靠性和准确性。144.另外,采用本实施例所提供的技术方案,可以通过根据模糊图像帧和替换模糊图像帧的第二清晰图像帧之间的第二距离,对第二清晰图像帧的目标检测结果进行扩展处理,得到扩展处理后的所述第二清晰图像帧的目标检测结果,可以有效地防止漏检问题的发生,从而进一步地提升了视频检测的可靠性和准确性。145.并且,可以通过根据第二距离对应的放大倍数,对第二清晰图像帧的目标检测结果中的目标检测框进行扩展,可以获得更加全面地目标检测结果,进一步地避免漏检,从而进一步地提升了视频检测的可靠性和准确性。146.另外,采用本实施例所提供的技术方案,可以通过根据预设的缩小倍数,对视频数据每个图像帧进行缩小处理,得到缩小处理后的视频数据,可以有效地减少后续检测时所要处理的数据量,从而提升了视频检测的处理速度。147.本公开的技术方案中,所涉及的用户个人信息,例如,用户的图像和属性数据等的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。148.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。149.图4示出了可以用来实施本公开的实施例的示例电子设备400的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。150.如图4所示,电子设备400包括计算单元401,其可以根据存储在只读存储器(rom)402中的计算机程序或者从存储单元408加载到随机访问存储器(ram)403中的计算机程序,来执行各种适当的动作和处理。在ram403中,还可存储电子设备400操作所需的各种程序和数据。计算单元401、rom402以及ram403通过总线404彼此相连。输入/输出(i/o)接口405也连接至总线404。151.电子设备400中的多个部件连接至i/o接口405,包括:输入单元406,例如键盘、鼠标等;输出单元407,例如各种类型的显示器、扬声器等;存储单元408,例如磁盘、光盘等;以及通信单元409,例如网卡、调制解调器、无线通信收发机等。通信单元409允许电子设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。152.计算单元401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元401的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元401执行上文所描述的各个方法和处理,例如视频检测的方法。例如,在一些实施例中,视频检测的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元408。在一些实施例中,计算机程序的部分或者全部可以经由rom402和/或通信单元409而被载入和/或安装到电子设备400上。当计算机程序加载到ram403并由计算单元401执行时,可以执行上文描述的视频检测的方法的一个或多个步骤。备选地,在其他实施例中,计算单元401可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行视频检测的方法。153.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。154.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。155.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。156.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。157.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。158.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。159.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。160.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。当前第1页12当前第1页12
技术特征:
1.一种视频检测的方法,包括:获取待检测的视频数据;对所述视频数据进行分类处理,以获得所述视频数据中的模糊图像帧和第一清晰图像帧;对所述第一清晰图像帧进行检测处理,以获得所述第一清晰图像帧的目标检测结果;从所述第一清晰图像帧中选取用于替换所述模糊图像帧的第二清晰图像帧,以根据所述第一清晰图像帧的目标检测结果和所述第二清晰图像帧的目标检测结果,确定所述视频数据的目标检测结果。2.根据权利要求1所述的方法,其中,所述对所述视频数据进行分类处理,以获得所述视频数据中的模糊图像帧和第一清晰图像帧,包括:利用预设的分类模型,对所述视频数据进行分类处理,得到分类处理的结果;根据所述分类处理的结果,获得所述视频数据中的所述模糊图像帧和所述第一清晰图像帧。3.根据权利要求1或2所述的方法,其中,所述对所述第一清晰图像帧进行检测处理,以获得所述第一清晰图像帧的目标检测结果,包括:利用预设的目标检测模型,对所述第一清晰图像帧进行检测处理,得到检测处理的结果;根据所述检测处理的结果,获得所述第一清晰图像帧的目标检测结果。4.根据权利要求1-3中任一项所述的方法,其中,所述从所述第一清晰图像帧中选取用于替换所述模糊图像帧的第二清晰图像帧,包括:获取所述模糊图像帧与所述第一清晰图像帧之间的第一距离;响应于所述第一距离满足预设的距离条件,将所述第一清晰图像帧作为用于替换所述模糊图像帧的第二清晰图像帧。5.根据权利要求4所述的方法,其中,所述方法还包括:获取所述模糊图像帧和替换所述模糊图像帧的第二清晰图像帧之间的第二距离;根据所述第二距离,对所述第二清晰图像帧的目标检测结果进行扩展处理,以获得扩展处理后的所述第二清晰图像帧的目标检测结果。6.根据权利要求5所述的方法,其中,所述根据所述第二距离,对所述第二清晰图像帧的目标检测结果进行扩展处理,包括:获取第二清晰图像帧的目标检测结果中的目标检测框;根据所述第二距离,确定放大倍数;根据所述放大倍数,对所述目标检测框进行扩展处理。7.根据权利要求1-6中任一项所述的方法,其中,所述获取待检测的视频数据,包括:获取待检测的视频数据的每个图像帧;根据预设的缩小倍数,对所述每个图像帧进行缩小处理,以获得缩小处理后的所述视频数据。8.一种视频检测的装置,包括:获取单元,用于获取待检测的视频数据;分类单元,用于对所述视频数据进行分类处理,以获得所述视频数据中的模糊图像帧
和第一清晰图像帧;检测单元,用于对所述第一清晰图像帧进行检测处理,以获得所述第一清晰图像帧的目标检测结果;确定单元,用于从所述第一清晰图像帧中选取用于替换所述模糊图像帧的第二清晰图像帧,以根据所述第一清晰图像帧的目标检测结果和所述第二清晰图像帧的目标检测结果,确定所述视频数据的目标检测结果。9.根据权利要求8所述的装置,其中,所述分类单元,具体用于:利用预设的分类模型,对所述视频数据进行分类处理,得到分类处理的结果;根据所述分类处理的结果,获得所述视频数据中的所述模糊图像帧和所述第一清晰图像帧。10.根据权利要求8或9所述的装置,其中,所述检测单元,具体用于:利用预设的目标检测模,对所述第一清晰图像帧进行检测处理,得到检测处理的结果;根据所述检测处理的结果,获得所述第一清晰图像帧的目标检测结果。11.根据权利要求8-10中任一项所述的装置,其中,所述确定单元,具体用于:获取所述模糊图像帧与所述第一清晰图像帧之间的第一距离;响应于所述第一距离满足预设的距离条件,将所述第一清晰图像帧作为用于替换所述模糊图像帧的第二清晰图像帧。12.根据权利要求11所述的装置,其中,所述确定单元,还用于:获取所述模糊图像帧和替换所述模糊图像帧的第二清晰图像帧之间的第二距离;根据所述第二距离,对所述第二清晰图像帧的目标检测结果进行扩展处理,以获得扩展处理后的所述第二清晰图像帧的目标检测结果。13.根据权利要求12所述的装置,其中,所述确定单元,还用于:获取第二清晰图像帧的目标检测结果中的目标检测框;根据所述第二距离,确定放大倍数;根据所述放大倍数,对所述目标检测框进行扩展处理。14.根据权利要求8-13中任一项所述的装置,其中,所述获取单元,具体用于:获取待检测的视频数据的每个图像帧;根据预设的缩小倍数,对所述每个图像帧进行缩小处理,以获得缩小处理后的所述视频数据。15.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行根据权利要求1-7中任一项所述的方法。16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。
技术总结
本公开提供了一种视频检测的方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体涉及计算机视觉、视频处理、图像识别等技术领域。具体实现方案为:获取待检测的视频数据;对所述视频数据进行分类处理,以获得所述视频数据中的模糊图像帧和第一清晰图像帧;对所述第一清晰图像帧进行检测处理,以获得所述第一清晰图像帧的目标检测结果;从所述第一清晰图像帧中选取用于替换所述模糊图像帧的第二清晰图像帧,以根据所述第一清晰图像帧的目标检测结果和所述第二清晰图像帧的目标检测结果,确定所述视频数据的目标检测结果。确定所述视频数据的目标检测结果。确定所述视频数据的目标检测结果。
技术研发人员:张丽 杜悦艺 孙亚生
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2023.03.15
技术公布日:2023/7/31
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/