图像处理装置、方法、处理器、电子设备及存储介质与流程
未命名
08-07
阅读:75
评论:0

1.本公开涉及人工智能技术领域,尤其涉及计算机视觉、深度学习技术领域,可应用于智慧教室、智慧录播、视频监测、视频检索、视安防等场景。更具体地,涉及一种图像处理装置、方法、处理器、电子设备、存储介质及程序产品。
背景技术:
2.对象姿态检测在视频监控、安防、视频检索等领域具有广泛的应用。例如,对象姿态检测可以包括站立姿态检测。但存在姿态检测的计算效率较低并且准确性较低的问题。
技术实现要素:
3.鉴于上述问题,本公开提供了一种图像处理装置、方法、处理器、电子设备、存储介质及程序产品。
4.根据本公开的第一方面提供了一种图像处理装置,包括:
5.目标视频获取电路,配置为获取目标视频,其中,目标视频包括n个目标视频帧,n是大于或等于2的整数;
6.头部姿态信息确定电路,配置为对第n目标视频帧进行头部检测,得到第n头部姿态信息,其中,第n头部姿态信息表征第n目标视频帧中存在预设姿态的第一概率,n是大于1且小于或等于n的整数,m是大于或等于1且小于n的整数;
7.中间姿态信息确定电路,配置为对第n目标视频帧进行姿态检测,得到第n中间姿态信息,其中,第n中间姿态信息表征第n目标视频帧中存在预设姿态的第二概率;
8.目标姿态信息确定电路,配置为根据第n头部姿态信息和第n中间姿态信息,确定第n目标姿态信息,其中,第n目标姿态信息表征第n目标视频帧中存在预设姿态的概率。
9.根据本公开的实施例,头部姿态信息确定电路还配置为通过以下操作实现对第n目标视频帧进行头部检测,得到第n头部姿态信息:
10.对第n目标视频帧进行头部检测,得到第n头部位置信息;
11.根据第n头部位置信息和至少一个第m头部位置信息,确定第n位置变化信息,并根据第n位置变化信息,确定第n头部姿态信息。
12.根据本公开的实施例,第n位置变化信息包括第n位置变化值;
13.头部姿态信息确定电路还配置为通过以下操作实现根据第n位置变化信息,确定第n头部姿态信息:
14.在确定第n位置变化值大于或等于第一预设阈值的情况下,确定第n头部姿态信息表征第n目标视频帧中存在预设姿态。
15.根据本公开的实施例,中间姿态信息确定电路还配置为通过以下操作实现对第n目标视频帧进行姿态检测,得到第n中间姿态信息:
16.对第n目标视频帧进行姿态检测,得到至少一个第n中间姿态检测框,并根据至少一个第n中间姿态检测框,确定第n中间姿态信息。
17.根据本公开的实施例,目标姿态信息确定电路还配置为通过以下操作实现根据至少一个第n中间姿态检测框,确定第n中间姿态信息:
18.在确定第n头部姿态信息表征第n目标视频帧中存在预设姿态且第n中间姿态信息表征第n目标视频帧中存在预设姿态的情况下,根据第n中间姿态检测框和与第n头部位置信息对应的第n头部检测框,确定第n目标姿态信息。
19.根据本公开的实施例,目标姿态信息确定电路还配置为通过以下操作实现根据第n中间姿态检测框和与第n头部位置信息对应的第n头部检测框,确定第n目标姿态信息:
20.在确定第n头部检测框与第n中间姿态检测框之间的重叠度大于或等于第二预设阈值的情况下,确定第n目标姿态信息表征第n目标视频帧中存在预设姿态。
21.根据本公开的实施例,目标姿态信息确定电路还配置为通过以下操作实现根据第n中间姿态检测框和与第n头部位置信息对应的第n头部检测框,确定第n目标姿态信息:
22.在确定第n头部检测框与第n中间姿态检测框之间的重叠度大于或等于第二预设阈值的情况下,将与第n头部检测框对应的第n头部对象和与第n中间姿态检测框对应的第n姿态对象进行匹配,得到第n匹配信息;
23.在确定第n匹配信息表征第n头部对象和第n姿态对象相匹配的情况下,确定第n目标姿态信息表征第n目标视频帧中存在预设姿态。
24.根据本公开的实施例,图像处理装置还包括:
25.原始视频获取电路,配置为获取原始视频,其中,原始视频包括p个原始视频帧,p是大于n的整数;以及
26.目标视频帧确定电路,配置为对p个原始视频帧进行抽帧处理,得到n个目标视频帧。
27.根据本公开的实施例,图像处理装置还包括:
28.待播放区域确定电路,配置为在确定第n目标姿态信息表征第n目标视频帧中存在预设姿态的情况下,从第n目标视频帧中确定第n待播放区域;
29.目标播放区域确定电路,配置为根据第n待播放区域和第n-1目标播放区域,确定第n目标播放区域;以及
30.播放电路,配置为对第n播放区域进行播放。
31.根据本公开的实施例,目标播放区域确定电路还配置为通过以下操作实现根据第n待播放区域和第n-1目标播放区域,确定第n目标播放区域:
32.根据第n待播放区域的位置信息和第n-1目标播放区域的位置信息,确定第n待播放区域与第n-1目标播放区域之间的重叠度;以及
33.在确定第n待播放区域与第n-1目标播放区域之间的重叠度小于或等于第三预设阈值的情况下,将第n待播放区域确定为第n目标播放区域。
34.本公开的第二方面提供了一种图像处理方法,包括:
35.获取目标视频,其中,目标视频包括n个目标视频帧,n是大于或等于2的整数;
36.对第n目标视频帧进行头部检测,得到第n头部姿态信息,其中,第n头部姿态信息表征第n目标视频帧中存在预设姿态的第一概率,n是大于1且小于或等于n的整数,m是大于或等于1且小于n的整数;
37.对第n目标视频帧进行姿态检测,得到第n中间姿态信息,其中,第n中间姿态信息
表征第n目标视频帧中存在预设姿态的第二概率;
38.根据第n头部姿态信息和第n中间姿态信息,确定第n目标姿态信息,其中,第n姿态信息表征第n目标视频帧中存在预设姿态的概率。
39.本公开的第三方面提供了一种处理器,用于执行计算机程序,以实现上述图像处理方法。
40.本公开的第四方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述图像处理方法。
41.本公开的第五方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述图像处理方法。
42.本公开的第六方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述图像处理方法。
43.根据本公开提供的图像处理装置、方法、处理器、电子设备、存储介质及程序产品,由于对第n目标视频帧进行头部检测和对第n目标视频帧行为检测是相互独立的检测操作,可以并行执行,因此提高了姿态检测的计算效率。此外,由于第n目标姿态信息是根据第n头部姿态信息和第n中间姿态信息确定的,用于确定第n目标姿态信息的信息更为丰富,因此提高了姿态检测的准确性。此外,由于提高了计算效率,因此能够满足部署于边缘设备的需求。
附图说明
44.通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
45.图1示意性示出了根据本公开实施例的图像处理装置的结构示意图;
46.图2a示意性示出了根据本公开实施例的第m目标视频帧的头部检测示意图;
47.图2b示意性示出了根据本公开实施例的第n目标视频帧的头部检测示意图;
48.图3示意性示出了根据本公开实施例的第n目标视频帧的姿态检测示意图;
49.图4示意性示出了根据本公开另一实施例的图像处理装置的结构示意图;
50.图5示意性示出了根据本公开实施例的第n待播放区域和第n-1目标播放区域的示意图;
51.图6示意性示出了根据本公开实施例的图像处理方法的流程图;
52.图7示意性示出了根据本公开实施例的适用于实现图像处理方法的处理器的方框图;
53.图8示意性示出了根据本公开实施例的适于实现图像处理方法的电子设备的方框图。
具体实施方式
54.为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部。基于所描述的本公开实施例,本领域普通技术人员在
无需创造性劳动的前提下获得的所有其他实施例都属于本公开保护的范围。在以下描述中,一些具体实施例仅用于描述目的,而不应该理解为对本公开有任何限制,而只是本公开实施例的示例。在可能导致对本公开的理解造成混淆时,将省略常规结构或构造。应注意,图中各部件的形状和尺寸不反映真实大小和比例,而仅示意本公开实施例的内容。
55.除非另外定义,本公开实施例使用的技术术语或科学术语应当是本领域技术人员所理解的通常意义。本公开实施例中使用的“第一”、“第二”以及类似词语并不表示任何顺序、数量或重要性,而只是用于区分不同的组成部分。
56.在本公开的技术方案中,所涉及的数据(如包括但不限于用户个人信息)的收集、存储、使用、加工、传输、提供、公开和应用等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
57.在智慧教室、智能录播等类似封闭场景,需要对封闭场景内的对象的姿态进行检测,可以存在如下难点。
58.一方面,需要计算效率较高,以满足部署在边缘设备的需求。
59.另一方面,由于对象衣着比较统一、对象密度大等原因,导致检测困难,也就难以准确地检测对象的姿态。
60.有鉴于此,本公开的实施例提供了一种图像处理装置、方法、处理器、电子设备、存储介质及程序产品。根据本公开的实施例,由于对第n目标视频帧进行头部检测和对第n目标视频帧行为检测是相互独立的检测操作,可以并行执行,因此提高了姿态检测的计算效率。此外,由于第n目标姿态信息是根据第n头部姿态信息和第n中间姿态信息确定的,用于确定第n目标姿态信息的信息更为丰富,因此,提高了姿态检测的准确性。此外,由于提高了计算效率,因此能够满足部署于边缘设备的需求。
61.图1示意性示出了根据本公开实施例的图像处理装置的结构示意图。
62.如图1所示,该图像处理装置100包括目标视频获取电路110、头部姿态信息确定电路120、中间姿态信息确定电路130和目标姿态信息确定电路140。
63.目标视频获取电路110配置为获取目标视频。
64.目标视频包括n个目标视频帧,n是大于或等于2的整数。
65.根据本公开的实施例,目标视频可以是利用图像采集装置获取的。图像采集装置可以包括摄像机、具有拍摄功能的手机、摄像头等等。
66.根据本公开的实施例,目标视频中可以包括对象的活动画面。例如,在智慧教室、智能录播等类似的场景中,将利用图像采集装置拍摄的对象的活动画面作为目标视频。
67.头部姿态信息确定电路120配置为对第n目标视频帧进行头部检测,得到第n头部姿态信息。
68.根据本公开的实施例,n可以是大于1且小于或等于n的整数。m可以是大于或等于1且小于n的整数。n和m可以根据实际业务需求进行配置,在此不作限定。
69.根据本公开实施例,预设姿态可以包括站立姿态、坐下姿态以及保持姿态等中的之一。
70.根据本公开的实施例,第n头部姿态信息可以表征第n目标视频帧中存在预设姿态的第一概率。例如,在第一概率大于或等于第一预设概率阈值的情况下,第n头部姿态信息可以表征第n目标视频帧中存在预设姿态。在第一概率小于第一预设概率阈值的情况下,第
n头部姿态信息可以表征第n目标视频帧中不存在预设姿态。第一预设概率阈值可以根据实际业务需求进行配置,在此不作限定。例如,第一预设概率阈值可以是0.8。
71.根据本公开的实施例,可以将第n目标视频帧输入至预先训练好的头部检测模型进行头部检测,输出第n头部位置信息。备选地,可以根据第n目标视频帧中的像素值确定对象的头部轮廓,根据头部轮廓得到第n头部位置信息。
72.根据本公开的实施例,头部检测模型可以是通过对卷积神经网络(convolutional neural networks,cnn)模型或深度卷积神经网络(deep convolutional neural networks,dcnn)模型进行训练得到的,可以理解的是,本公开并不限制于此。
73.根据本公开的实施例,根据第n头部位置信息和至少一个第m头部位置信息确定第n目标视频帧中对象的姿态变化,从而确定第n头部姿态信息。
74.中间姿态信息确定电路130,配置为对第n目标视频帧进行姿态检测,得到第n中间姿态信息。
75.根据本公开的实施例,第n中间姿态信息可以表征第n目标视频帧中存在预设姿态的第二概率。例如,在第二概率大于或等于第二预设概率阈值的情况下,第n中间姿态信息可以表征第n目标视频帧中存在预设姿态。在第二概率小于第二预设概率阈值的情况下,第n中间姿态信息可以表征第n目标视频帧中不存在预设姿态。第二预设概率阈值可以根据实际业务需求进行配置,在此不作限定。第二预设概率阈值可以与第一预设概率阈值相同,也可以不同。例如,第二预设概率阈值可以是0.8。第二预设概率阈值也可以是0.85。
76.根据本公开的实施例,可以将第n目标视频帧输入至预先训练好的姿态检测模型中进行姿态检测,输出第n中间姿态信息。备选地,可以是根据第n目标视频帧中的像素值确定对象的整体轮廓,根据整体轮廓得到第n中间姿态信息。
77.根据本公开的实施例,姿态检测模型可以是通过对cnn模型或dcnn模型进行训练得到的,可以理解的是,本公开并不限制于此。
78.目标姿态信息确定电路140,配置为根据第n头部姿态信息和第n中间姿态信息,确定第n目标姿态信息。
79.根据本公开的实施例,第n目标姿态信息可以表征第n目标视频帧中存在预设姿态的概率。
80.根据本公开的实施例,可以在第n头部姿态信息和第n中间姿态信息均表征第n目标视频帧中存在预设姿态的情况下,确定第n目标姿态信息表征第n目标视频帧中存在预设姿态。在第n头部姿态信息和第n中间姿态信息中至少存在一个表征第n目标视频帧中不存在预设姿态的情况下,确定第n目标信息表征第n目标视频帧中不存在预设姿态。
81.备选地,在第n头部姿态信息和第n中间姿态信息均表征第n目标视频帧中存在预设姿态的情况下,根据第n头部位置信息,确定第n目标姿态信息。
82.根据本公开的实施例,由于对第n目标视频帧进行头部检测和对第n目标视频帧行为检测是相互独立的检测操作,可以并行执行,因此提高了姿态检测的计算效率。此外,由于第n目标姿态信息是根据第n头部姿态信息和第n中间姿态信息确定的,用于确定第n目标姿态信息的信息更为丰富,因此提高了姿态检测的准确性。此外,由于提高了计算效率,因此能够满足部署于边缘设备的需求。
83.根据本公开的实施例,为了实现对第n目标视频帧进行头部检测,得到第n头部姿
态信息,头部姿态信息确定电路120还可以配置为对第n目标视频帧进行头部检测,得到第n头部位置信息,根据第n头部位置信息和至少一个第m头部位置信息,确定第n位置变化信息,并根据第n位置变化信息,确定第n头部姿态信息。
84.根据本公开的实施例,第n头部位置信息可以包括第n目标视频帧中至少一个第n对象的第n位置信息。第m头部位置信息可以包括第m目标视频帧中至少一个第m对象的第m位置信息。第n对象与第m对象可以相同,也可以不同。至少一个第m头部位置信息可以包括一个或多个第m头部位置信息。第m目标视频帧可以是在第n目标视频帧之前的目标视频帧。
85.例如,n可以为10,第n头部位置信息即第10目标视频帧的第10头部位置信息。m可以是1~9中任意整数,至少一个第m头部位置信息可以包括第9目标视频帧的第9头部位置信息,也可以包括第7目标视频帧的第7头部位置信息和第5目标视频帧的第5头部位置信息。
86.根据本公开的实施例,可以对第n目标视频帧进行头部检测,得到第n头部检测框,根据第n头部检测框,确定第n头部位置信息。对第m目标视频帧进行头部检测,得到第m头部检测框,根据第m头部检测框,确定第m头部位置信息。
87.根据本公开的实施例,第n位置变化信息可以表征第n头部对象从第m目标视频帧到第n目标视频帧的位置变化信息。
88.根据本公开的实施例,可以确定第n头部位置信息和与至少一个第m头部位置信息各自之间的位置变化信息,得到与第n目标视频帧对应的至少一个位置变化信息。根据与第n目标视频帧对应的至少一个位置变化信息,确定第n位置变化信息。例如,可以确定与第n目标视频帧对应的至少一个位置变化信息的平均变化信息,将与第n目标视频帧对应的平均变化信息确定为第n位置变化信息。备选地,可以从与第n目标视频帧对应的至少一个位置变化信息中确定最大位置变化信息,将与第n目标视频帧对应的最大位置变化信息确定为第n位置变化信息。备选地,可以从与第n目标视频帧对应的至少一个位置变化信息中确定最小位置变化信息,将与第n目标视频帧对应的最小位置变化信息确定为第n位置变化信息。
89.图2a示意性示出了根据本公开实施例的第m目标视频帧的头部检测示意图。
90.如图2a所示,在第m目标视频帧中,可以对第m目标视频帧进行头部检测,得到至少一个第m头部检测框。至少一个第m头部检测框可以包括第m头部检测框201_m、第m头部检测框202_m和第m头部检测框203_m。第m头部检测框201_m可以与第m对象211_m对应。第m头部检测框202_m可以与第m对象212_m对应。第m头部检测框203_m可以与第m对象213_m对应。
91.根据本公开的实施例,可以根据第m头部检测框在第m目标视频帧中的位置信息,确定第m头部位置信息。
92.图2b示意性示出了根据本公开实施例的第n目标视频帧的头部检测示意图。
93.如图2b所示,在第n目标视频帧中,可以对第n目标视频帧进行头部检测,得到至少一个第n头部检测框。至少一个第n头部检测框可以包括第n头部检测框201_n、第n头部检测框202_n和第n头部检测框203_n。第n头部检测框201_n可以与第n对象211_n对应。第n头部检测框202_n可以与第n对象212_n对应。第n头部检测框203_n可以与第n对象213_n对应。
94.根据本公开的实施例,可以根据第n头部检测框在第n目标视频帧中的位置信息,确定第n头部位置信息。
95.根据本公开的实施例,可以将第n目标视频帧中的第n对象和第m目标视频帧中的第m对象进行匹配,从而确定第m目标视频帧中与第n对象相匹配的第m对象。根据第n目标视频帧中第n对象的位置信息和第m目标视频帧中与第n对象相匹配的第m对象的位置信息,确定第n目标视频帧中第n对象的第n位置变化信息。
96.例如,图2a中第m对象211_m与图2b中第n对象211_n相匹配,可以根据第n头部检测框201_n和第m头部检测框201_m,确定第n目标视频帧中第n对象211_n的第n位置变化信息。
97.图2a中第m对象212_m与图2b中第n对象212_n相匹配,可以根据第n头部检测框202_n和第m头部检测框202_m,确定第n目标视频帧中第n对象212_n的第n位置变化信息。
98.图2a中第m对象213_m与图2b中第n对象213_n相匹配,可以根据第n头部检测框203_n和第m头部检测框203_m,确定第n目标视频帧中第n对象213_n的第n位置变化信息。
99.由图2a和图2b可知,由于第n头部检测框201_n在第n目标视频帧中的位置信息和第m头部检测框201_m在第m目标视频帧中的位置信息一致,因此可以确定第n目标视频帧中第n对象211_n的第n位置变化信息为零,由此确定第n目标视频帧中第n对象211_n的第n头部姿态信息表征第n目标视频帧中第n对象211_n不存在预设姿态。
100.由于第n头部检测框202_n在第n目标视频帧中的位置信息和第m头部检测框202_m在第m目标视频帧中的位置信息不一致,因此可以确定第n目标视频帧中第n对象212_n的第n位置变化信息不为零,由此确定第n目标视频帧中第n对象212_n的第n头部姿态信息表征第n目标视频帧中第n对象212_n存在预设姿态。
101.由于第n头部检测框203_n在第n目标视频帧中的位置信息和第m头部检测框203_m在第m目标视频帧中的位置信息一致,因此可以确定第n目标视频帧中第n对象213_n的第n位置变化信息为零,由此确定第n目标视频帧中第n对象213_n的第n头部姿态信息表征第n目标视频帧中第n对象213_n不存在预设姿态。
102.根据本公开的实施例,由第n位置变化信息可以确定第n头部对象的变化,从而可以更加准确的确定第n头部姿态信息。
103.根据本公开的实施例,为了实现根据第n位置变化信息,确定第n头部姿态信息,头部姿态信息确定电路120还可以配置为在确定第n位置变化值大于或等于第一预设阈值的情况下,确定第n头部姿态信息表征第n目标视频帧中存在预设姿态。
104.根据本公开的实施例,第n位置变化信息可以包括第n位置变化值。第n位置变化值可以表征第n位置变化信息对应的第n对象的位置变化大小。
105.根据本公开的实施例,第n位置变化值可以是第n头部位置信息中的第n对象的高度减去第m头部位置信息中的第m对象的高度得到的。因此,在第n位置变化值是正数的情况下,表征第n目标视频帧中的第n对象高度上升,即第n对象发生站立行为。在第n位置变化值是零的情况下,表征第n目标视频帧中的第n对象高度不变,即第n对象的位置保持不变。在第n位置变化值是负数的情况下,表征第n目标视频帧中的第n对象高度下降,即第n对象发生坐下行为。
106.根据本公开的实施例,可以设置第一预设阈值,将第n位置变化值与第一预设阈值进行比较。第一预设阈值可以是对象坐下和站立的高度差。
107.根据本公开的实施例,在确定第n位置变化值大于或等于第一预设阈值的情况下,即第n对象的位置变化较大,可以指示第n对象发生了起立行为,也就是第n对象为站立姿
态,第n头部姿态信息表征第n目标视频帧中存在预设姿态。
108.根据本公开的实施例,在确定第n位置变化值小于第一预设阈值的情况下,即第n对象的位置变化较小,可以指示第n对象保持不变,也就是第n对象姿态不变。这种情况下,第n头部姿态信息表征第n目标视频帧中不存在预设姿态。
109.根据本公开的实施例,在确定第n位置变化值大于或等于第一预设阈值的情况下,可以确定第一概率大于或等于第一预设概率阈值。在第一概率大于或等于第一预设概率阈值的情况下,第n头部姿态信息可以表征第n目标视频帧中存在预设姿态。在确定第n位置变化值小于第一预设阈值的情况下,可以确定第一概率小于第一预设概率阈值。在第一概率小于第一预设概率阈值的情况下,第n头部姿态信息可以表征第n目标视频帧中不存在预设姿态。
110.根据本公开的实施例,通过设置第一预设阈值,可以将第n头部姿态信息进行划分,能够快速的确定表征第n目标视频帧中存在预设姿态的第n头部姿态信息,进而根据第n头部姿态信息进行后续处理,提升了数据处理的效率。
111.根据本公开实施例,为了通过以下操作实现对第n目标视频帧进行姿态检测,得到第n中间姿态信息,中间姿态信息确定电路130还可以配置为对第n目标视频帧进行姿态检测,得到至少一个第n中间姿态检测框,并根据至少一个第n中间姿态检测框,确定第n中间姿态信息。
112.图3示意性示出了根据本公开实施例的第n目标视频帧的姿态检测示意图。
113.如图3所示,在第n目标视频帧中,可以对第n目标视频帧进行姿态检测,得到至少一个第n中间姿态检测框。至少一个第n中间姿态检测框包括第n中间姿态检测框301_n、第n中间姿态检测框302_n和第n中间姿态检测框303_n。
114.根据本公开的实施例,可以根据第n中间姿态检测框中的第n姿态对象,确定第n中间姿态信息。
115.例如,在图3中,第n中间姿态检测框301_n中的第n姿态对象为坐下姿态,根据第n中间姿态检测框301_n确定第n中间姿态信息表征第n目标视频帧中存在坐下姿态。第n中间姿态检测框302_n中的第n姿态对象为站立姿态,根据第n中间姿态检测框302_n确定第n中间姿态信息表征第n目标视频帧中存在站立姿态。第n中间姿态检测框303_n中的第n姿态对象为站立姿态,根据第n中间姿态检测框303_n确定第n中间姿态信息表征第n目标视频帧中存在站立姿态。
116.根据本公开实施例,为了实现根据至少一个第n中间姿态检测框,确定第n中间姿态信息,目标姿态信息确定电路140还可以配置为在确定第n头部姿态信息表征第n目标视频帧中存在预设姿态且第n中间姿态信息表征第n目标视频帧中存在预设姿态的情况下,根据第n中间姿态检测框和与第n头部位置信息对应的第n头部检测框,确定第n目标姿态信息。
117.根据本公开的实施例,在确定第n头部姿态信息表征第n目标视频帧中存在预设姿态且第n中间姿态信息表征第n目标视频帧中存在预设姿态的情况下,由第n中间姿态检测框和第n头部检测框可以确定第n中间姿态信息的第n目标视频帧中的预设姿态的位置和第n头部姿态信息的第n目标视频帧中的预设姿态的位置,从而确定第n目标姿态信息的第n目标视频帧中是否存在预设姿态。
118.例如,在图2b中,与第n头部检测框202_n对应的第n头部姿态信息表征第n目标视频帧中存在预设姿态。在图3中,与第n中间姿态检测框302_n和第n中间姿态检测框303_n对应的第n目标视频帧中存在预设姿态。因此可以根据第n头部检测框202_n、第n中间姿态检测框302_n和第n中间姿态检测框303_n确定第n目标姿态信息表征第n目标视频帧中存在预设姿态。
119.根据本公开实施例,为了根据第n中间姿态检测框和与第n头部位置信息对应的第n头部检测框,确定第n目标姿态信息,目标姿态信息确定电路140还可以配置为在确定第n头部检测框与第n中间姿态检测框之间的重叠度大于或等于第二预设阈值的情况下,确定第n目标姿态信息表征第n目标视频帧中存在预设姿态。
120.根据本公开的实施例,第n头部检测框与第n中间姿态检测框之间的重叠度大于或等于第二预设阈值,即第n头部检测框所在的区域与第n中间姿态检测框所在的区域的重叠度较高,因此,可以确定为第n目标姿态信息表征第n目标视频帧中存在预设姿态。
121.根据本公开的实施例,通过确定第n头部检测框和第n中间姿态检测框的重叠度,可以使得第n目标视频帧在第n头部姿态信息中存在的预设姿态和在第n中间姿态信息中存在的预设姿态在同一区域,进一步提升姿态检测的准确性。
122.根据本公开实施例,为了根据第n中间姿态检测框和与第n头部位置信息对应的第n头部检测框,确定第n目标姿态信息,目标姿态信息确定电路140还可以配置为在确定第n头部检测框与第n中间姿态检测框之间的重叠度大于或等于第二预设阈值的情况下,将与第n头部检测框对应的第n头部对象和与第n中间姿态检测框对应的第n姿态对象进行匹配,得到第n匹配信息。在确定第n匹配信息表征第n头部对象和第n姿态对象相匹配的情况下,确定第n目标姿态信息表征第n目标视频帧中存在预设姿态。
123.根据本公开的实施例,由于头部检测和姿态检测是分开进行的,因此,可能存在第n头部检测框对应的第n头部对象和与第n中间姿态检测框对应的第n姿态对象不是同一个的情况。通过对第n头部检测框对应的第n头部对象和与第n中间姿态检测框对应的第n姿态对象进行匹配,使得第n头部检测框对应的第n头部对象和与第n中间姿态检测框对应的第n姿态对象是同一个对象,能够提升姿态检测的准确性。
124.根据本公开的实施例,将与第n头部检测框对应的第n头部对象和与第n中间姿态检测框对应的第n姿态对象进行匹配,可以确保第n头部对象和第n姿态对象为同一对象,从而进一步提高第n目标姿态信息中存在预设姿态的准确性。
125.图4示意性示出了根据本公开另一实施例的图像处理装置的结构示意图。
126.如图4所示,该图像处理装置包括原始视频获取电路410、目标视频帧确定电路420、目标视频获取电路430、头部姿态信息确定电路440、中间姿态信息确定电路450、目标姿态信息确定电路460、待播放区域确定电路470、目标播放区域确定电路480和播放电路490。
127.原始视频获取电路410配置为获取原始视频。原始视频包括p个原始视频帧,p是大于n的整数。
128.目标视频帧确定电路420配置为对p个原始视频帧进行抽帧处理,得到n个目标视频帧。
129.根据本公开的实施例,原始视频可以是从图像采集设备中直接获取的视频,p个原
始视频帧也是根据采集顺序排列的。
130.根据本公开的实施例,对p个原始视频帧进行抽帧处理,得到n个目标视频帧,可以是从p个原始视频帧中每隔一个原始视频帧抽取一个原始视频帧作为目标视频帧,也可以是每隔两个原始视频帧抽取一个原始视频帧作为目标视频帧,在此不作限定。
131.根据本公开的实施例,对原始视频帧进行抽帧处理得到n个目标视频帧,可以减少视频帧的处理量。此外,由于在智慧教室或者智慧导播等场景中对象活动比较单一,因此抽帧处理也不会影响处理结果的准确性。
132.根据本公开的实施例,目标视频获取电路430可以与上述目标视频获取电路110执行的操作相对应,头部姿态信息确定电路440可以与上述头部姿态信息确定电路120执行的操作相对应,中间姿态信息确定电路450可以与上述中间姿态信息确定电路130执行的操作相对应,目标姿态信息确定电路460可以与上述目标姿态信息确定电路140执行的操作相对应,在此不再赘述。
133.待播放区域确定电路470配置为在确定第n目标姿态信息表征第n目标视频帧中存在预设姿态的情况下,从第n目标视频帧中确定第n待播放区域。
134.目标播放区域确定电路480配置为根据第n待播放区域和第n-1目标播放区域,确定第n目标播放区域。
135.播放电路490配置为对第n播放区域进行播放。
136.根据本公开的实施例,在确定第n目标姿态信息表征第n目标视频帧中存在预设姿态的情况下,可以根据第n目标视频帧中的表征站立姿态的第n头部对象确定第n待播放区域。
137.根据本公开的实施例,第n待播放区域可以是以站立姿态的第n头部对象对应的第n头部检测框为中心,向上扩展一个头部检测框的高度大小,向下扩展两个头部检测框的高度大小,向左、向右各扩展两个头部检测框的宽度大小。使得第n头部对象可以位于第n待播放区域中间靠上位置。
138.根据本公开的实施例,第n-1目标播放区域可以是上一目标视频帧中的播放区域。由于目标视频帧是根据原始视频帧抽帧处理得到的,因此,未被抽取的原始视频帧可以沿用与原始视频帧相邻的前一个目标视频帧中的目标播放区域进行播放。
139.根据本公开的实施例,在第n-1目标播放区域和第n目标播放区域不同的情况下,可以对播放区域进行平滑处理。平滑处理可以是对第n播放区域进行播放可以是从第n-1目标播放区域进行缓慢移动过渡到第n目标播放区进行播放,也可以是通过等间距移动至第n目标播放区进行播放,使得画面变化平滑不突兀。
140.根据本公开的实施例,通过确定第n目标播放区域并对第n目标播放区域进行播放,可以使得在在智慧教室、智能录播等类似封闭场景完成对存在预设姿态的第n播放区域进行播放切换,有助于评估课堂教学质量和学生学习质量。
141.根据本公开实施例,为了实现根据第n待播放区域和第n-1目标播放区域,确定第n目标播放区域,目标播放区域确定电路480还可以配置为根据第n待播放区域的位置信息和第n-1目标播放区域的位置信息,确定第n待播放区域与第n-1目标播放区域之间的重叠度。在确定第n待播放区域与第n-1目标播放区域之间的重叠度小于或等于第三预设阈值的情况下,将第n待播放区域确定为第n目标播放区域。
142.根据本公开的实施例,第n待播放区域的位置信息可以是以第n目标视频帧的左下角作为原点坐标,根据第n待播放区域左上角的坐标确定的。第n-1目标播放区域的位置信息也类似,在此不再赘述。
143.根据本公开的实施例,第n待播放区域与第n-1目标播放区域之间的重叠度可以表征两个播放区域中画面中心的对象远近距离。
144.根据本公开的实施例,可以设置第三预设阈值,在第n待播放区域与第n-1目标播放区域之间的重叠度大于第三预设阈值的情况下,即两个播放区域中画面中心的对象距离较近,第n待播放区域中画面中心的对象可以在第n-1目标播放区域中,因此,可以继续使用第n-1目标播放区域作为第n目标播放区域,画面无需切换。
145.根据本公开的实施例,在第n待播放区域与第n-1目标播放区域之间的重叠度小于或等于第三预设阈值的情况下,即两个播放区域中画面中心的对象距离较远,第n待播放区域中画面中心的对象不在第n-1目标播放区域中,或者是在第n-1目标播放区域较为边缘的位置,因此可以将第n待播放区域确定为第n目标播放区域。
146.图5示意性示出了根据本公开实施例的第n待播放区域和第n-1目标播放区域的示意图。
147.如图5所示,第n-1目标播放区域501_n-1和第n待播放区域501_n之间的重叠度可以小于第三预设阈值。第n-1目标播放区域501_n-1中对象在第n-1目标播放区域较为边缘的位置,因此可以将第n待播放区域501_n确定为第n目标播放区域。
148.图6示意性示出了根据本公开实施例的图像处理方法的流程图。
149.如图6所示,该图像处理方法包括操作s610~操作s640。
150.在操作s610,获取目标视频。目标视频包括n个目标视频帧,n是大于或等于2的整数。
151.根据本公开的实施例,操作s610由目标视频获取电路110执行,与上述目标视频获取电路110执行的操作相对应,为了简明此处不再赘述。
152.在操作s620,对第n目标视频帧进行头部检测,得到第n头部姿态信息。第n头部姿态信息表征第n目标视频帧中存在预设姿态的第一概率,n是大于1且小于或等于n的整数,m是大于或等于1且小于n的整数。
153.根据本公开的实施例,操作s620由头部姿态信息确定电路120执行,与上述头部姿态信息确定电路120执行的操作相对应,为了简明此处不再赘述。
154.在操作s630,对第n目标视频帧进行姿态检测,得到第n中间姿态信息。第n中间姿态信息表征第n目标视频帧中存在预设姿态的第二概率。
155.根据本公开的实施例,操作s630由中间姿态信息确定电路130执行,与上述中间姿态信息确定电路130执行的操作相对应,为了简明此处不再赘述。
156.在操作s640,根据第n头部姿态信息和第n中间姿态信息,确定第n目标姿态信息。第n姿态信息表征第n目标视频帧中存在预设姿态的概率。
157.根据本公开的实施例,操作s640由目标姿态信息确定电路140执行,与上述目标姿态信息确定电路140执行的操作相对应,为了简明此处不再赘述。
158.根据本公开的实施例,目标视频获取电路110、头部姿态信息确定电路120、中间姿态信息确定电路130和目标姿态信息确定电路140中的任意多个模块可以合并在一个模块
中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,目标视频获取电路110、头部姿态信息确定电路120、中间姿态信息确定电路130和目标姿态信息确定电路140中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,目标视频获取电路110、头部姿态信息确定电路120、中间姿态信息确定电路130和目标姿态信息确定电路140中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
159.图7示意性示出了根据本公开实施例的适用于实现图像处理方法的处理器的方框图。
160.如图7所示,处理器700用于执行计算机程序,以实现本公开实施例的图像处理方法。处理器700可以包括中央处理器,(central processing unit,cpu)、图像处理器(graphics processing unit,gpu)或神经网络处理器(neural network processing unit,npu)。
161.图8示意性示出了根据本公开实施例的适于实现图像处理方法的电子设备的方框图。
162.如图8所示,根据本公开实施例的电子设备800包括处理器801,其可以根据存储在只读存储器(rom)802中的程序或者从存储部分808加载到随机访问存储器(ram)803中的程序而执行各种适当的动作和处理。处理器801例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(asic))等等。处理器801还可以包括用于缓存用途的板载存储器。处理器801可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
163.在ram 803中,存储有电子设备800操作所需的各种程序和数据。处理器801、rom 802以及ram 803通过总线804彼此相连。处理器801通过执行rom 802和/或ram 803中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除rom 802和ram 803以外的一个或多个存储器中。处理器801也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
164.根据本公开的实施例,电子设备800还可以包括输入/输出(i/o)接口805,输入/输出(i/o)接口805也连接至总线804。电子设备800还可以包括连接至输入/输出(i/o)接口805的以下部件中的一项或多项:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至输入/输出(i/o)接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
165.本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/
系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的图像处理方法。
166.根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的rom 802和/或ram 803和/或rom 802和ram 803以外的一个或多个存储器。
167.本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的图像处理方法。
168.在该计算机程序被处理器801执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
169.在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分809被下载和安装,和/或从可拆卸介质811被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
170.在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被处理器801执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
171.根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如java,c++,python,“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
172.附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规
定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
173.本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
174.以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
技术特征:
1.一种图像处理装置,包括:目标视频获取电路,配置为获取目标视频,其中,所述目标视频包括n个目标视频帧,n是大于或等于2的整数;头部姿态信息确定电路,配置为对第n目标视频帧进行头部检测,得到第n头部姿态信息,其中,所述第n头部姿态信息表征所述第n目标视频帧中存在预设姿态的第一概率,n是大于1且小于或等于n的整数,m是大于或等于1且小于n的整数;中间姿态信息确定电路,配置为对所述第n目标视频帧进行姿态检测,得到第n中间姿态信息,其中,所述第n中间姿态信息表征所述第n目标视频帧中存在所述预设姿态的第二概率;以及目标姿态信息确定电路,配置为根据所述第n头部姿态信息和所述第n中间姿态信息,确定第n目标姿态信息,其中,所述第n目标姿态信息表征所述第n目标视频帧中存在预设姿态的概率。2.根据权利要求1所述的装置,其中,所述头部姿态信息确定电路还配置为通过以下操作实现对第n目标视频帧进行头部检测,得到第n头部姿态信息:对所述第n目标视频帧进行头部检测,得到第n头部位置信息;根据所述第n头部位置信息和至少一个第m头部位置信息,确定第n位置变化信息,并根据所述第n位置变化信息,确定所述第n头部姿态信息。3.根据权利要求2所述的装置,其中,所述第n位置变化信息包括第n位置变化值;所述头部姿态信息确定电路还配置为通过以下操作实现根据所述第n位置变化信息,确定所述第n头部姿态信息:在确定所述第n位置变化值大于或等于第一预设阈值的情况下,确定所述第n头部姿态信息表征所述第n目标视频帧中存在所述预设姿态。4.根据权利要求1~3中任一项所述的装置,其中,所述中间姿态信息确定电路还配置为通过以下操作实现对所述第n目标视频帧进行姿态检测,得到第n中间姿态信息:对所述第n目标视频帧进行姿态检测,得到至少一个第n中间姿态检测框,并根据所述至少一个第n中间姿态检测框,确定所述第n中间姿态信息。5.根据权利要求4所述的装置,其中,所述目标姿态信息确定电路还配置为通过以下操作实现根据所述至少一个第n中间姿态检测框,确定所述第n中间姿态信息:在确定所述第n头部姿态信息表征所述第n目标视频帧中存在所述预设姿态且所述第n中间姿态信息表征所述第n目标视频帧中存在所述预设姿态的情况下,根据所述第n中间姿态检测框和与所述第n头部位置信息对应的第n头部检测框,确定所述第n目标姿态信息。6.根据权利要求5所述的装置,其中,所述目标姿态信息确定电路还配置为通过以下操作实现根据所述第n中间姿态检测框和与所述第n头部位置信息对应的第n头部检测框,确定所述第n目标姿态信息:在确定所述第n头部检测框与所述第n中间姿态检测框之间的重叠度大于或等于第二预设阈值的情况下,确定所述第n目标姿态信息表征所述第n目标视频帧中存在所述预设姿态。7.根据权利要求5所述的装置,其中,所述目标姿态信息确定电路还配置为通过以下操作实现根据所述第n中间姿态检测框和与所述第n头部位置信息对应的第n头部检测框,确
定所述第n目标姿态信息:在确定所述第n头部检测框与所述第n中间姿态检测框之间的重叠度大于或等于第二预设阈值的情况下,将与所述第n头部检测框对应的第n头部对象和与所述第n中间姿态检测框对应的第n姿态对象进行匹配,得到第n匹配信息;以及在确定所述第n匹配信息表征所述第n头部对象和所述第n姿态对象相匹配的情况下,确定所述第n目标姿态信息表征所述第n目标视频帧中存在所述预设姿态。8.根据权利要求1~3中任一项所述的装置,还包括:原始视频获取电路,配置为获取原始视频,其中,所述原始视频包括p个原始视频帧,p是大于n的整数;以及目标视频帧确定电路,配置为对所述p个原始视频帧进行抽帧处理,得到n个所述目标视频帧。9.根据权利要求1~3中任一项所述的装置,还包括:待播放区域确定电路,配置为在确定所述第n目标姿态信息表征所述第n目标视频帧中存在所述预设姿态的情况下,从所述第n目标视频帧中确定第n待播放区域;目标播放区域确定电路,配置为根据所述第n待播放区域和第n-1目标播放区域,确定第n目标播放区域;以及播放电路,配置为对所述第n播放区域进行播放。10.根据权利要求9所述的装置,其中,所述目标播放区域确定电路还配置为通过以下操作实现根据所述第n待播放区域和第n-1目标播放区域,确定第n目标播放区域:根据所述第n待播放区域的位置信息和所述第n-1目标播放区域的位置信息,确定所述第n待播放区域与所述第n-1目标播放区域之间的重叠度;以及在确定所述第n待播放区域与所述第n-1目标播放区域之间的重叠度小于或等于第三预设阈值的情况下,将所述第n待播放区域确定为所述第n目标播放区域。11.一种图像处理方法,包括:获取目标视频,其中,所述目标视频包括n个目标视频帧,n是大于或等于2的整数;对第n目标视频帧进行头部检测,得到第n头部姿态信息,其中,所述第n头部姿态信息表征所述第n目标视频帧中存在预设姿态的第一概率,n是大于1且小于或等于n的整数,m是大于或等于1且小于n的整数;对所述第n目标视频帧进行姿态检测,得到第n中间姿态信息,其中,所述第n中间姿态信息表征所述第n目标视频帧中存在所述预设姿态的第二概率;以及根据所述第n头部姿态信息和所述第n中间姿态信息,确定第n目标姿态信息,其中,所述第n姿态信息表征所述第n目标视频帧中存在所述预设姿态的概率。12.一种处理器,用于执行计算机程序,以实现根据权利要求11所述的方法。13.一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求11所述的方法。14.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理
器执行根据权利要求11所述的方法。15.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求11所述的方法。
技术总结
本公开提供了一种图像处理装置、方法、处理器、电子设备及存储介质,可以应用于人工智能技术领域。该装置包括:目标视频获取电路,配置为获取目标视频,其中,目标视频包括N个目标视频帧;头部姿态信息确定电路,配置为对第n目标视频帧进行头部检测,得到第n头部姿态信息,其中,第n头部姿态信息表征第n目标视频帧中存在预设姿态的第一概率;中间姿态信息确定电路,配置为对第n目标视频帧进行姿态检测,得到第n中间姿态信息;处理电路,配置为根据第n头部姿态信息和第n中间姿态信息,确定第n目标姿态信息,其中,第n目标姿态信息表征第n目标视频帧中存在预设姿态的概率。频帧中存在预设姿态的概率。频帧中存在预设姿态的概率。
技术研发人员:赵玉瑶 李伟琪 王高升 黄远东
受保护的技术使用者:北京奕斯伟计算技术股份有限公司
技术研发日:2023.05.18
技术公布日:2023/8/6
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/