目标检测模型的训练方法、装置、计算机设备和存储介质与流程

未命名 08-07 阅读:67 评论:0


1.本技术涉及图像处理技术领域,特别是涉及一种目标检测模型的训练方法、装置、计算机设备和存储介质。


背景技术:

2.近年来,随着深度学习的发展,目标检测技术得到长足发展和广泛应用,较为常用的方式是通过目标检测模型进行目标检测。通过目标检测模型进行目标检测的前提是获取样本图像,对样本图像进行图像标注,形成训练集,对目标检测模型进行训练,以保证使用训练后的目标检测模型进行目标检测的准确性。
3.现有的目标检测图像标注方式较为单一,不能针对目标检测模型进行适应性调整,容易由于过细粒度或过粗粒度的标注方式,导致目标检测模型训练效果欠佳,通过该目标检测模型进行目标检测的准确性较低。


技术实现要素:

4.基于此,有必要针对上述技术问题,提供一种能够提高目标检测模型训练准确性的目标检测模型的训练方法、装置、计算机设备和存储介质。
5.第一方面,本技术提供了一种目标检测模型的训练方法。所述方法包括:
6.获取多个第一样本图像,确定所述第一样本图像中检测对象的第一外接标注框;
7.根据所述第一外接标注框中包括的元素内容,获取所述第一外接标注框对应的第一原始标注名称;
8.根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行聚类,获得所述目标相似度阈值相应的第一聚类结果;
9.将所述第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,并作为相应第一样本图像的目标训练标签;
10.基于具有目标训练标签的第一样本图像,对目标检测模型进行训练。
11.在其中一个实施例中,所述目标相似度阈值的确定过程,包括:
12.获取多个第二样本图像,确定所述第二样本图像中检测对象的第二外接标注框;
13.根据所述第二外接标注框中包括的元素内容,获取所述第二外接标注框对应的第二原始标注名称;
14.根据不同的相似度阈值和不同第二原始标注名称之间的相似度,对所有第二原始标注名称进行聚类,获得每一相似度阈值相应的第二聚类结果;
15.将每一第二聚类结果中的第二原始标注名称转化为相同的参考训练标签,并作为相应第二样本图像的参考训练标签;
16.基于具有参考训练标签的第二样本图像,对所述目标检测模型进行训练,获得每一相似度阈值相应的训练评价参数;
17.根据每一相似度阈值相应的训练评价参数,从所有相似度阈值中筛选出目标相似
度阈值。
18.在其中一个实施例中,所述根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行聚类,获得所述目标相似度阈值相应的第一聚类结果,包括:
19.根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行初始聚类,获得所述目标相似度阈值相应的第一初始聚类结果;
20.在所述第一初始聚类结果对应的第一样本图像的数量不在目标预设范围内或者第一原始标注名称不符合名称标注规则的情况下,对所述第一初始聚类结果中第一样本图像的第一原始标注名称进行修正,得到修正后的第一原始标注名称;
21.根据所述目标相似度阈值和不同修正后的第一原始标注名称之间的相似度,对所有修正后的第一原始标注名称进行聚类,获得所述目标相似度阈值相应的第一聚类结果。
22.在其中一个实施例中,所述基于具有参考训练标签的第二样本图像,对所述目标检测模型进行训练,获得每一相似度阈值相应的训练评价参数,包括:
23.将具有参考训练标签的第二样本图像输入所述目标检测模型中,直至所述目标检测模型的损失值曲线的波动在预设波动范围内,停止训练,得到相应的训练后的目标检测模型;
24.基于训练后的目标检测模型,获取每一相似度阈值相应的训练评价参数。
25.在其中一个实施例中,所述训练评价参数为平均精度;所述根据每一相似度阈值相应的训练评价参数,从所有相似度阈值中筛选出目标相似度阈值,包括:
26.确定每一相似度阈值相应的平均精度中的最大值,将最大值对应的相似度阈值作为目标相似度阈值。
27.在其中一个实施例中,所述第一样本图像中有多个检测对象;所述基于具有目标训练标签的第一样本图像,对目标检测模型进行训练,包括:
28.获取具有目标训练标签的第一样本图像中每一第一外接标注框的位置坐标;
29.基于位置坐标、目标训练标签和相应的第一样本图像,对目标检测模型进行训练。
30.第二方面,本技术还提供了一种目标检测模型的训练装置。所述装置包括:
31.图像获取模块,用于获取多个第一样本图像,确定所述第一样本图像中检测对象的第一外接标注框;
32.名称标注模块,用于根据所述第一外接标注框中包括的元素内容,获取所述第一外接标注框对应的第一原始标注名称;
33.聚类模块,用于根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行聚类,获得所述目标相似度阈值相应的第一聚类结果;
34.标签转化模块,用于将所述第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,并作为相应第一样本图像的目标训练标签;
35.模型训练模块,用于基于具有目标训练标签的第一样本图像,对目标检测模型进行训练。
36.第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例中的方法的步骤。
37.第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例中的方法的步骤。
38.第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述任一实施例中的方法的步骤。
39.上述目标检测模型的训练方法、装置、计算机设备和存储介质,通过确定多个第一样本图像中检测对象的第一外接标注框中包括的元素内容对应的第一原始标注名称,根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行聚类,获得目标相似度阈值相应的第一聚类结果,将第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,并作为相应第一样本图像的目标训练标签,基于具有目标训练标签的第一样本图像,对目标检测模型进行训练。相比于传统技术中通过人为标注样本图像的标签存在准确性不高的问题而言,本技术基于目标相似度阈值对所有第一原始标注名称进行聚类,获得第一聚类结果,并将第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,能够提高对第一样本图像标注的准确性,从而对目标检测模型进行训练的效果更好。
附图说明
40.图1为本技术实施例中提供的目标检测模型的训练方法的流程示意图;
41.图2为一个实施例中提供的第一样本图像的示意图;
42.图3为一个实施例中目标相似度阈值的确定过程的流程示意图;
43.图4为一个实施例中获得目标相似度阈值相应的第一聚类结果的流程示意图;
44.图5为本技术实施例中提供的一种目标检测模型的训练装置的结构框图;
45.图6为本技术实施例中提供的一种计算机设备的内部结构图。
具体实施方式
46.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
47.在本实施例中,提供了一种目标检测模型的训练方法,本实施例以该方法应用于计算机设备进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括计算机设备和服务器的系统,并通过计算机设备和服务器的交互实现。
48.图1为本技术实施例中提供的目标检测模型的训练方法的流程示意图,该方法应用于计算机设备中,在一个实施例中,如图1所示,包括以下步骤:
49.s101,获取多个第一样本图像,确定第一样本图像中检测对象的第一外接标注框。
50.其中,第一样本图像为包含目标检测模型的目标检测对象的图像。第一样本图像可以通过相机拍摄的方式获得,也可以通过网络下载的方式获得,还可以是通过文档转换为图像的工具例如pymupdf工具将pdf文档转换得到。检测对象为目标检测模型的目标检测对象。第一外接标注框为用于确定第一样本图像中检测对象的所处区域的标注框。第一外接标注框的形状可以为矩形,具体不作限定。
51.以检测对象为动物举例,第一外接标注框例如为矩形,第一样本图像为包含动物的图像,第一样本图像的示意图,如图2所示,图2中阴影区域a为某动物,b为a的第一外接标注框。
52.s102,根据第一外接标注框中包括的元素内容,获取第一外接标注框对应的第一原始标注名称。
53.其中,元素内容为第一样本图像中检测对象的相关信息。以检测对象为动物举例,元素内容可以是颜色、种类或者体型大小。
54.在一些实施例中,按照第一名称标注规则获取第一外接标注框对应的第一原始标注名称,第一名称标注规则为人为设定。
55.对第一名称标注规则进行举例,如下表1所示。
56.表1第一名称标注规则
57.元素内容有翅膀有尾巴体型大体表透明肉食动物是11111否00000
58.若第一样本图像中检测对象为大象,则大象的第一外接标注框对应的第一原始标注名称为01100;若第一样本图像中检测对象为麻雀,则麻雀的第一外接标注框对应的第一原始标注名称为11000。
59.第一名称标注规则可以通过数字进行标注,也可以通过字母进行标注,还可以是数字和字母混合使用,具体不作限定。通过字母进行标注,例如a表示陆生动物,b表示海洋动物,c表示飞行动物。
60.s103,根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行聚类,获得目标相似度阈值相应的第一聚类结果。
61.在一些实施例中,在不同第一原始标注名称之间的相似度为目标相似度阈值的情况下,将对应的第一原始标注名称聚类在一起;在不同第一原始标注名称之间的相似度不为目标相似度阈值的情况下,则不对对应的第一原始标注名称进行聚类。若某一第一原始标注名称与多个第一原始标注名称聚类在一起,则对应生成多种第一聚类结果。
62.例如所有第一原始标注名称分别为a011、a100、a000、b111、c100,目标相似度阈值为75%,则第一种第一聚类结果为a011、a100和a000、b111、c100,共4类;第二种第一聚类结果为a011、a100和c100、a000、b111,共4类。
63.s104,将第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,并作为相应第一样本图像的目标训练标签。
64.第一聚类结果中包含的类别数为目标训练标签的数量。
65.以第一聚类结果为a011、a100和a000、b111、c100,共4类为例,对将第一聚类结果中的第一原始标注名称转化为相同的目标训练标签的方式为将a011转化为m,将a100和a000均转化为n,将b111转化为p,将c100转化为q,m、n、p和q为目标训练标签,用于区分第一聚类结果。目标训练标签可以为字母,也可以为数字,还可以是数字和字母混合使用,具体不作限定。
66.s105,基于具有目标训练标签的第一样本图像,对目标检测模型进行训练。
67.其中,目标检测模型为进行图像检测的模型。例如目标检测模型为yolo v5模型。
68.本实施例提供的目标检测模型的训练方法,通过确定多个第一样本图像中检测对象的第一外接标注框中包括的元素内容对应的第一原始标注名称,根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行聚类,获得目标相似度阈值相应的第一聚类结果,将第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,并作为相应第一样本图像的目标训练标签,基于具有目标训练标签的第一样本图像,对目标检测模型进行训练。相比于传统技术中通过人为标注样本图像的标签存在准确性不高的问题而言,本实施例基于目标相似度阈值对所有第一原始标注名称进行聚类,获得第一聚类结果,并将第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,能够提高对第一样本图像标注的准确性,从而对目标检测模型进行训练的效果更好。
69.在一个实施例中,目标相似度阈值的确定过程的流程示意图,如图3所示,包括以下内容:
70.s301,获取多个第二样本图像,确定第二样本图像中检测对象的第二外接标注框。
71.其中,第二样本图像为包含目标检测模型的目标检测对象的图像。第二样本图像可以通过相机拍摄的方式获得,也可以通过网络下载的方式获得,还可以是通过文档转换为图像的工具例如pymupdf工具将pdf文档转换得到。检测对象为目标检测模型的目标检测对象。第二外接标注框为用于确定第二样本图像中检测对象的所处区域的标注框。第二外接标注框的形状可以为矩形,具体不作限定。
72.s302,根据第二外接标注框中包括的元素内容,获取第二外接标注框对应的第二原始标注名称。
73.其中,元素内容为第二样本图像中检测对象的相关信息。
74.在一些实施例中,按照第二名称标注规则获取第二外接标注框对应的第二原始标注名称。第二名称标注规则为人为设定,可以与第一名称标注规则相同,也可以与第一名称标注规则不同。
75.第二名称标注规则可以通过数字进行标注,也可以通过字母进行标注,还可以是数字和字母混合使用,具体不作限定。
76.s303,根据不同的相似度阈值和不同第二原始标注名称之间的相似度,对所有第二原始标注名称进行聚类,获得每一相似度阈值相应的第二聚类结果。
77.不同的相似度阈值根据第二原始标注名称确定,例如第二原始标注名称为5位编码,则不同的相似度阈值可以设置为0%、20%、40%、60%、80%和100%;第二原始标注名称为4位编码,则不同的相似度阈值可以设置为0%、25%、50%、75%和100%。
78.在一些实施例中,针对每一相似度阈值,在不同第二原始标注名称之间的相似度为该相似度阈值的情况下,将对应的第二原始标注名称聚类在一起;在不同第二原始标注名称之间的相似度不为该相似度阈值的情况下,则不对对应的第二原始标注名称进行聚类。若某一第二原始标注名称与多个第二原始标注名称聚类在一起,则对应生成多种第二聚类结果。
79.s304,将每一第二聚类结果中的第二原始标注名称转化为相同的参考训练标签,并作为相应第二样本图像的参考训练标签。
80.其中,参考训练标签用于区分第二聚类结果,参考训练标签的数量与第二聚类结果中包含的类别数保持一致。参考训练标签可以为字母,也可以为数字,还可以是数字和字
母混合使用,具体不作限定。
81.s305,基于具有参考训练标签的第二样本图像,对目标检测模型进行训练,获得每一相似度阈值相应的训练评价参数。
82.其中,训练评价参数为用于评价目标检测模型的图像检测能力的好坏的参数。
83.s306,根据每一相似度阈值相应的训练评价参数,从所有相似度阈值中筛选出目标相似度阈值。
84.在本实施例中,通过不同的相似度阈值对多个第二样本图像中检测对象的第二外接标注框对应的第二原始标注名称进行聚类,得到第二聚类结果,将每一第二聚类结果中的第二原始标注名称转化为相同的参考训练标签,将基于具有参考训练标签的第二样本图像,对目标检测模型进行训练,获得每一相似度阈值相应的训练评价参数,从而从所有相似度阈值中筛选出目标相似度阈值,能够保证根据目标相似度阈值得到的第一聚类结果,基于第一聚类结果确定的具有目标训练标签的第一样本图像,对目标检测模型进行训练的效果更好,提高了对第一样本图像标注的准确性。
85.在一个实施例中,根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行聚类,获得目标相似度阈值相应的第一聚类结果的流程示意图,如图4所示,包括以下步骤:
86.s401,根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行初始聚类,获得目标相似度阈值相应的第一初始聚类结果。
87.s402,在第一初始聚类结果对应的第一样本图像的数量不在目标预设范围内或者第一原始标注名称不符合名称标注规则的情况下,对第一初始聚类结果中第一样本图像的第一原始标注名称进行修正,得到修正后的第一原始标注名称。
88.其中,目标预设范围为人为设定。名称标注规则为人为设定。
89.s403,根据目标相似度阈值和不同修正后的第一原始标注名称之间的相似度,对所有修正后的第一原始标注名称进行聚类,获得目标相似度阈值相应的第一聚类结果。
90.在本实施例中,对第一初始聚类结果中第一样本图像的第一原始标注名称进行修正,能够对于第一原始标注名称不准确的情况进行修正,以提高第一原始标注名称的准确性,从而提高得到的第一聚类结果的准确性。
91.在一个实施例中,基于具有参考训练标签的第二样本图像,对目标检测模型进行训练,获得每一相似度阈值相应的训练评价参数,包括:
92.将具有参考训练标签的第二样本图像输入目标检测模型中,直至目标检测模型的损失值曲线的波动在预设波动范围内,停止训练,得到相应的训练后的目标检测模型;
93.基于训练后的目标检测模型,获取每一相似度阈值相应的训练评价参数。
94.其中,预设波动范围为人为设定。
95.在本实施例中,基于训练后的目标检测模型,获取每一相似度阈值相应的训练评价参数,是以同一标准得到的训练后的目标检测模型,从而获取每一相似度阈值相应的训练评价参数基于的目标检测模型训练程度相同,以保证在同一标准下获得训练评价参数,避免因目标检测模型训练程度不同导致的训练评价参数的不同。
96.在一个实施例中,训练评价参数为平均精度;根据每一相似度阈值相应的训练评价参数,从所有相似度阈值中筛选出目标相似度阈值,包括:
97.确定每一相似度阈值相应的平均精度中的最大值,将最大值对应的相似度阈值作为目标相似度阈值。
98.其中,平均精度为map值,用于评价目标检测模型的图像检测能力的好坏。
99.在本实施例中,平均精度越大,目标检测模型的图像检测能力越好,因此选择最大值对应的相似度阈值作为目标相似度阈值,能够提高目标检测模型训练准确性。
100.在一个实施例中,第一样本图像中有多个检测对象;基于具有目标训练标签的第一样本图像,对目标检测模型进行训练,包括:
101.获取具有目标训练标签的第一样本图像中每一第一外接标注框的位置坐标;
102.基于位置坐标、目标训练标签和相应的第一样本图像,对目标检测模型进行训练。
103.第一样本图像中有多个检测对象,例如图2所示出的第一样本图像中有两个检测对象,阴影区域a为某动物,阴影区域a’为与a不同的动物,第一外接标注框b的位置坐标为52《x《1860,348《y《836,x为第一外接标注框的横向坐标,y为第一外接标注框的纵向坐标。
104.在本实施例中,针对有多个检测对象的第一样本图像同样适用,能够扩大目标检测模型的训练数据。
105.在这里,以一完整实施例的方式对本技术提供的目标检测模型的训练方法进行说明。首先,确定目标相似度阈值,确定过程包括:
106.获取多个第二样本图像,确定第二样本图像中检测对象的第二外接标注框;
107.根据第二外接标注框中包括的元素内容,获取第二外接标注框对应的第二原始标注名称;
108.根据不同的相似度阈值和不同第二原始标注名称之间的相似度,对所有第二原始标注名称进行初始聚类,获得每一相似度阈值相应的第二初始聚类结果;
109.在第二初始聚类结果对应的第二样本图像的数量不在参考预设范围内或者第二原始标注名称不符合第二名称标注规则的情况下,对第二初始聚类结果中第二样本图像的第二原始标注名称进行修正,得到修正后的第二原始标注名称;
110.根据不同的相似度阈值和不同修正后的第二原始标注名称之间的相似度,对所有修正后的第二原始标注名称进行聚类,获得每一相似度阈值相应的第二聚类结果;
111.将每一第二聚类结果中的第二原始标注名称转化为相同的参考训练标签,并作为相应第二样本图像的参考训练标签;
112.将具有参考训练标签的第二样本图像输入目标检测模型中,直至目标检测模型的损失值曲线的波动在预设波动范围内,停止训练,得到相应的训练后的目标检测模型;
113.基于训练后的目标检测模型,获取每一相似度阈值相应的训练评价参数,训练评价参数为平均精度;
114.确定每一相似度阈值相应的平均精度中的最大值,将最大值对应的相似度阈值作为目标相似度阈值。
115.然后,获取多个第一样本图像,确定第一样本图像中检测对象的第一外接标注框;根据第一外接标注框中包括的元素内容,获取第一外接标注框对应的第一原始标注名称;根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行初始聚类,获得目标相似度阈值相应的第一初始聚类结果;在第一初始聚类结果对应的第一样本图像的数量不在目标预设范围内或者第一原始标注名称不符合名称标注规则的
情况下,对第一初始聚类结果中第一样本图像的第一原始标注名称进行修正,得到修正后的第一原始标注名称;根据目标相似度阈值和不同修正后的第一原始标注名称之间的相似度,对所有修正后的第一原始标注名称进行聚类,获得目标相似度阈值相应的第一聚类结果;将第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,并作为相应第一样本图像的目标训练标签;
116.第一样本图像中有多个检测对象,获取具有目标训练标签的第一样本图像中每一第一外接标注框的位置坐标以及目标训练标签;基于位置坐标、目标训练标签和相应的第一样本图像,对目标检测模型进行训练。
117.本实施例提供的目标检测模型的训练方法,确定目标相似度阈值,基于目标相似度阈值对所有第一原始标注名称进行聚类,获得第一聚类结果,并将第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,能够提高对第一样本图像标注的准确性,从而保证目标检测模型的训练效果更好。
118.应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
119.基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的目标检测模型的训练方法的目标检测模型的训练装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个目标检测模型的训练装置实施例中的具体限定可以参见上文中对于目标检测模型的训练方法的限定,在此不再赘述。
120.参见图5,图5为本技术实施例中提供的一种目标检测模型的训练装置的结构框图,该装置500包括:图像获取模块501、名称标注模块502、聚类模块503、标签转化模块504和模型训练模块505,其中:
121.图像获取模块501,用于获取多个第一样本图像,确定第一样本图像中检测对象的第一外接标注框;
122.名称标注模块502,用于根据第一外接标注框中包括的元素内容,获取第一外接标注框对应的第一原始标注名称;
123.聚类模块503,用于根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行聚类,获得目标相似度阈值相应的第一聚类结果;
124.标签转化模块504,用于将第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,并作为相应第一样本图像的目标训练标签;
125.模型训练模块505,用于基于具有目标训练标签的第一样本图像,对目标检测模型进行训练。
126.本实施例提供的目标检测模型的训练装置,通过确定多个第一样本图像中检测对象的第一外接标注框中包括的元素内容对应的第一原始标注名称,根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行聚类,获得目标相似
度阈值相应的第一聚类结果,将第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,并作为相应第一样本图像的目标训练标签,基于具有目标训练标签的第一样本图像,对目标检测模型进行训练。相比于传统技术中通过人为标注样本图像的标签存在准确性不高的问题而言,本实施例基于目标相似度阈值对所有第一原始标注名称进行聚类,获得第一聚类结果,并将第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,能够提高对第一样本图像标注的准确性,从而对目标检测模型进行训练的效果更好。
127.可选的,该装置500还包括:
128.标注框确定模块,用于获取多个第二样本图像,确定第二样本图像中检测对象的第二外接标注框;
129.标注名称获取模块,用于根据第二外接标注框中包括的元素内容,获取第二外接标注框对应的第二原始标注名称;
130.聚类结果获得模块,用于根据不同的相似度阈值和不同第二原始标注名称之间的相似度,对所有第二原始标注名称进行聚类,获得每一相似度阈值相应的第二聚类结果;
131.训练标签确定模块,用于将每一第二聚类结果中的第二原始标注名称转化为相同的参考训练标签,并作为相应第二样本图像的参考训练标签;
132.评价参数获得模块,用于基于具有参考训练标签的第二样本图像,对目标检测模型进行训练,获得每一相似度阈值相应的训练评价参数;
133.目标相似度阈值确定模块,用于根据每一相似度阈值相应的训练评价参数,从所有相似度阈值中筛选出目标相似度阈值。
134.可选的,聚类模块503包括:
135.初始聚类单元,用于根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行初始聚类,获得目标相似度阈值相应的第一初始聚类结果;
136.修正单元,用于在第一初始聚类结果对应的第一样本图像的数量不在目标预设范围内或者第一原始标注名称不符合名称标注规则的情况下,对第一初始聚类结果中第一样本图像的第一原始标注名称进行修正,得到修正后的第一原始标注名称;
137.聚类单元,用于根据目标相似度阈值和不同修正后的第一原始标注名称之间的相似度,对所有修正后的第一原始标注名称进行聚类,获得目标相似度阈值相应的第一聚类结果。
138.可选的,评价参数获得模块包括:
139.模型训练单元,用于将具有参考训练标签的第二样本图像输入目标检测模型中,直至目标检测模型的损失值曲线的波动在预设波动范围内,停止训练,得到相应的训练后的目标检测模型;
140.评价参数获取单元,用于基于训练后的目标检测模型,获取每一相似度阈值相应的训练评价参数。
141.可选的,训练评价参数为平均精度;目标相似度阈值确定模块包括:
142.目标相似度阈值确定单元,用于确定每一相似度阈值相应的平均精度中的最大值,将最大值对应的相似度阈值作为目标相似度阈值。
143.可选的,第一样本图像中有多个检测对象;模型训练模块505包括:
144.位置坐标获取单元,用于获取具有目标训练标签的第一样本图像中每一第一外接标注框的位置坐标;
145.模型训练单元,用于基于位置坐标、目标训练标签和相应的第一样本图像,对目标检测模型进行训练。
146.上述目标检测模型的训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
147.在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口(input/output,简称i/o)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储目标训练标签等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种目标检测模型的训练方法。
148.本领域技术人员可以理解,图6中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
149.在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述实施例提供的目标检测模型的训练方法的步骤:
150.获取多个第一样本图像,确定第一样本图像中检测对象的第一外接标注框;
151.根据第一外接标注框中包括的元素内容,获取第一外接标注框对应的第一原始标注名称;
152.根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行聚类,获得目标相似度阈值相应的第一聚类结果;
153.将第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,并作为相应第一样本图像的目标训练标签;
154.基于具有目标训练标签的第一样本图像,对目标检测模型进行训练。
155.在一个实施例中,处理器执行计算机程序时还实现以下步骤:
156.获取多个第二样本图像,确定第二样本图像中检测对象的第二外接标注框;
157.根据第二外接标注框中包括的元素内容,获取第二外接标注框对应的第二原始标注名称;
158.根据不同的相似度阈值和不同第二原始标注名称之间的相似度,对所有第二原始标注名称进行聚类,获得每一相似度阈值相应的第二聚类结果;
159.将每一第二聚类结果中的第二原始标注名称转化为相同的参考训练标签,并作为
相应第二样本图像的参考训练标签;
160.基于具有参考训练标签的第二样本图像,对目标检测模型进行训练,获得每一相似度阈值相应的训练评价参数;
161.根据每一相似度阈值相应的训练评价参数,从所有相似度阈值中筛选出目标相似度阈值。
162.在一个实施例中,处理器执行计算机程序时还实现以下步骤:
163.根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行初始聚类,获得目标相似度阈值相应的第一初始聚类结果;
164.在第一初始聚类结果对应的第一样本图像的数量不在目标预设范围内或者第一原始标注名称不符合名称标注规则的情况下,对第一初始聚类结果中第一样本图像的第一原始标注名称进行修正,得到修正后的第一原始标注名称;
165.根据目标相似度阈值和不同修正后的第一原始标注名称之间的相似度,对所有修正后的第一原始标注名称进行聚类,获得目标相似度阈值相应的第一聚类结果。
166.在一个实施例中,处理器执行计算机程序时还实现以下步骤:
167.将具有参考训练标签的第二样本图像输入目标检测模型中,直至目标检测模型的损失值曲线的波动在预设波动范围内,停止训练,得到相应的训练后的目标检测模型;
168.基于训练后的目标检测模型,获取每一相似度阈值相应的训练评价参数。
169.在一个实施例中,处理器执行计算机程序时还实现以下步骤:
170.训练评价参数为平均精度;确定每一相似度阈值相应的平均精度中的最大值,将最大值对应的相似度阈值作为目标相似度阈值。
171.在一个实施例中,处理器执行计算机程序时还实现以下步骤:
172.第一样本图像中有多个检测对象;获取具有目标训练标签的第一样本图像中每一第一外接标注框的位置坐标;
173.基于位置坐标、目标训练标签和相应的第一样本图像,对目标检测模型进行训练。
174.上述实施例的实现原理和技术效果与上述方法实施例类似,在此不再赘述。
175.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例提供的目标检测模型的训练方法的步骤:
176.获取多个第一样本图像,确定第一样本图像中检测对象的第一外接标注框;
177.根据第一外接标注框中包括的元素内容,获取第一外接标注框对应的第一原始标注名称;
178.根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行聚类,获得目标相似度阈值相应的第一聚类结果;
179.将第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,并作为相应第一样本图像的目标训练标签;
180.基于具有目标训练标签的第一样本图像,对目标检测模型进行训练。
181.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
182.获取多个第二样本图像,确定第二样本图像中检测对象的第二外接标注框;
183.根据第二外接标注框中包括的元素内容,获取第二外接标注框对应的第二原始标注名称;
184.根据不同的相似度阈值和不同第二原始标注名称之间的相似度,对所有第二原始标注名称进行聚类,获得每一相似度阈值相应的第二聚类结果;
185.将每一第二聚类结果中的第二原始标注名称转化为相同的参考训练标签,并作为相应第二样本图像的参考训练标签;
186.基于具有参考训练标签的第二样本图像,对目标检测模型进行训练,获得每一相似度阈值相应的训练评价参数;
187.根据每一相似度阈值相应的训练评价参数,从所有相似度阈值中筛选出目标相似度阈值。
188.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
189.根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行初始聚类,获得目标相似度阈值相应的第一初始聚类结果;
190.在第一初始聚类结果对应的第一样本图像的数量不在目标预设范围内或者第一原始标注名称不符合名称标注规则的情况下,对第一初始聚类结果中第一样本图像的第一原始标注名称进行修正,得到修正后的第一原始标注名称;
191.根据目标相似度阈值和不同修正后的第一原始标注名称之间的相似度,对所有修正后的第一原始标注名称进行聚类,获得目标相似度阈值相应的第一聚类结果。
192.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
193.将具有参考训练标签的第二样本图像输入目标检测模型中,直至目标检测模型的损失值曲线的波动在预设波动范围内,停止训练,得到相应的训练后的目标检测模型;
194.基于训练后的目标检测模型,获取每一相似度阈值相应的训练评价参数。
195.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
196.训练评价参数为平均精度;确定每一相似度阈值相应的平均精度中的最大值,将最大值对应的相似度阈值作为目标相似度阈值。
197.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
198.第一样本图像中有多个检测对象;获取具有目标训练标签的第一样本图像中每一第一外接标注框的位置坐标;
199.基于位置坐标、目标训练标签和相应的第一样本图像,对目标检测模型进行训练。
200.上述实施例的实现原理和技术效果与上述方法实施例类似,在此不再赘述。
201.在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述实施例提供的目标检测模型的训练方法的步骤:
202.获取多个第一样本图像,确定第一样本图像中检测对象的第一外接标注框;
203.根据第一外接标注框中包括的元素内容,获取第一外接标注框对应的第一原始标注名称;
204.根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行聚类,获得目标相似度阈值相应的第一聚类结果;
205.将第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,并作为相应第一样本图像的目标训练标签;
206.基于具有目标训练标签的第一样本图像,对目标检测模型进行训练。
207.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
208.获取多个第二样本图像,确定第二样本图像中检测对象的第二外接标注框;
209.根据第二外接标注框中包括的元素内容,获取第二外接标注框对应的第二原始标注名称;
210.根据不同的相似度阈值和不同第二原始标注名称之间的相似度,对所有第二原始标注名称进行聚类,获得每一相似度阈值相应的第二聚类结果;
211.将每一第二聚类结果中的第二原始标注名称转化为相同的参考训练标签,并作为相应第二样本图像的参考训练标签;
212.基于具有参考训练标签的第二样本图像,对目标检测模型进行训练,获得每一相似度阈值相应的训练评价参数;
213.根据每一相似度阈值相应的训练评价参数,从所有相似度阈值中筛选出目标相似度阈值。
214.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
215.根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行初始聚类,获得目标相似度阈值相应的第一初始聚类结果;
216.在第一初始聚类结果对应的第一样本图像的数量不在目标预设范围内或者第一原始标注名称不符合名称标注规则的情况下,对第一初始聚类结果中第一样本图像的第一原始标注名称进行修正,得到修正后的第一原始标注名称;
217.根据目标相似度阈值和不同修正后的第一原始标注名称之间的相似度,对所有修正后的第一原始标注名称进行聚类,获得目标相似度阈值相应的第一聚类结果。
218.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
219.将具有参考训练标签的第二样本图像输入目标检测模型中,直至目标检测模型的损失值曲线的波动在预设波动范围内,停止训练,得到相应的训练后的目标检测模型;
220.基于训练后的目标检测模型,获取每一相似度阈值相应的训练评价参数。
221.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
222.训练评价参数为平均精度;确定每一相似度阈值相应的平均精度中的最大值,将最大值对应的相似度阈值作为目标相似度阈值。
223.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
224.第一样本图像中有多个检测对象;获取具有目标训练标签的第一样本图像中每一第一外接标注框的位置坐标;
225.基于位置坐标、目标训练标签和相应的第一样本图像,对目标检测模型进行训练。
226.上述实施例的实现原理和技术效果与上述方法实施例类似,在此不再赘述。
227.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器(ferroelectric random access memory,fram)、相变存储器(phase change memory,
pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
228.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
229.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。

技术特征:
1.一种目标检测模型的训练方法,其特征在于,所述方法包括:获取多个第一样本图像,确定所述第一样本图像中检测对象的第一外接标注框;根据所述第一外接标注框中包括的元素内容,获取所述第一外接标注框对应的第一原始标注名称;根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行聚类,获得所述目标相似度阈值相应的第一聚类结果;将所述第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,并作为相应第一样本图像的目标训练标签;基于具有目标训练标签的第一样本图像,对目标检测模型进行训练。2.根据权利要求1所述的方法,其特征在于,所述目标相似度阈值的确定过程,包括:获取多个第二样本图像,确定所述第二样本图像中检测对象的第二外接标注框;根据所述第二外接标注框中包括的元素内容,获取所述第二外接标注框对应的第二原始标注名称;根据不同的相似度阈值和不同第二原始标注名称之间的相似度,对所有第二原始标注名称进行聚类,获得每一相似度阈值相应的第二聚类结果;将每一第二聚类结果中的第二原始标注名称转化为相同的参考训练标签,并作为相应第二样本图像的参考训练标签;基于具有参考训练标签的第二样本图像,对所述目标检测模型进行训练,获得每一相似度阈值相应的训练评价参数;根据每一相似度阈值相应的训练评价参数,从所有相似度阈值中筛选出目标相似度阈值。3.根据权利要求1所述的方法,其特征在于,所述根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行聚类,获得所述目标相似度阈值相应的第一聚类结果,包括:根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行初始聚类,获得所述目标相似度阈值相应的第一初始聚类结果;在所述第一初始聚类结果对应的第一样本图像的数量不在目标预设范围内或者第一原始标注名称不符合名称标注规则的情况下,对所述第一初始聚类结果中第一样本图像的第一原始标注名称进行修正,得到修正后的第一原始标注名称;根据所述目标相似度阈值和不同修正后的第一原始标注名称之间的相似度,对所有修正后的第一原始标注名称进行聚类,获得所述目标相似度阈值相应的第一聚类结果。4.根据权利要求2所述的方法,其特征在于,所述基于具有参考训练标签的第二样本图像,对所述目标检测模型进行训练,获得每一相似度阈值相应的训练评价参数,包括:将具有参考训练标签的第二样本图像输入所述目标检测模型中,直至所述目标检测模型的损失值曲线的波动在预设波动范围内,停止训练,得到相应的训练后的目标检测模型;基于训练后的目标检测模型,获取每一相似度阈值相应的训练评价参数。5.根据权利要求2所述的方法,其特征在于,所述训练评价参数为平均精度;所述根据每一相似度阈值相应的训练评价参数,从所有相似度阈值中筛选出目标相似度阈值,包括:确定每一相似度阈值相应的平均精度中的最大值,将最大值对应的相似度阈值作为目
标相似度阈值。6.根据权利要求1至5任意一项所述的方法,其特征在于,所述第一样本图像中有多个检测对象;所述基于具有目标训练标签的第一样本图像,对目标检测模型进行训练,包括:获取具有目标训练标签的第一样本图像中每一第一外接标注框的位置坐标;基于位置坐标、目标训练标签和相应的第一样本图像,对目标检测模型进行训练。7.一种目标检测模型的训练装置,其特征在于,所述装置包括:图像获取模块,用于获取多个第一样本图像,确定所述第一样本图像中检测对象的第一外接标注框;名称标注模块,用于根据所述第一外接标注框中包括的元素内容,获取所述第一外接标注框对应的第一原始标注名称;聚类模块,用于根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行聚类,获得所述目标相似度阈值相应的第一聚类结果;标签转化模块,用于将所述第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,并作为相应第一样本图像的目标训练标签;模型训练模块,用于基于具有目标训练标签的第一样本图像,对目标检测模型进行训练。8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

技术总结
本申请涉及一种目标检测模型的训练方法、装置、计算机设备和存储介质。所述方法包括:获取多个第一样本图像,确定所述第一样本图像中检测对象的第一外接标注框;根据所述第一外接标注框中包括的元素内容,获取所述第一外接标注框对应的第一原始标注名称;根据目标相似度阈值和不同第一原始标注名称之间的相似度,对所有第一原始标注名称进行聚类,获得所述目标相似度阈值相应的第一聚类结果;将所述第一聚类结果中的第一原始标注名称转化为相同的目标训练标签,并作为相应第一样本图像的目标训练标签;基于具有目标训练标签的第一样本图像,对目标检测模型进行训练。采用本方法能够提高目标检测模型训练准确性。提高目标检测模型训练准确性。提高目标检测模型训练准确性。


技术研发人员:詹晨 王体龙 王德民 宋磊 魏丽莉 邓建春 刘芳芳 艾若琳
受保护的技术使用者:一汽解放汽车有限公司
技术研发日:2023.04.25
技术公布日:2023/8/6
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐