模型搜索方法及相关产品与流程

未命名 08-22 阅读:120 评论:0


1.本技术涉及电子设备技术领域,具体涉及一种模型搜索方法及相关产品。


背景技术:

2.随着深度学习技术的进步,神经网络算法在图像去噪的应用日益广泛。神经网络搜索算法的诞生降低了人工设计神经网络的复杂度,但是同样的也引入了新的问题。目前,大部分的神经网络算法在搜索过程中计算量较大,并且在搜索过程中占用设备显存较大。


技术实现要素:

3.本技术实施例提供了一种模型搜索方法及相关产品,有利于减少显存占用,从而有利于减少计算量,并有利于搜索更大更复杂的神经网络。
4.第一方面,本技术实施例提供一种模型搜索方法,所述方法包括:
5.确定预设模型对应的上采样胞体和下采样胞体,其中,所述上采样胞体和/或所述下采样胞体包括多个特征层;
6.确定所述上采样胞体和所述下采样胞体中每一所述特征层分别对应的第一混合操作和第二混合操作;
7.在对所述预设模型进行搜索训练时,对所述第一混合操作中包括的多个预选操作进行搜索,得到第一目标操作;
8.对所述第二混合操作中包括的多个预选操作进行搜索,得到第二目标操作;
9.根据所述第一目标操作和所述第二目标操作,确定目标模型。
10.第二方面,本技术实施例提供一种模型搜索装置,应用于电子设备,所述装置包括:确定单和搜索单元,其中,
11.所述确定单元,用于确定预设模型对应的上采样胞体和下采样胞体,其中,所述上采样胞体和/或所述下采样胞体包括多个特征层;
12.所述确定单元,还用于确定所述上采样胞体和所述下采样胞体中每一所述特征层分别对应的第一混合操作和第二混合操作;
13.所述搜索单元,用于在对所述预设模型进行搜索训练时,对所述第一混合操作中包括的多个预设操作进行搜索,得到第一目标操作;
14.所述搜索单元,还用于对所述第二混合操作中包括的多个预设操作进行搜索,得到第二目标操作;
15.所述确定单元,还用于根据所述第一目标操作和所述第二目标操作,确定目标模型。
16.第三方面,本技术实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本技术实施例第一方面任一方法中的步骤的指令。
17.第四方面,本技术实施例提供了一种计算机可读存储介质,其中,上述计算机可读
存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本技术实施例第一方面任一方法中所描述的部分或全部步骤。
18.第五方面,本技术实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本技术实施例第一方面任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
19.可以看出,本技术实施例中,可以确定预设模型对应的上采样胞体和下采样胞体,其中,所述上采样胞体和/或所述下采样胞体包括多个特征层;确定所述上采样胞体和所述下采样胞体中每一所述特征层分别对应的第一混合操作和第二混合操作;在对所述预设模型进行搜索训练时,对所述第一混合操作中包括的多个预选操作进行搜索,得到第一目标操作;对所述第二混合操作中包括的多个预选操作进行搜索,得到第二目标操作;根据所述第一目标操作和所述第二目标操作,确定目标模型。如此,可在每一次混合操作中,选择其中一个目标操作参与整个训练,有利于减少显存占用,从而有利于减少计算量,并有利于搜索更大更复杂的神经网络。
附图说明
20.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
21.图1a是本技术实施例提供的一种模型搜索系统的结构示意图;
22.图1b是本技术实施例提供的一种上采样胞体和/或下采样胞体的结构示意图;
23.图1c是本技术实施例提供的一种应用于cconv模块的流程示意图;
24.图2是本技术实施例提供的一种模型搜索方法的流程示意图;
25.图3是本技术实施例提供的一种模型搜索方法的流程示意图;
26.图4是本技术实施例提供的一种模型搜索方法的流程示意图;
27.图5是本技术实施例提供的一种电子设备的结构示意图;
28.图6是本技术实施例提供的一种模型搜索装置的功能单元组成框图。
具体实施方式
29.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
30.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
31.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
32.电子设备可以是还包含其它功能诸如个人数字助理和/或音乐播放器功能的便携式电子设备,诸如手机、平板电脑、具备无线通讯功能的可穿戴电子设备(如智能手表、智能眼镜)、车载设备等。便携式电子设备的示例性实施例包括但不限于搭载ios系统、android系统、microsoft系统或者其它操作系统的便携式电子设备。上述便携式电子设备也可以是其它便携式电子设备,诸如膝上型计算机(laptop)等。还应当理解的是,在其他一些实施例中,上述电子设备也可以不是便携式电子设备,而是台式计算机。
33.第一部分,本技术实施例所公开的示例应用场景介绍如下。
34.图1a示出了本技术所适用的模型搜索系统的结构示意图,该系统中可包括:数据输入模块、一个或多个上采样胞体、一个或多个下采样胞体、拼接操作模块、cconv模块和数据输出模块。
35.其中,上述上采样胞体和/或下采样胞体的结构示意图如图1b所示,每一上采样胞体和/或下采样胞体可包括:输入节点、中间节点和输出节点。
36.其中,如图1b所示,为上采样胞体和/或下采样胞体的结构示意图,上述上采样胞体和/或下采样胞体包括多层特征层结构,其中,输入节点与中间节点之间对应有第一特征层和第二特征层,中间节点和输出节点对应有第三特征层。在第一特征层对应有第一操作,对输入节点的输入数据进行第一操作以后,得到中间节点s1和s2;在第二特征层对应有第二操作,对中间节点s1和/或中间节点s2和/或输入数据进行第二操作以后,得到中间节点s3;最后,第三特征层对应有第三操作,对中间节点s1、s2和s3进行第三操作以后,得到该上采样胞体和/或下采样胞体处理以后的输出数据。
37.需要说明的是,上述上采样胞体和下采样胞体所对应的第一操作和/或第二操作和/或第三操作是不同的。
38.其中,上述输入上采样胞体和/或下采样胞体和/或数据输入模块的输入数据可以为四维张量数据x[b,h,w,ci],其中,上述b代表数量,ci代表图像通道,h代表高度,w代表宽度。
[0039]
在一种可能的示例中,针对上采样胞体,上述第一操作可对输入数据进行升维处理,能够将维度为[b,h,w,ci]的输入数据,变换为[b,h*2,w*2,co]的中间节点s1和s2,该第一操作可包括以下至少一种:反池化(kernel为2x2)、插值类操作(双线性插值,最近邻插值)、反卷积(strides为2x2)等等,在此不作限定;进而,上述第二操作可对输入到第二特征层的数据进行降维处理,将维度为[b,h,w,ci]的输入数据变换为[b,h,w,co]的中间节点s3,该第二操作可包括以下至少一种:直连(identity)、卷积(strides为1x1)、深度可分离卷积(strides为1x1)等,在此不作限定;上述第三操作可包括直连操作等,在此不作限定。
[0040]
在一种可能的示例中,针对下采样胞体,上述第一操作能够将维度为[b,h,w,ci]的输入数据,变换为维度为[b,h/2,w/2,co]的中间节点s1和s2,也就是可将输入该下采样胞体的输入数据进行降维处理,上述第一操作可包括以下至少一种:池化(kernel为2x2)、插值类操作(双线性插值,最近邻插值)、卷积(strides为2x2)、深度可分离卷积(strides为
2x2)等等,在此不作限定;上述第二操作可将维度为[b,h,w,ci]的输入数据变换为维度为[b,h,w,co]的中间节点s3,第二操作包括以下至少一种:直连(identity)、卷积(strides为1x1)、深度可分离卷积(strides为1x1)等等,在此不作限定;上述第三操作可包括以下至少一种:直连(identity)、卷积(strides为1x1)、深度可分离卷积(strides为1x1)等,在此不作限定。
[0041]
其中,如图1c所示,为上述应用于cconv模块的流程示意图,该cconv模块由两种操作组成,分别为特征融合操作(cancat)和卷积操作(conv)。
[0042]
其中,针对如图1a所示的系统结构,在采用该结构进行搜索训练时,针对上采样胞体和/或下采样胞体来说,每一特征层(第一特征层、第二特征层和第三特征层中任意一个)可包括多种混合操作,其中上采样胞体中的每一特征层可对应第一混合操作(可包括多个预选操作),下采样胞体的每一特征层可对应有第二混合操作(可包括多个预选操作)。
[0043]
在本技术中,可确定该模型架构对应的上采样胞体和下采样胞体,并依次将输入数据传输到该下采样胞体和上采样胞体,并在对模型进行搜索训练时,对上采样胞体和下采样胞体中分别对应的每一特征层对应的第一混合操作和第二混合操作进行搜索,并对该模型完成每一次的搜索训练,可得到上采样胞体对应的第一目标混合操作和下采样胞体对应的第二目标混合操作,根据该第一目标混合操作和第二目标混合操作,得到一个新的网络结构的目标模型。如此,在每一次混合操作中,选择其中一个目标操作参与整个训练,有利于减少显存占用,从而有利于减少计算量,并有利于搜索更大更复杂的神经网络。
[0044]
在本技术中,上述多个可指两个或两个以上,后续不再赘述。
[0045]
第二部分,本技术实施例所公开的权要保护范围介绍如下。
[0046]
请参阅图2,图2是本技术实施例提供的一种模型搜索方法的流程示意图,应用于电子设备,如图所示,本模型搜索方法包括以下操作。
[0047]
s201、确定预设模型对应的上采样胞体和下采样胞体,其中,所述上采样胞体和/或所述下采样胞体包括多个特征层。
[0048]
其中,上述预设模型可如图1a所示的结构示意图或者该图1a所示模型架构的变型结构,例如,该预设模型可以包括一个上采样胞体和一个下采样胞体组成,也可以包括3个上采样胞体和3个下采样胞体,在此不作限定。上述上采样胞体和/或下采样胞体的结构示意图如图1b所示,在此不再赘述。
[0049]
s202、确定所述上采样胞体和所述下采样胞体中每一所述特征层分别对应的第一混合操作和第二混合操作。
[0050]
其中,上述第一混合操作可应用于上采样胞体的多个特征层(包括:第一特征层、第二特征层和第三特征层),上述多个特征层中每一层可对应有多个预选操作。
[0051]
其中,上述第二混合操作可应用于下采样胞体的多个特征层(包括:第一特征层、第二特征层和第三特征层),上述多个特征层中每一层可对应有多个预选操作。
[0052]
s203、在对所述预设模型进行搜索训练时,对所述第一混合操作中包括的多个预选操作进行搜索,得到第一目标操作。
[0053]
具体实现中,可在每一次对该预设模型进行搜索训练时,针对上采样胞体的每一特征层的多个预选操作进行搜索,并从中选择一个第一目标操作。
[0054]
s204、对所述第二混合操作中包括的多个预选操作进行搜索,得到第二目标操作。
[0055]
具体实现中,可在每一次对该预设模型进行搜索训练时,针对下采样胞体的每一特征层的多个预选操作进行搜索,并从中选择一个第二目标操作。
[0056]
s205、根据所述第一目标操作和所述第二目标操作,确定目标模型。
[0057]
具体实现中,可在完成搜索训练以后,将搜索训练以后得到的上采样胞体和下采样胞体,以及如图1a所示的数据输入模块、拼接操作模块、cconv模块和数据输出模块组成目标模型。
[0058]
其中,在完成搜索训练以后,搜索训练以后确定的上采样胞体中每一特征层对应的第一目标操作,和下采样胞体中每一特征层对应的第二目标操作。可由上述第一目标操作和第二目标操作组成的目标模型完成对于图片的去噪处理。
[0059]
可以看出,本技术实施例所描述的模型搜索方法,可以确定预设模型对应的上采样胞体和下采样胞体,其中,所述上采样胞体和/或所述下采样胞体包括多个特征层;确定所述上采样胞体和所述下采样胞体中每一所述特征层分别对应的第一混合操作和第二混合操作;在对所述预设模型进行搜索训练时,对所述第一混合操作中包括的多个预选操作进行搜索,得到第一目标操作;对所述第二混合操作中包括的多个预选操作进行搜索,得到第二目标操作;根据所述第一目标操作和所述第二目标操作,确定目标模型。如此,可在每一次混合操作中,选择其中一个目标操作参与整个训练,有利于减少显存占用,从而有利于减少计算量,并有利于搜索更大更复杂的神经网络。
[0060]
在一种可能的示例中,所述上采样胞体和/或所述下采样胞体包括:输入节点、中间节点和输出节点。
[0061]
在一个可能的示例中,所述多个特征层包括第一特征层、第二特征层和第三特征层;所述方法还包括如下步骤:确定由所述输入节点到所述中间节点的特征层为所述第一特征层、所述输入节点到所述中间节点的特征层为所述第二特征层和所述中间节点到所述输出节点的特征层为所述第三特征层,其中,所述第一特征层用于完成所述多个第一预选操作中任一第一预选操作和/或所述第一操作,所述第二特征层用于完成所述多个第二预选操作中任一第二预选操作和/或所述第二操作,所述第三特征层用于完成所述多个第三预选操作中任一第三预选操作和/或所述第三操作。
[0062]
其中,如图1b所示,该上采样胞体可包括三个特征层,分别为第一特征层、第二特征层和第三特征层。上述第一类型可对应第一特征层,第二类型可对应第二特征层,第三操作可对应第三特征层。
[0063]
其中,第一特征层可用于完成针对第一预选操作或者第一操作,该第一预设操作和/或第一操作可包括以下至少一种:反池化(kernel为2x2)、插值类操作(双线性插值,最近邻插值)、反卷积(strides为2x2)等等,在此不作限定;第二特征层可用于完成第二预设操作或者第二操作,该第二预设操作和/或第二操作可包括以下至少一种:直连(identity)、卷积(strides为1x1)、深度可分离卷积(strides为1x1)等,在此不作限定。上述第三特征层可用于完成第三预设操作或者第三操作。上述第一预设操作可包括第一操作,第二预设操作可包括第二操作,第三预设操作包括第三操作。
[0064]
可见,本示例中,该上采样胞体由多个特征层组成,每一特征层可对应完成一种操作,在具体的搜索训练过程中,不需要该特征层中所有的操作都参与,有利于节省计算量。
[0065]
在一个可能的示例中,所述第一目标操作包括第一类型对应的第一操作、第二类
型对应的第二操作和第三类型对应的第三操作;所述对所述第一混合操作中包括的多个预选操作进行搜索,得到第一目标操作,上述方法包括如下步骤:确定所述第一混合操作中包括的多个预选操作中所述第一类型对应的多个第一预选操作、所述第二类型对应的多个第二预选操作和所述第三类型对应的多个第三预选操作;在所述对所述预设模型进行搜索训练时,从所述第一类型对应的多个第一预选操作中选择一个第一预选操作,并将选择得到的第一预选操作确定为所述第一操作;从所述第一类型对应的多个第二预选操作中选择一个第二预选操作,并将选择得到的第一预选操作确定为所述第二操作;从所述第一类型对应的多个第三预选操作中选择一个第三预选操作,并将选择得到的第一预选操作确定为所述第三操作。
[0066]
其中,每一特征层的作用是不同的,其对应的操作的类型不同,例如,第一特征层可包括第一操作,第一类型可指对四维的输入数据[b,h,w,ci]的高度和宽度进行升维操作;第二特征层可包括第二操作,第二类型可指对四维的输入数据[b,h,w,ci]的图像通道进行改变。
[0067]
其中,每一类型对应的操作可对应有不同种类,例如,第一操作可包括以下至少一种:反池化(kernel为2x2)、插值类操作(双线性插值,最近邻插值)、反卷积(strides为2x2)等等,在此不作限定;该第二操作可包括以下至少一种:直连(identity)、卷积(strides为1x1)、深度可分离卷积(strides为1x1)等,在此不作限定。
[0068]
具体实现中,可在对每一次对预设模型进行搜索训练时,在对每一特征层对应的预选操作进行选择的过程中,采用采样的方式,选择其中一种预选操作,对该预设模型进行搜索训练,并在确定预设模型收敛以后,进一步确定得到第一操作、第二操作和第三操作,并由上述第一操作、第二操作和第三操作组合得到第一目标操作。
[0069]
可见,本示例中,可根据每一特征层对应的类型,确定对应的多个预选操作(包括多个第一预选操作、多个第二预选操作和多个第三预选操作),进而,根据从多个第一预选操作、多个第二预选操作和多个第三预选操作中选择一个第一预选操作、第二预选操作和第三预选操作,并执行完成本次的搜索训练。如此,在混合操作计算过程中,可针对每一特征层对应的多个预选操作中选择其中一个预选操作,并与其他特征层选择得到的预选操作组合得到该上采样胞体对应的第一目标操作,以完成对于输入数据的模型搜索训练,在搜索过程中,不需要每一个操作都参与,有利于减少计算量。
[0070]
在一个可能的示例中,上述方法还可包括如下步骤:在每一次对所述预设模型进行搜索训练时,确定所述搜索训练时的输入数据;将所述输入数据依次通过所述输入节点、所述中间节点和所述输出节点,并依次完成所述多个第一预选操作中任一第一预选操作和/或所述第一操作、所述多个第二预选操作中任一第二预选操作和/或所述第二操作,所述多个第三预选操作中任一第三预选操作和/或所述第三操作,得到输出数据。
[0071]
其中,在本技术中,仅以一个上采样胞体进行说明,本示例可应用于如图1b所示的上采样胞体的结构示意图中,举例来说,如图3所示,为上采样胞体对应的模型搜索方法对应的流程示意图,可通过输入节点输入通过该上采样胞体的输入数据,并通过中间节点(s1、s2和s3)和输出节点,依次完成对于该输入数据的第一操作、第二操作和第三操作。
[0072]
可见,本示例中,可在每一次搜索训练时,通过上采样胞体和/或下采样胞体的完成对于混合操作的筛选,并使得在搜索过程中每一操作都能单独贡献该混合操作的输出。
[0073]
在一个可能的示例中,所述从所述第一类型对应的多个第一预选操作中选择一个第一预选操作,并将选择得到的第一预选操作确定为所述第一操作,包括:在所述每一次对所述预设模型进行搜索训练时,按照预设抽样函数,从所述多个第一预选操作中任意选择一个第一预选操作,并作用于所述第一特征层;在根据所述每一第一预选操作对所述预设模型完成所述搜索训练以后,确定所述多个第一预选操作对应的多个加权系数;从所述多个加权系数中选择最大加权系数对应的第一预选操作为所述第一操作。
[0074]
其中,上述预设抽样函数可为用户自行设置或者系统默认,在此不作限定;该预设抽样函数可以表示为:
[0075]
y=sample(α1*op1,α2*op2,
···
,αn*opn)(x);
[0076]
其中,在每一次搜索训练时,针对一个上采样胞体来说,第一特征层、第二特征层和第三特征层对应的混合操作由n个预选操作op构成,其中αi是可学习的架构参数,代表第i个操作,x代表输入数据,y代表混合操作的输出,sample是预设抽样函数,混合操作的输出是按概率(抽到概率的大小由来表示)从中抽取一个预选操作,并作用于输入数据x,进而得到该上采样胞体对应的输出数据y。
[0077]
进而,直到预设模型收敛为止,完成所有的搜索训练,并确定每一次搜索训练过程中,统计每一预设操作对应的概率,进而,可确定每一特征层中每一预设操作对应的加权系数,进而得到多个加权系数,从上述多个加权系数中可选取最大加权系数对应的预设操作为最后想要得到的操作,例如,第一操作、第二操作和第三操作。
[0078]
可见,本示例中,可通过采样的方式,为每一特征层匹配预选操作,进而,在对预设模型进行多次搜索训练,并完成搜索训练以后,可确定每一层的特征层对应的最佳操作,即加权系数最大的预设操作对应的操作;如此,在混合操作中,参与计算的操作都是按照一定的采样来确定,在网络搜索过程中,缓解了直连操作占主导的问题;并且有利于后续得到目标模型,并有利于根据该目标模型搜索出更好的图像去噪模型。
[0079]
需要说明的是,在本技术中,针对下采样胞体中第二目标操作的选择方式与上采样胞体的第一目标操作的选择方式一致,在此不在赘述。
[0080]
与上述一致地,请参阅图4,图4是本技术实施例所提供的一种模型搜索方法的流程示意图,如图所示,该预设模型包括:4个上采样胞体和4个下采样胞体,以及多个拼接操作模块和cconv模块。如图所示,对于下采样胞体来说,每一次的输入数据受上一过程中上一下采样胞体的输出数据的影响,每一上采样胞体不仅受上一上采样胞体的输出数据的影响,还受其对应的下采样胞体的输出的影响;举例来说,针对下采样胞体2来说,与其对应的上采样胞体为上采样胞体2,该下采样胞体2的输入数据为下采样胞体1的输出数据y12,上采样胞体2的输入为上采样胞体3的输出数据y22与下采样胞体2的输出数据y13的拼接得到的数据y24。结合图1b所示的上采样胞体和/或下采样胞体对应的结构示意图,在本技术实施例中,可在每一上采样胞体和/或下采样胞体中实现对于混合操作的采样以及筛选,并在每一次的模型搜索过程中,每一特征层选取一种预选操作并组合为该上采样胞体和/或下采样胞体的混合操作,并结合预设模型的连接方式以及数据流转方式,完成对于该预设模型的训练,以得到目标模型,可通过该目标模型实现图像去噪处理,有利于降低设计图像去噪网络模型的时间,有利于提高图像去噪的效果。
[0081]
请参阅图5,图5是本技术实施例提供的一种电子设备的结构示意图,如图所示,该
电子设备包括处理器、存储器、通信接口以及一个或多个程序,应用于电子设备,其中,上述一个或多个程序被存储在上述存储器中,上述一个或多个程序被配置由上述处理器执行以下步骤的指令:
[0082]
确定预设模型对应的上采样胞体和下采样胞体,其中,所述上采样胞体和/或所述下采样胞体包括多个特征层;
[0083]
确定所述上采样胞体和所述下采样胞体中每一所述特征层分别对应的第一混合操作和第二混合操作;
[0084]
在对所述预设模型进行搜索训练时,对所述第一混合操作中包括的多个预选操作进行搜索,得到第一目标操作;
[0085]
对所述第二混合操作中包括的多个预选操作进行搜索,得到第二目标操作;
[0086]
根据所述第一目标操作和所述第二目标操作,确定目标模型。
[0087]
可以看出,本技术实施例中所描述的电子设备,可以确定预设模型对应的上采样胞体和下采样胞体,其中,所述上采样胞体和/或所述下采样胞体包括多个特征层;确定所述上采样胞体和所述下采样胞体中每一所述特征层分别对应的第一混合操作和第二混合操作;在对所述预设模型进行搜索训练时,对所述第一混合操作中包括的多个预选操作进行搜索,得到第一目标操作;对所述第二混合操作中包括的多个预选操作进行搜索,得到第二目标操作;根据所述第一目标操作和所述第二目标操作,确定目标模型。如此,可在每一次混合操作中,选择其中一个目标操作参与整个训练,有利于减少显存占用,从而有利于减少计算量,并有利于搜索更大更复杂的神经网络。
[0088]
在一种可能的示例中,所述上采样胞体和/或所述下采样胞体包括:输入节点、中间节点和输出节点。
[0089]
在一个可能的示例中,所述第一目标操作包括第一类型对应的第一操作、第二类型对应的第二操作和第三类型对应的第三操作;
[0090]
在所述对所述第一混合操作中包括的多个预选操作进行搜索,得到第一目标操作方面,上述程序包括用于执行以下步骤的指令:
[0091]
确定所述第一混合操作中包括的多个预选操作中所述第一类型对应的多个第一预选操作、所述第二类型对应的多个第二预选操作和所述第三类型对应的多个第三预选操作;
[0092]
在所述对所述预设模型进行搜索训练时,从所述第一类型对应的多个第一预选操作中选择一个第一预选操作,并将选择得到的第一预选操作确定为所述第一操作;
[0093]
从所述第一类型对应的多个第二预选操作中选择一个第二预选操作,并将选择得到的第一预选操作确定为所述第二操作;
[0094]
从所述第一类型对应的多个第三预选操作中选择一个第三预选操作,并将选择得到的第一预选操作确定为所述第三操作。
[0095]
在一个可能的示例中,所述多个特征层包括第一特征层、第二特征层和第三特征层;上述程序还包括用于执行以下步骤的指令:
[0096]
确定由所述输入节点到所述中间节点的特征层为所述第一特征层、所述输入节点到所述中间节点的特征层为所述第二特征层和所述中间节点到所述输出节点的特征层为所述第三特征层,其中,所述第一特征层用于完成所述多个第一预选操作中任一第一预选
操作和/或所述第一操作,所述第二特征层用于完成所述多个第二预选操作中任一第二预选操作和/或所述第二操作,所述第三特征层用于完成所述多个第三预选操作中任一第三预选操作和/或所述第三操作。
[0097]
在一个可能的示例中,上述程序还包括用于执行以下步骤的指令:
[0098]
在每一次对所述预设模型进行搜索训练时,确定所述搜索训练时的输入数据;
[0099]
将所述输入数据依次通过所述输入节点、所述中间节点和所述输出节点,并依次完成所述多个第一预选操作中任一第一预选操作和/或所述第一操作、所述多个第二预选操作中任一第二预选操作和/或所述第二操作,所述多个第三预选操作中任一第三预选操作和/或所述第三操作,得到输出数据。
[0100]
在一个可能的示例中,在所述从所述第一类型对应的多个第一预选操作中选择一个第一预选操作,并将选择得到的第一预选操作确定为所述第一操作方面,上述程序包括用于执行以下步骤的指令:
[0101]
在所述每一次对所述预设模型进行搜索训练时,按照预设抽样函数,从所述多个第一预选操作中任意选择一个第一预选操作,并作用于所述第一特征层;
[0102]
在根据所述每一第一预选操作对所述预设模型完成所述搜索训练以后,确定所述多个第一预选操作对应的多个加权系数;
[0103]
从所述多个加权系数中选择最大加权系数对应的第一预选操作为所述第一操作。
[0104]
上述主要从方法侧执行过程的角度对本技术实施例的方案进行了介绍。可以理解的是,电子设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本技术能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0105]
本技术实施例可以根据上述方法示例对电子设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本技术实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0106]
在采用对应各个功能划分各个功能模块的情况下,图6示出了模型搜索装置的示意图,如图6所示,所述装置应用于电子设备,该模型搜索装置600可以包括:确定单元601和搜索单元602,其中,
[0107]
确定单元601可以用于支持终端设备执行上述步骤s201、s202和s205和/或用于本文所描述的技术的其他过程。
[0108]
搜索单元602可以用于支持终端设备执行上述步骤s203-s204,和/或用于本文所描述的技术的其他过程。
[0109]
可以看出,本技术实施例提供的模型搜索装置,可以确定预设模型对应的上采样胞体和下采样胞体,其中,所述上采样胞体和/或所述下采样胞体包括多个特征层;确定所述上采样胞体和所述下采样胞体中每一所述特征层分别对应的第一混合操作和第二混合
操作;在对所述预设模型进行搜索训练时,对所述第一混合操作中包括的多个预选操作进行搜索,得到第一目标操作;对所述第二混合操作中包括的多个预选操作进行搜索,得到第二目标操作;根据所述第一目标操作和所述第二目标操作,确定目标模型。如此,可在每一次混合操作中,选择其中一个目标操作参与整个训练,有利于减少显存占用,从而有利于减少计算量,并有利于搜索更大更复杂的神经网络。
[0110]
在一个可能的示例中,在一个可能的示例中,所述第一目标操作包括第一类型对应的第一操作、第二类型对应的第二操作和第三类型对应的第三操作;
[0111]
在所述对所述第一混合操作中包括的多个预选操作进行搜索,得到第一目标操作方面,上述搜索单元602具体用于:
[0112]
确定所述第一混合操作中包括的多个预选操作中所述第一类型对应的多个第一预选操作、所述第二类型对应的多个第二预选操作和所述第三类型对应的多个第三预选操作;
[0113]
在所述对所述预设模型进行搜索训练时,从所述第一类型对应的多个第一预选操作中选择一个第一预选操作,并将选择得到的第一预选操作确定为所述第一操作;
[0114]
从所述第一类型对应的多个第二预选操作中选择一个第二预选操作,并将选择得到的第一预选操作确定为所述第二操作;
[0115]
从所述第一类型对应的多个第三预选操作中选择一个第三预选操作,并将选择得到的第一预选操作确定为所述第三操作。
[0116]
在一个可能的示例中,所述多个特征层包括第一特征层、第二特征层和第三特征层;上述确定单元601,还用于:
[0117]
确定由所述输入节点到所述中间节点的特征层为所述第一特征层、所述输入节点到所述中间节点的特征层为所述第二特征层和所述中间节点到所述输出节点的特征层为所述第三特征层,其中,所述第一特征层用于完成所述多个第一预选操作中任一第一预选操作和/或所述第一操作,所述第二特征层用于完成所述多个第二预选操作中任一第二预选操作和/或所述第二操作,所述第三特征层用于完成所述多个第三预选操作中任一第三预选操作和/或所述第三操作。
[0118]
在一个可能的示例中,上述确定单元601,还用于:
[0119]
在每一次对所述预设模型进行搜索训练时,确定所述搜索训练时的输入数据;
[0120]
将所述输入数据依次通过所述输入节点、所述中间节点和所述输出节点,并依次完成所述多个第一预选操作中任一第一预选操作和/或所述第一操作、所述多个第二预选操作中任一第二预选操作和/或所述第二操作,所述多个第三预选操作中任一第三预选操作和/或所述第三操作,得到输出数据。
[0121]
在一个可能的示例中,在所述从所述第一类型对应的多个第一预选操作中选择一个第一预选操作,并将选择得到的第一预选操作确定为所述第一操作方面,上述搜索单元602具体用于:
[0122]
在所述每一次对所述预设模型进行搜索训练时,按照预设抽样函数,从所述多个第一预选操作中任意选择一个第一预选操作,并作用于所述第一特征层;
[0123]
在根据所述每一第一预选操作对所述预设模型完成所述搜索训练以后,确定所述多个第一预选操作对应的多个加权系数;
[0124]
从所述多个加权系数中选择最大加权系数对应的第一预选操作为所述第一操作。
[0125]
需要说明的是,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
[0126]
本实施例提供的电子设备,用于执行上述模型搜索方法,因此可以达到与上述实现方法相同的效果。
[0127]
在采用集成的单元的情况下,电子设备可以包括处理模块、存储模块和通信模块。其中,处理模块可以用于对电子设备的动作进行控制管理,例如,可以用于支持电子设备执行上述确定单元601和搜索单元602执行的步骤。存储模块可以用于支持电子设备执行存储程序代码和数据等。通信模块,可以用于支持电子设备与其他设备的通信。
[0128]
其中,处理模块可以是处理器或控制器。其可以实现或执行结合本技术公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,数字信号处理(digital signal processing,dsp)和微处理器的组合等等。存储模块可以是存储器。通信模块具体可以为射频电路、蓝牙芯片、wi-fi芯片等与其他电子设备交互的设备。
[0129]
本技术实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。
[0130]
本技术实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。
[0131]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本技术所必须的。
[0132]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0133]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
[0134]
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0135]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以
是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0136]
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例上述方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0137]
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:read-only memory,简称:rom)、随机存取器(英文:random access memory,简称:ram)、磁盘或光盘等。
[0138]
以上对本技术实施例进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。

技术特征:
1.一种模型搜索方法,其特征在于,所述方法包括:确定预设模型对应的上采样胞体和下采样胞体,其中,所述上采样胞体和/或所述下采样胞体包括多个特征层;确定所述上采样胞体和所述下采样胞体中每一所述特征层分别对应的第一混合操作和第二混合操作;在对所述预设模型进行搜索训练时,对所述第一混合操作中包括的多个预选操作进行搜索,得到第一目标操作;对所述第二混合操作中包括的多个预选操作进行搜索,得到第二目标操作;根据所述第一目标操作和所述第二目标操作,确定目标模型。2.根据权利要求1所述的方法,其特征在于,所述上采样胞体和/或所述下采样胞体包括:输入节点、中间节点和输出节点。3.根据权利要求1或2所述的方法,其特征在于,所述第一目标操作包括第一类型对应的第一操作、第二类型对应的第二操作和第三类型对应的第三操作;所述对所述第一混合操作中包括的多个预选操作进行搜索,得到第一目标操作,包括:确定所述第一混合操作中包括的多个预选操作中所述第一类型对应的多个第一预选操作、所述第二类型对应的多个第二预选操作和所述第三类型对应的多个第三预选操作;在所述对所述预设模型进行搜索训练时,从所述第一类型对应的多个第一预选操作中选择一个第一预选操作,并将选择得到的第一预选操作确定为所述第一操作;从所述第一类型对应的多个第二预选操作中选择一个第二预选操作,并将选择得到的第一预选操作确定为所述第二操作;从所述第一类型对应的多个第三预选操作中选择一个第三预选操作,并将选择得到的第一预选操作确定为所述第三操作。4.根据权利要求3所述的方法,其特征在于,所述多个特征层包括第一特征层、第二特征层和第三特征层;所述方法还包括:确定由所述输入节点到所述中间节点的特征层为所述第一特征层、所述输入节点到所述中间节点的特征层为所述第二特征层和所述中间节点到所述输出节点的特征层为所述第三特征层,其中,所述第一特征层用于完成所述多个第一预选操作中任一第一预选操作和/或所述第一操作,所述第二特征层用于完成所述多个第二预选操作中任一第二预选操作和/或所述第二操作,所述第三特征层用于完成所述多个第三预选操作中任一第三预选操作和/或所述第三操作。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:在每一次对所述预设模型进行搜索训练时,确定所述搜索训练时的输入数据;将所述输入数据依次通过所述输入节点、所述中间节点和所述输出节点,并依次完成所述多个第一预选操作中任一第一预选操作和/或所述第一操作、所述多个第二预选操作中任一第二预选操作和/或所述第二操作,所述多个第三预选操作中任一第三预选操作和/或所述第三操作,得到输出数据。6.根据权利要求5所述的方法,其特征在于,所述从所述第一类型对应的多个第一预选操作中选择一个第一预选操作,并将选择得到的第一预选操作确定为所述第一操作,包括:在所述每一次对所述预设模型进行搜索训练时,按照预设抽样函数,从所述多个第一
预选操作中任意选择一个第一预选操作,并作用于所述第一特征层;在根据所述每一第一预选操作对所述预设模型完成所述搜索训练以后,确定所述多个第一预选操作对应的多个加权系数;从所述多个加权系数中选择最大加权系数对应的第一预选操作为所述第一操作。7.一种模型搜索装置,其特征在于,所述装置包括:确定单和搜索单元,其中,所述确定单元,用于确定预设模型对应的上采样胞体和下采样胞体,其中,所述上采样胞体和/或所述下采样胞体包括多个特征层;所述确定单元,还用于确定所述上采样胞体和所述下采样胞体中每一所述特征层分别对应的第一混合操作和第二混合操作;所述搜索单元,用于在对所述预设模型进行搜索训练时,对所述第一混合操作中包括的多个预设操作进行搜索,得到第一目标操作;所述搜索单元,还用于对所述第二混合操作中包括的多个预设操作进行搜索,得到第二目标操作;所述确定单元,还用于根据所述第一目标操作和所述第二目标操作,确定目标模型。8.一种电子设备,其特征在于,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-6任一项所述的方法中的步骤的指令。9.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-6任一项所述的方法。10.一种计算机程序产品,其中,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如权利要求1-6任一项所描述的方法。

技术总结
本申请实施例公开了一种模型搜索方法及相关产品,方法包括:确定预设模型对应的上采样胞体和下采样胞体,其中,所述上采样胞体和/或所述下采样胞体包括多个特征层;确定所述上采样胞体和所述下采样胞体中每一所述特征层分别对应的第一混合操作和第二混合操作;在对所述预设模型进行搜索训练时,对所述第一混合操作中包括的多个预选操作进行搜索,得到第一目标操作;对所述第二混合操作中包括的多个预选操作进行搜索,得到第二目标操作;根据所述第一目标操作和所述第二目标操作,确定目标模型。采用本申请实施例有利于减少显存占用,从而有利于减少计算量,并有利于搜索更大更复杂的神经网络。的神经网络。的神经网络。


技术研发人员:郭烈强
受保护的技术使用者:哲库科技(上海)有限公司
技术研发日:2022.02.08
技术公布日:2023/8/21
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐