图像生成器生成方法、图像生成方法、装置及电子设备与流程
未命名
10-08
阅读:82
评论:0

技术领域:
:,尤其涉及一种图像生成器生成方法、图像生成方法、装置及电子设备。
背景技术:
::2.生成式对抗网络(generativeadversarialnetworks,gan)是一种常用的图像识别和图像生成模型,通过构造生成器和判别器进行对抗训练,得到能够用于生成图像的生成器模型,和能够用于识别图像的判别器模型。3.现有技术中,通过获取源域和目标域一一对应的有标图像,以全监督学习的方式,对生成式对抗网络中的生成器和判别器进行对抗训练,在训练完毕后,可获得一个能够生成指定视觉类别的随机图像的图像生成器。4.然而,在训练过程中,由于有标样本的获取成本较高,可用于训练的有标样本的数量有限,会影响生成式对抗网络中生成器的训练效果,导致训练后得到的图像生成器生成的图像质量低、鲁棒性差。技术实现要素:5.本公开实施例提供一种图像生成器生成方法、图像生成方法、装置及电子设备,以克服由于有标样本的数量有限,导致生成式对抗网络中生成器的训练效果差的问题。6.第一方面,本公开实施例提供一种图像生成器生成方法,包括:7.获取预设的生成式对抗网络模型,所述生成式对抗网络模型中包括第一生成器、第二生成器和判别器,所述第二生成器和所述判别器为预训练模型;针对所述第一生成器,循环执行以下步骤,直至所述第一生成器收敛为目标生成器,所述目标生成器用于生成目标视觉类别的图像:将第一样本数据分别输入所述第一生成器和所述第二生成器,得到所述第一生成器输出的第一随机图像和所述第二生成器输出的第二随机图像,其中,所述第一样本数据包括源视觉类别的无标图像;将所述第二随机图像输入所述判别器,得到所述第二随机图像对应的判别置信度,所述判别置信度表征所述第二随机图像归属于所述目标视觉类别的概率;若所述判别置信度大于置信度阈值,则基于所述第二随机图像和所述第一随机图像对所述第一生成器进行训练。8.第二方面,本公开实施例提供一种图像生成方法,包括:9.获取配置信息,所述配置信息用于表征图像的视觉类别;根据所述配置信息,得到对应的目标生成器,其中,所述目标生成器是通过如上第一方面以及第一方面各种可能的设计所述的图像生成器生成方法得到的;基于所述目标生成器,生成目标视觉类别的图像。10.第三方面,本公开实施例提供一种图像生成器生成装置,包括:11.获取模块,用于获取预设的生成式对抗网络模型,所述生成式对抗网络模型中包括第一生成器、第二生成器和判别器,所述第二生成器和所述判别器为预训练模型;12.训练模块,用于针对所述第一生成器,循环执行以下步骤,直至所述第一生成器收敛为目标生成器,所述目标生成器用于生成目标视觉类别的图像:将第一样本数据分别输入所述第一生成器和所述第二生成器,得到所述第一生成器输出的第一随机图像和所述第二生成器输出的第二随机图像,其中,所述第一样本数据包括源视觉类别的无标图像;将所述第二随机图像输入所述判别器,得到所述第二随机图像对应的判别置信度,所述判别置信度表征所述第二随机图像归属于所述目标视觉类别的概率;若所述判别置信度大于置信度阈值,则基于所述第二随机图像和所述第一随机图像对所述第一生成器进行训练。13.第四方面,本公开实施例提供一种图像生成装置,包括:14.获取模块,用于获取配置信息,所述配置信息用于表征图像的视觉类别;15.确定模块,用于根据所述配置信息,得到对应的目标生成器,其中,所述目标生成器是通过如上第一方面以及第一方面各种可能的设计所述的图像生成器生成方法得到的;16.生成模块,用于基于所述目标生成器,生成目标视觉类别的图像。17.第五方面,本公开实施例提供一种电子设备,包括:18.处理器,以及与所述处理器通信连接的存储器;19.所述存储器存储计算机执行指令;20.所述处理器执行所述存储器存储的计算机执行指令,以实现如上第一方面以及第一方面各种可能的设计所述的图像生成器生成方法;或者,以实现如上第二方面以及第二方面各种可能的设计所述的图像生成方法。21.第六方面,本公开实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的图像生成器生成方法;或者,实现如上第二方面以及第二方面各种可能的设计所述的图像生成方法。22.第七方面,本公开实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上第一方面以及第一方面各种可能的设计所述的图像生成器生成方法;或者,实现如上第二方面以及第二方面各种可能的设计所述的图像生成方法。23.本实施例提供的图像生成器生成方法、图像生成方法、装置及电子设备,通过获取预设的生成式对抗网络模型,所述生成式对抗网络模型中包括第一生成器、第二生成器和判别器,所述第二生成器和所述判别器为预训练模型;针对所述第一生成器,循环执行以下步骤,直至所述第一生成器收敛为目标生成器,所述目标生成器用于生成目标视觉类别的图像:将第一样本数据分别输入所述第一生成器和所述第二生成器,得到所述第一生成器输出的第一随机图像和所述第二生成器输出的第二随机图像,其中,所述第一样本数据包括源视觉类别的无标图像;将所述第二随机图像输入所述判别器,得到所述第二随机图像对应的判别置信度,所述判别置信度表征所述第二随机图像归属于所述目标视觉类别的概率;若所述判别置信度大于置信度阈值,则基于所述第二随机图像和所述第一随机图像对所述第一生成器进行训练。由于将第二生成器生成的第二随机图像进行置信度判断,在置信度大于置信度阈值时,可以将该第二随机图像作为目标视觉类别的图像,对第一生成器进行训练,从而实现对第一生成器的无监督训练,充分利用无标数据中的信息对模型进行训练,提高了模型训练效果,使训练后的第一生成器生成的图像质量高、鲁棒性好。附图说明24.为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。25.图1为本公开实施例提供的图像生成器生成方法的一种应用场景图;26.图2为现有技术中一种生成式对抗网络模型的结构示意图;27.图3为本公开实施例提供的图像生成器生成方法的流程示意图一;28.图4为基于第二随机图像和第一随机图像对第一生成器进行训练的流程示意图;29.图5为本公开实施例提供的一种生成式对抗网络模型的示意图;30.图6为本公开实施例提供的一种学生生成器和教师生成器模型的对比示意图;31.图7为本公开实施例提供的图像生成器生成方法的流程示意图二;32.图8为图7所示实施例中步骤s204的具体实现方式流程图;33.图9为本公开实施例提供的一种图像生成方法的流程示意图;34.图10为本公开实施例提供的图像生成器生成装置的结构框图;35.图11为本公开实施例提供的图像生成装置的结构框图;36.图12为本公开实施例提供的一种电子设备的结构示意图;37.图13为本公开实施例提供的电子设备的硬件结构示意图。具体实施方式38.为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。39.下面对本公开实施例的应用场景进行解释:40.图1为本公开实施例提供的图像生成器生成方法的一种应用场景图,本公开实施例提供的图像生成器生成方法,可以应用于图像生成器训练,以及基于该图像生成器生成图片的应用场景。具体地,本公开实施例提供的方法,可以应用于服务器、终端设备等电子设备,如图1所示,本实施例中,以服务器作为执行主体介绍,示例性地,服务器运行有用于提供图像生成器模型的服务,服务器与开发者用户所使用的终端设备通信连接,在接收到开发者用户通过终端设备发送的请求数据,服务器会基于请求数据中包含的部分有标样本数据(或指示有标数据存储位置的信息),以及原始的生成式对抗网络模型(或指示生成式对抗网络模型存储位置的信息),对模型进行预训练,得到预训练后的生成式对抗网络模型,之后从互联网或指定数据库中获取相应的无标样本数据,并利用无标样本数据对该生成式对抗网络模型进行优化训练。在训练完毕后,得到一个能够输出特定类别图像的图像生成器,并基于终端设备的请求,将该图像生成器返回至发送请求信息的终端设备,使开发者用户可以利用该图像生成器,生成指定视觉类别的图像,例如,将任意风格的图像转换为卡通风格图像;或者,将男士的面部表情图像转换为女士的面部表情图像,等等。41.图2为现有技术中一种生成式对抗网络模型的结构示意图,如图2所示,生成式对抗网络模型中包括一个生成器和一个判别器,其中,在用于特定类别的图像生成的场景下,生成式对抗网络模型中的生成器和判别器需要使用源域和目标域一一对应的有标图像进行训练,具体地,有标数据包括成对的图像数据{a,b},以及对应的标签信息,其中,图像数据a对应视觉类别为“猫”、图像数据b对应视觉类别为“狗”,即将“猫”对应的图像转换为“狗”对应的图像。通过图像数据{a,b}分别依次对判别器和生成器进行训练,使生成器根据图像数据a输出的随机图像与图像数据b的视觉类别相似;而判别器可以判断生成器输出的随机图像为真实图像的置信度。42.如上所示,现有技术中,对生成式对抗网络中的生成器进行训练,通常是利用源域和目标域一一对应的有标图像样本,以全监督学习的方式进行。然而,由于有标图像样本的获取成本较高,可用于训练的有标图像样本的数量有限,若训练样本不足,会影响生成式对抗网络中生成器的训练效果,导致训练后得到的图像生成器生成的图像质量低、鲁棒性差的问题。本公开实施例提供一种图像生成器生成方法、图像生成方法、装置及电子设备,以解决上述问题。43.参考图3,图3为本公开实施例提供的图像生成器生成方法的流程示意图一。本实施例的方法可以应用在服务器中,该图像生成器生成方法包括:44.步骤s101:获取预设的生成式对抗网络模型,生成式对抗网络模型中包括第一生成器、第二生成器和判别器,第二生成器和判别器为预训练模型。45.示例性地,生成式对抗网络模型是一种深度学习模型,现有技术中的生成式对抗网络模型,通过预设的生成器和判别器进行对抗训练,来分别提高生成器的图像生成能力和判别器的图像判别能力。本实施例步骤中的生成式对抗网络模型,包括两个生成器(第一生成器和第二生成器)和一个判别器,其中,示例性地,生成器和判别器可以是基于神经网络实现的,生成器和判别器可以包括一个或多个卷积层。其中,第二生成器和判别器为预训练模型,即预设的生成式对抗网络模型中的第二生成器和判别器,已经过有标数据的训练,因此,相比第一生成器,第二生成器具有一定程度的生成目标视觉类别的图像的能力;而判别器具有一定程度的判断图像是否归属于目标视觉类别的能力。其中第一生成器、第二生成器的具体功能及训练方法,在后续步骤中详细介绍。46.步骤s102:针对第一生成器,循环执行以下步骤,直至第一生成器收敛为目标生成器,目标生成器用于生成目标视觉类别的图像:将第一样本数据分别输入第一生成器和第二生成器,得到第一生成器输出的第一随机图像和第二生成器输出的第二随机图像,其中,第一样本数据包括源视觉类别的无标图像;将第二随机图像输入判别器,得到第二随机图像对应的判别置信度,判别置信度表征第二随机图像归属于目标视觉类别的概率;若判别置信度大于置信度阈值,则基于第二随机图像和第一随机图像对第一生成器进行训练。47.其中,本实施例步骤中所介绍的是对生成式对抗网络模型进行循环训练的步骤,在第一生成器收敛为目标生成器前,包括多个循环,下面以其中的一个循环为例进行介绍。48.示例性地,第一样本数据为源视觉类别的无标图像,具体地,视觉类别是图像的一种分类方式,具体指图像在视觉上的相似性,其中,视觉类别既可以以图像内容上的相似性划分,例如,视觉类别包括“人脸”、“狗”、“猫”、“马”等;也可以以图像风格上的相似性划分,例如视觉类别包括“漫画风格”、“油画风格”、“简笔画风格”等。视觉类别又可称为视觉域,是机器视觉
技术领域:
:的公知技术特征,此处不再详细赘述。第一样本数据为源视觉类别的无标图像,即不包含标注信息的图像,该第一样本数据可以通过互联网、数据库获取,其具体获取方式此处不一一举例。49.示例性地,第一样本数据例如包括主体内容为“狗”的图像p1,将图像p1分别输入生成式对抗网络模型中的第一生成器和第二生成器,可以分别得到第一生成器输出的图像p1a(第一随机图像)和第二生成器输出的图像p1b(第二随机图像),其中,第一生成器和第二生成器具有相似的网络结构,均用于对输入的图像进行映射,输出对应的目标视觉类别的图像,例如主体内容为“猫”的图片。由于第二生成器和判别器为经过预训练的预训练模型,因此,第二生成器具有一定程度的将源视觉类别的图像转换目标视觉类别的图像的能力(即将“狗”的图像转换为“猫”的图像的能力)。而判别器则具有一定程度的判断输入的图像是否为归属于目标视觉类别的能力。利用第二生成器的该能力,将第二生成器输出的第二随机图像输入判别器,得到判别器输出的判别置信度,若判别置信度大于预设的置信度阈值,例如0.75,则可认为第二生成器输出的第二随机图像输出的图像质量足够真实,可以视为目标视觉类别的图像(即可以视为“猫”的图像)。50.进一步地,将该足够真实的第二随机图像,作为伪标签计算与第一随机图像的损失函数值,进而基于该损失函数值对第一生成器进行梯度反向传播,实现对第一生成器的训练。在对第一生成器进行训练的过程中,会使第一生成器逐渐学习到第二生成器生成目标视觉类别的图像的能力,最终使第一生成器可以输出目标视觉类别的图像,即称为目标生成器。上述过程可通过知识蒸馏算法实现,具体地,如图4所示,基于第二随机图像和第一随机图像对第一生成器进行训练的具体方法包括:51.步骤s1021:基于知识蒸馏算法,通过第二随机图像和第一随机图像,得到第二生成器与第一生成器之间的第一蒸馏损失。52.步骤s1022:根据第一蒸馏损失,进行梯度反向传播,调整第一生成器的模型参数。53.相比于有标数据,无标注的第一样本数据的获取渠道更多,成本也更低,因此,基于第二生成器对大量的第一样本数据进行筛选,生成置信度较高的图像作为伪标签对第一生成器进行训练,实现了对无标数据的充分利用,可以有效的提高模型的效果。54.图5为本公开实施例提供的一种生成式对抗网络模型的示意图,如图5所示,生成式对抗网络模型中包括第一生成器、预训练的第二生成器和预训练的识别器,示例性地,在将无标的第一样本数据(图中示为rgb图像)输入第一生成器和第二生成器后,分别得到对应的第一随机图像和第二随机图像,之后利用识别器对第二随机图像进行评估,得到一个判别置信度,若判别置信度大于置信度阈值(图中示为y),则基于第一随机图像和第二随机图像计算蒸馏损失函数值,并进行梯度反向传播,调整第一生成器的模型参数,实现对第一生成器的训练(模型参数优化);若判别置信度不大于置信度阈值(图中示为n),则基于gan损失函数值对第二生成器进行梯度反向传播,调整第二生成器的模型参数,实现对第二生成器的训练。之后获取下一组第一样本数据,循环执行上述步骤。55.在一种可能的实现方式中,第一生成器为学生生成器,第二生成器为教师生成器,其中,第二生成器是通过对第一生成器进行卷积层通道扩展后得到的。更具体地,第一生成器(学生生成器)由一系列堆叠的mobile-netblock组成,其中,mobile-net是一种轻量级网络模型,在经训练后适用于移动设备或嵌入式设备对应的应用场景下。56.图6为本公开实施例提供的一种学生生成器和教师生成器模型的对比示意图,如图6所示,学生生成器中,包括m个中间层,通过对学生生成器中的中间层进行扩充,即中间层的通道(c1、c2、…、cm-1、cm)扩展至n倍,生成对应的教师生成器,从而用较大的模型容量来捕获学生模型捕获不到的信息。具体至本实施例中,通过mobile-net模型构建的第一生成器,具有轻量化、网络体积小的特点,可以在训练后应用于互联网应用程序(app)中。但同时,由于第一生成器的结构相对简单,一些复杂的图像特征无法学习到,因此,在第一生成器的基础上,通过卷积层通道扩展,得到的第二生成器具有更好的特征学习能力,本实施例过程中,通让对第二生成器进行预训练,利用第二生成器网络模型复杂,学习能力强的优点,使第二生成器具有生成目标视觉类型的图像的能力,进而通过第二生成器与第一生成器的损失函数值进行梯度反向传播,对第一生成器训练,以调整第一生成器的模型参数。使轻量级的第一生成器能够通过第二生成器学习到生成目标视觉类别的图像的能力,使该训练后的第一生成器能够部署在轻量级的应用产品中。57.在本实施例中,获取预设的生成式对抗网络模型,所述生成式对抗网络模型中包括第一生成器、第二生成器和判别器,所述第二生成器和所述判别器为预训练模型;针对所述第一生成器,循环执行以下步骤,直至所述第一生成器收敛为目标生成器,所述目标生成器用于生成目标视觉类别的图像:将第一样本数据分别输入所述第一生成器和所述第二生成器,得到所述第一生成器输出的第一随机图像和所述第二生成器输出的第二随机图像,其中,所述第一样本数据包括源视觉类别的无标图像;将所述第二随机图像输入所述判别器,得到所述第二随机图像对应的判别置信度,所述判别置信度表征所述第二随机图像归属于所述目标视觉类别的概率;若所述判别置信度大于置信度阈值,则基于所述第二随机图像和所述第一随机图像对所述第一生成器进行训练。由于将第二生成器生成的第二随机图像进行置信度判断,在置信度大于置信度阈值时,可以将该第二随机图像作为目标视觉类别的图像,对第一生成器进行训练,从而实现对第一生成器的无监督训练,充分利用无标数据中的信息对模型进行训练,提高了模型训练效果,使训练后的第一生成器生成的图像质量高、鲁棒性好。58.参考图7,图7为本公开实施例提供的图像生成器生成方法的流程示意图二。本实施例中详细描述了利用第一样本数据对第二生成器进行训练的过程,以及在对第二生成器进行训练之前对第一生成器和识别器进行训练的步骤,如图7所示,该图像生成器生成方法包括:59.步骤s201:获取预设的生成式对抗网络模型,生成式对抗网络模型中包括第一生成器、第二生成器和判别器。60.步骤s202:获取第二样本数据,第二样本数据包括第一有标图像和对应的第二有标图像,其中,第一有标图像为源视觉类别的图像,第二有标图像为目标视觉类别的图像。61.示例性地,第二样本数据是由数据对组成的有标数据,每一数据对中包括一个第一有标数据和一个第二有标数据,具体地,例如,第二样本数据为{a,b},其中,a为第一有标数据;b为第二有标数据。其中,第一有标图像为源视觉类别的图像,第二有标图像为目标视觉类别的图像,例如,第一有标图像为普通的风景图像(无风格),第二有标图像为与第一有标图像的内容相同,但是以漫画风格的表现的图像(漫画风格)。第一有标图像与第一有标图像之间所表征的映射关系,即需要第二生成器学习的特征。62.步骤s203:通过第二样本数据,对识别器进行训练。63.示例性地,在获得第二样本数据后,将目标视觉类别的图像作为训练样本对识别器进行训练,使识别器学习目标视觉类别(例如漫画风格)的图像的图像特征,从而使识别器能够对目标视觉类别的图像进行识别。具体地,识别器接收第二样本数据后,基于其本身的模型参数,输出一个判别置信度,判别置信度表征输入判别器的图像归属于目标视觉类别的概率,该判别置信度越高,说明识别器识别目标视觉类别的图像的能力越强,反之则越差;根据该判别置信度,进行梯度反向传播,来更新识别器的模型参数,从而使识别器识别目标视觉类别的图像的准确性逐渐提高。64.步骤s204:通过第二样本数据,通过训练后的判别器,对第二生成器进行训练。65.在训练完识别器(至少一次循环)之后,利用训练后的判别器,对第二生成器进行训练,来提高第二生成器生成目标视觉类别的图像的能力。66.可选地,如图8所示,步骤s204包括步骤s2041、s2042和s2043三个具体的实现步骤:67.步骤s2041:基于第一有标图像,利用识别器,获得第二生成器对应的生成式对抗网络损失函数值,生成式对抗网络损失函数值表征第二生成器输出的第三随机图像的评估置信度。68.步骤s2042:基于第一有标图像和第二有标图像,获得第二生成器对应的重建损失函数值,重建损失函数值表征第二生成器输出的第三随机图像与第二有标图像的差异度。69.步骤s2043:通过生成式对抗网络损失函数值和重建损失函数值,对第二生成器进行梯度反向传播,调整第二生成器的模型参数。70.示例性地,在对第二生成器进行训练过程中,通过获取对抗网络损失函数值和重建损失函数值来对第二生成器进行综合的训练,具体地,对抗网络损失函数值即gan损失函数对应的评估值。其中,gan损失函数是通过将第二生成器生成的第三随机图像输入识别器,让识别器来判断该第三随机图像的真伪,从而根据判断结果与真实结果(第二有标图像的标签,即1)的差异,来确定生成式对抗网络损失函数值,之后基于该生成式对抗网络损失函数值,进行反向梯度传播来降低判断结果与真实结果之间的差异,直至判断结果为真(即识别器认为生成器输出的随机图像为目标视觉类别的图像)。71.而重建损失函数值是表征第三随机图像与第二有标图像的差异度的信息,通过重建损失函数使得第二生成器的第三随机图像和第二有标图像的标签接近。具体地,基于第一有标图像和第二有标图像,获得第二生成器对应的重建损失函数值的实现方式包括:72.将第一有标数据输入第二生成器,得到第三随机图像;通过预设的重建损失函数,计算第三随机图像和第二有标图像的重建损失函数值。通过生成式对抗网络损失函数值和重建损失函数值,对第二生成器进行梯度反向传播,调整第二生成器的模型参数,使第二生成器的输出和真实标签接近,其中,重建损失函数和对抗网络损失函数的实现方式本领域技术人员知晓的现有技术,此处不再对此进行赘述。73.本实施例中,通过在使用无标数据对模型进行训练前,使用有标数据(第二样本数据)对生成式对抗网络模型中的第二生成器和判别器进行预训练,使第二生成器和判别器具有对应的图像生成能力和图像识别能力,进而在后续的步骤中,可以利用预训练的第二生成器对第一生成器进行训练,使轻量化的第一生成器可以学习到第二生成器的图像生成能力,同时由于后续步骤中可以利用无标数据进行训练,从而有效的提高了模型学习的效率和学习效果,使训练后的第一生成器(即目标生成器)所生成的目标视觉类别的图像具有更好的图像质量。74.步骤s205:获取第一样本数据,并将第一样本数据分别输入第一生成器和第二生成器,得到第一生成器输出的第一随机图像和第二生成器输出的第二随机图像,其中,第一样本数据包括源视觉类别的无标图像。75.步骤s206:将第二随机图像输入判别器,得到第二随机图像对应的判别置信度,判别置信度表征第二随机图像归属于目标视觉类别的概率。76.步骤s207:若判别置信度大于置信度阈值,则基于知识蒸馏算法,通过第二随机图像和第一随机图像,得到第二生成器与第一生成器之间的第一蒸馏损失。77.其中,第二生成器为教师模型,第一生成器为学生模型,第二生成器是基于第一生成器进行卷积层通道扩展后得到的。在将无标的第一样本数据输入第一生成器和第二生成器后,由于第二生成器可以输出相对第一生成器质量更好、与目标视觉类别更加相近的图像,因此,通过训练后的判别器对第二随机图像进行判别后,基于判别置信度,将大于置信度阈值的第二随机图像作为目标视觉域图像,形成伪标签,进而基于知识蒸馏算法,比较第二随机图像和第一随机图像的差别,生成第一蒸馏损失,示例性地,第一蒸馏损失通过l1损失函数计算得到。在后续过程中,可以基于该第一蒸馏损失,对作为学生模型的第一生成器优化,从而使第一生成器具有更好的图像生成能力。其中,本实施例中步骤s205-s207的具体实现方式在图3所示实施例中的步骤s102中,已进行过详细介绍,此处不再赘述。l1损失函数的具体实现方法为本领域技术人员知晓的现有技术,此处不再赘述。78.进一步地,若判别置信度小于置信度阈值,可以根据gan损失函数值,对第二生成器进行参数调整,实现第二生成器的优化,该过程不再进行赘述。79.步骤s208:将第一生成器输出的第一随机图像,输入判别器,得到第一随机图像对应的判别置信度。80.步骤s209:若第一随机图像对应的判别置信度为连续第n次大于预设置信度阈值,则第一生成器收敛为目标生成器。81.步骤s210:若第一随机图像对应的判别置信度不为连续第n次大于预设置信度阈值,则根据第一蒸馏损失,进行梯度反向传播,调整第一生成器的模型参数,并返回步骤s205。82.示例性地,步骤s209-s210为判断第一生成器收敛的条件,具体地,通过将第一随机图像输入判别器,来对第一生成器输出的第一随机图像的图像效果进行评估,如果判别置信度大于置信度阈值,说明第一随机图像的图像效果较好,反之则说明第一随机图像的图像效果较差。进一步地,在判断第一生成器收敛时,通过设置连续n次(n为大于1的整数)大于置信度阈值,来确保第一生成器输出的图片的稳定性和鲁棒性,即若第一随机图像对应的判别置信度为连续第n次大于预设置信度阈值,则可视为第一生成器可输出稳定的目标视觉类别的图像,也即第一生成器训练完毕,收敛为目标生成器。反之,若第一生成器不满足该条件,则根据第一蒸馏损失,进行梯度反向传播,调整第一生成器的模型参数,并返回至步骤s205,使用新的无标数据进一步的进行训练,使第一生成器实现对第二生成器的逼近。83.本实施例中,通过判断第二生成器输出的第二随机图片的判别置信度,选择性的对第一生成器或第二生成器进行训练,因此不需要一个预先训练好的教师生成器,而是教师生成器(第二生成器)和学生生成器(第一生成器)同步进行训练。学生生成器不再与鉴别器紧密绑定,它可以更灵活地训练并获得进一步的压缩。此外学生生成器(第二生成器)仅学习具有相似结构的较大容量的教师生成器(第一生成器)的输出,这大大降低了直接拟合真实标签的难度,提高了训练效率和训练质量。84.参考图9,图9为本公开实施例提供的一种图像生成方法的流程示意图。本实施例的方法可以应用在服务器或终端设备中,该图像生成方法包括:85.步骤s301:获取配置信息,配置信息用于表征图像的视觉类别。86.步骤s302:根据配置信息,得到对应的目标生成器。87.其中,目标生成器是通过如图3-8所对应的任一实施例方法得到的。88.步骤s303:基于目标生成器,生成目标视觉类别的图像。89.示例性地,参考图1所示的应用场景示意图,以终端设备为执行主体为例,为实现具体的功能,根据用户输入的配置信息,可以确定对应的目标生成器。其中,具体的,配置信息中可包括用于指示生成器所生成的图像的视觉类别的标识信息,根据该标识信息,通过访问服务器,获得与该标识信息对应的、已训练至收敛的目标生成器,之后,终端设备可以基于该目标生成器,生成配置信息对应的目标视觉类别的图像。例如,终端设备通过向目标生成器输入一个包含人脸的照片,经轻量化的目标生成器的处理,得到一个对应的漫画风格的图片,实现对图像的风格转换。其中,该目标生成器之所以能够实现该图像风格转换的功能,是由于经由上述实施例所提供的方法进行了训练,具体过程此处不再赘述。90.对应于上文实施例的图像生成器生成方法,图10为本公开实施例提供的图像生成器生成装置的结构框图。为了便于说明,仅示出了与本公开实施例相关的部分。参照图10,图像生成器生成装置4,包括:91.获取模块41,用于获取预设的生成式对抗网络模型,生成式对抗网络模型中包括第一生成器、第二生成器和判别器,第二生成器和判别器为预训练模型;92.训练模块42,用于针对第一生成器,循环执行以下步骤,直至第一生成器收敛为目标生成器,目标生成器用于生成目标视觉类别的图像:将第一样本数据分别输入第一生成器和第二生成器,得到第一生成器输出的第一随机图像和第二生成器输出的第二随机图像,其中,第一样本数据包括源视觉类别的无标图像;将第二随机图像输入判别器,得到第二随机图像对应的判别置信度,判别置信度表征第二随机图像归属于目标视觉类别的概率;若判别置信度大于置信度阈值,则基于第二随机图像和第一随机图像对第一生成器进行训练。93.在本公开的一个实施例中,训练模块42在基于第二随机图像和第一随机图像对第一生成器进行训练时,具体用于:基于知识蒸馏算法,通过第二随机图像和第一随机图像,得到第二生成器与第一生成器之间的第一蒸馏损失,其中,第二生成器为教师模型,第一生成器为学生模型,第二生成器是基于第一生成器进行卷积层通道扩展后得到的;根据第一蒸馏损失,进行梯度反向传播,调整第一生成器的模型参数。94.在本公开的一个实施例中,训练模块42,还用于:将第一生成器输出的第一随机图像,输入判别器,得到第一随机图像对应的判别置信度;当连续n次循环中,第一随机图像对应的判别置信度均大于预设置信度阈值,则确定第一生成器收敛为目标生成器,其中,n为大于1的整数。95.在本公开的一个实施例中,在针对第一生成器进行训练之前,获取模块41,还用于:获取第二样本数据,第二样本数据包括第一有标图像和对应的第二有标图像,其中,第一有标图像为源视觉类别的图像,第二有标图像为目标视觉类别的图像;训练模块42,还用于:基于第二样本数据,对第二生成器进行训练。96.在本公开的一个实施例中,训练模块42在基于第二样本数据,通过判别器,对第二生成器进行训练时,具体用于:基于第一有标图像,利用识别器,获得第二生成器对应的生成式对抗网络损失函数值,生成式对抗网络损失函数值表征第二生成器输出的第三随机图像的评估置信度;基于第一有标图像和第二有标图像,获得第二生成器对应的重建损失函数值,重建损失函数值表征第二生成器输出的第三随机图像与第二有标图像的差异度;通过生成式对抗网络损失函数值和重建损失函数值,对第二生成器进行梯度反向传播,调整第二生成器的模型参数。97.在本公开的一个实施例中,训练模块42基于第一有标图像和第二有标图像,获得第二生成器对应的重建损失函数值时,具体用于:将第一有标数据输入第二生成器,得到第三随机图像;通过预设的重建损失函数,计算第三随机图像和第二有标图像的重建损失函数值。98.在本公开的一个实施例中,训练模块42在基于第二样本数据,对第二生成器进行训练之前,还用于:基于第二样本数据,对判别器进行训练。99.本实施例提供的图像生成器生成装置4可以执行上述对应的方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。100.对应于上文实施例的图像生成器生成方法,图11为本公开实施例提供的图像生成装置的结构框图。为了便于说明,仅示出了与本公开实施例相关的部分。参照图11,图像生成装置5,包括:101.获取模块51,用于获取配置信息,配置信息用于表征图像的视觉类别;102.确定模块52,用于根据配置信息,得到对应的目标生成器,其中,目标生成器是通过如图3-8所对应的任一实施例方法得到的;103.生成模块53,用于基于目标生成器,生成目标视觉类别的图像。104.本实施例提供的装置,可用于执行上述对应的方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。105.图12为本公开实施例提供的一种电子设备的结构示意图,如图12所示,该电子设备6包括:106.处理器61,以及与处理器61通信连接的存储器62;107.存储器62存储计算机执行指令;108.处理器61执行存储器62存储的计算机执行指令,以实现如图3-图8所示实施例中的方法。109.其中,可选地,处理器61和存储器62通过总线63连接。110.相关说明可以对应参见图3-图9所对应的实施例中的步骤所对应的相关描述和效果进行理解,此处不做过多赘述。111.参考图13,其示出了适于用来实现本公开实施例的电子设备900的结构示意图,该电子设备900可以为终端设备或服务器。其中,终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、个人数字助理(personaldigitalassistant,简称pda)、平板电脑(portableandroiddevice,简称pad)、便携式多媒体播放器(portablemediaplayer,简称pmp)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字tv、台式计算机等等的固定终端。图13示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。112.如图13所示,电子设备900可以包括处理装置(例如中央处理器、图形处理器等)901,其可以根据存储在只读存储器(readonlymemory,简称rom)902中的程序或者从存储装置908加载到随机访问存储器(randomaccessmemory,简称ram)903中的程序而执行各种适当的动作和处理。在ram903中,还存储有电子设备900操作所需的各种程序和数据。处理装置901、rom902以及ram903通过总线904彼此相连。输入/输出(i/o)接口905也连接至总线904。113.通常,以下装置可以连接至i/o接口905:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置906;包括例如液晶显示器(liquidcrystaldisplay,简称lcd)、扬声器、振动器等的输出装置907;包括例如磁带、硬盘等的存储装置908;以及通信装置909。通信装置909可以允许电子设备900与其他设备进行无线或有线通信以交换数据。虽然图13示出了具有各种装置的电子设备900,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。114.特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置909从网络上被下载和安装,或者从存储装置908被安装,或者从rom902被安装。在该计算机程序被处理装置901执行时,执行本公开实施例的方法中限定的上述功能。115.需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。116.上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。117.上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述实施例所示的方法。118.可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(localareanetwork,简称lan)或广域网(wideareanetwork,简称wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。119.附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。120.描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。121.本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、片上系统(soc)、复杂可编程逻辑设备(cpld)等等。122.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。123.第一方面,根据本公开的一个或多个实施例,提供了一种图像生成器生成方法,包括:124.获取预设的生成式对抗网络模型,所述生成式对抗网络模型中包括第一生成器、第二生成器和判别器,所述第二生成器和所述判别器为预训练模型;针对所述第一生成器,循环执行以下步骤,直至所述第一生成器收敛为目标生成器,所述目标生成器用于生成目标视觉类别的图像:将第一样本数据分别输入所述第一生成器和所述第二生成器,得到所述第一生成器输出的第一随机图像和所述第二生成器输出的第二随机图像,其中,所述第一样本数据包括源视觉类别的无标图像;将所述第二随机图像输入所述判别器,得到所述第二随机图像对应的判别置信度,所述判别置信度表征所述第二随机图像归属于所述目标视觉类别的概率;若所述判别置信度大于置信度阈值,则基于所述第二随机图像和所述第一随机图像对所述第一生成器进行训练。125.根据本公开的一个或多个实施例,所述基于所述第二随机图像和所述第一随机图像对所述第一生成器进行训练,包括:基于知识蒸馏算法,通过所述第二随机图像和所述第一随机图像,得到所述第二生成器与所述第一生成器之间的第一蒸馏损失,其中,所述第二生成器为教师模型,所述第一生成器为学生模型,所述第二生成器是基于第一生成器进行卷积层通道扩展后得到的;根据所述第一蒸馏损失,进行梯度反向传播,调整所述第一生成器的模型参数。126.根据本公开的一个或多个实施例,所述方法还包括:将所述第一生成器输出的第一随机图像,输入所述判别器,得到所述第一随机图像对应的判别置信度;当连续n次循环中,所述第一随机图像对应的判别置信度均大于预设置信度阈值,则确定所述第一生成器收敛为所述目标生成器,其中,n为大于1的整数。127.根据本公开的一个或多个实施例,在针对所述第一生成器进行训练之前,所述方法还包括:获取第二样本数据,所述第二样本数据包括第一有标图像和对应的第二有标图像,其中,所述第一有标图像为所述源视觉类别的图像,所述第二有标图像为所述目标视觉类别的图像;基于所述第二样本数据,对所述第二生成器进行训练。128.根据本公开的一个或多个实施例,所述基于所述第二样本数据,通过所述判别器,对所述第二生成器进行训练,包括:基于所述第一有标图像,利用所述识别器,获得所述第二生成器对应的生成式对抗网络损失函数值,所述生成式对抗网络损失函数值表征所述第二生成器输出的第三随机图像的评估置信度;基于所述第一有标图像和所述第二有标图像,获得所述第二生成器对应的重建损失函数值,重建损失函数值表征所述第二生成器输出的第三随机图像与所述第二有标图像的差异度;通过所述生成式对抗网络损失函数值和所述重建损失函数值,对所述第二生成器进行梯度反向传播,调整所述第二生成器的模型参数。129.根据本公开的一个或多个实施例,基于所述第一有标图像和所述第二有标图像,获得所述第二生成器对应的重建损失函数值,包括:将所述第一有标数据输入所述第二生成器,得到第三随机图像;通过预设的重建损失函数,计算所述第三随机图像和所述第二有标图像的重建损失函数值。130.根据本公开的一个或多个实施例,在基于所述第二样本数据,对所述第二生成器进行训练之前,所述方法还包括:基于所述第二样本数据,对所述判别器进行训练。131.第二方面,根据本公开的一个或多个实施例,提供了一种图像生成方法,包括:132.获取配置信息,所述配置信息用于表征图像的视觉类别;根据所述配置信息,得到对应的目标生成器,其中,所述目标生成器是通过如上第一方面以及第一方面各种可能的设计所述的图像生成器生成方法得到的;基于所述目标生成器,生成目标视觉类别的图像。133.第三方面,根据本公开的一个或多个实施例,提供了一种图像生成器生成装置,包括:134.获取模块,用于获取预设的生成式对抗网络模型,所述生成式对抗网络模型中包括第一生成器、第二生成器和判别器,所述第二生成器和所述判别器为预训练模型;135.训练模块,用于针对所述第一生成器,循环执行以下步骤,直至所述第一生成器收敛为目标生成器,所述目标生成器用于生成目标视觉类别的图像:将第一样本数据分别输入所述第一生成器和所述第二生成器,得到所述第一生成器输出的第一随机图像和所述第二生成器输出的第二随机图像,其中,所述第一样本数据包括源视觉类别的无标图像;将所述第二随机图像输入所述判别器,得到所述第二随机图像对应的判别置信度,所述判别置信度表征所述第二随机图像归属于所述目标视觉类别的概率;若所述判别置信度大于置信度阈值,则基于所述第二随机图像和所述第一随机图像对所述第一生成器进行训练。136.第四方面,根据本公开的一个或多个实施例,提供一种图像生成装置,包括:137.获取模块,用于获取配置信息,所述配置信息用于表征图像的视觉类别;138.确定模块,用于根据所述配置信息,得到对应的目标生成器,其中,所述目标生成器是通过如上第一方面以及第一方面各种可能的设计所述的图像生成器生成方法得到的;139.生成模块,用于基于所述目标生成器,生成目标视觉类别的图像。140.第五方面,根据本公开的一个或多个实施例,提供了一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;141.所述存储器存储计算机执行指令;142.所述处理器执行所述存储器存储的计算机执行指令,以实现如上第一方面以及第一方面各种可能的设计所述的图像生成器生成方法;或者,以实现如上第二方面以及第二方面各种可能的设计所述的图像生成方法。143.第六方面,根据本公开的一个或多个实施例,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的图像生成器生成方法;或者,实现如上第二方面以及第二方面各种可能的设计所述的图像生成方法。144.第七方面,本公开实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上第一方面以及第一方面各种可能的设计所述的图像生成器生成方法;或者,实现如上第二方面以及第二方面各种可能的设计所述的图像生成方法。145.以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。146.此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。147.尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。当前第1页12当前第1页12
技术特征:
1.一种图像生成器生成方法,其特征在于,所述方法包括:获取预设的生成式对抗网络模型,所述生成式对抗网络模型中包括第一生成器、第二生成器和判别器,所述第二生成器和所述判别器为预训练模型;针对所述第一生成器,循环执行以下步骤,直至所述第一生成器收敛为目标生成器,所述目标生成器用于生成目标视觉类别的图像:将第一样本数据分别输入所述第一生成器和所述第二生成器,得到所述第一生成器输出的第一随机图像和所述第二生成器输出的第二随机图像,其中,所述第一样本数据包括源视觉类别的无标图像;将所述第二随机图像输入所述判别器,得到所述第二随机图像对应的判别置信度,所述判别置信度表征所述第二随机图像归属于所述目标视觉类别的概率;若所述判别置信度大于置信度阈值,则基于所述第二随机图像和所述第一随机图像对所述第一生成器进行训练。2.根据权利要求1所述的方法,其特征在于,所述基于所述第二随机图像和所述第一随机图像对所述第一生成器进行训练,包括:基于知识蒸馏算法,通过所述第二随机图像和所述第一随机图像,得到所述第二生成器与所述第一生成器之间的第一蒸馏损失,其中,所述第二生成器为教师模型,所述第一生成器为学生模型,所述第二生成器是基于第一生成器进行卷积层通道扩展后得到的;根据所述第一蒸馏损失,进行梯度反向传播,调整所述第一生成器的模型参数。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述第一生成器输出的第一随机图像,输入所述判别器,得到所述第一随机图像对应的判别置信度;当连续n次循环中,所述第一随机图像对应的判别置信度均大于预设置信度阈值,则确定所述第一生成器收敛为所述目标生成器,其中,n为大于1的整数。4.根据权利要求1-3任一项所述的方法,其特征在于,在针对所述第一生成器进行训练之前,所述方法还包括:获取第二样本数据,所述第二样本数据包括第一有标图像和对应的第二有标图像,其中,所述第一有标图像为所述源视觉类别的图像,所述第二有标图像为所述目标视觉类别的图像;基于所述第二样本数据,对所述第二生成器进行训练。5.根据权利要求4所述的方法,其特征在于,所述基于所述第二样本数据,通过所述判别器,对所述第二生成器进行训练,包括:基于所述第一有标图像,利用所述识别器,获得所述第二生成器对应的生成式对抗网络损失函数值,所述生成式对抗网络损失函数值表征所述第二生成器输出的第三随机图像的评估置信度;基于所述第一有标图像和所述第二有标图像,获得所述第二生成器对应的重建损失函数值,重建损失函数值表征所述第二生成器输出的第三随机图像与所述第二有标图像的差异度;通过所述生成式对抗网络损失函数值和所述重建损失函数值,对所述第二生成器进行梯度反向传播,调整所述第二生成器的模型参数。6.根据权利要求5所述的方法,其特征在于,基于所述第一有标图像和所述第二有标图像,获得所述第二生成器对应的重建损失函数值,包括:
将所述第一有标数据输入所述第二生成器,得到第三随机图像;通过预设的重建损失函数,计算所述第三随机图像和所述第二有标图像的重建损失函数值。7.根据权利要求4所述的方法,其特征在于,在基于所述第二样本数据,对所述第二生成器进行训练之前,所述方法还包括:基于所述第二样本数据,对所述判别器进行训练。8.一种图像生成方法,其特征在于,所述方法包括:获取配置信息,所述配置信息用于表征图像的视觉类别;根据所述配置信息,得到对应的目标生成器,其中,所述目标生成器是通过如权利要求1-7任一项所述的方法得到的;基于所述目标生成器,生成目标视觉类别的图像。9.一种图像生成器生成装置,其特征在于,所述装置包括:获取模块,用于获取预设的生成式对抗网络模型,所述生成式对抗网络模型中包括第一生成器、第二生成器和判别器,所述第二生成器和所述判别器为预训练模型;训练模块,用于针对所述第一生成器,循环执行以下步骤,直至所述第一生成器收敛为目标生成器,所述目标生成器用于生成目标视觉类别的图像:将第一样本数据分别输入所述第一生成器和所述第二生成器,得到所述第一生成器输出的第一随机图像和所述第二生成器输出的第二随机图像,其中,所述第一样本数据包括源视觉类别的无标图像;将所述第二随机图像输入所述判别器,得到所述第二随机图像对应的判别置信度,所述判别置信度表征所述第二随机图像归属于所述目标视觉类别的概率;若所述判别置信度大于置信度阈值,则基于所述第二随机图像和所述第一随机图像对所述第一生成器进行训练。10.一种图像生成装置,其特征在于,所述装置包括:获取模块,用于获取配置信息,所述配置信息用于表征图像的视觉类别;确定模块,用于根据所述配置信息,得到对应的目标生成器,其中,所述目标生成器是通过如权利要求1-7任一项所述的方法得到的;生成模块,用于基于所述目标生成器,生成目标视觉类别的图像。11.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1至8中任一项所述的方法。12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至8任一项所述的方法。13.一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法。
技术总结
本公开实施例提供一种图像生成器生成方法、图像生成方法、装置及电子设备,通过获取预设的生成式对抗网络模型,针对第一生成器,循环执行以下步骤,直至第一生成器收敛为目标生成器,目标生成器用于生成目标视觉类别的图像:将第一样本数据分别输入第一生成器和第二生成器,得到第一生成器输出的第一随机图像和第二生成器输出的第二随机图像,其中,第一样本数据包括源视觉类别的无标图像;将第二随机图像输入判别器,得到第二随机图像对应的判别置信度,判别置信度表征第二随机图像归属于目标视觉类别的概率;若判别置信度大于置信度阈值,则基于第二随机图像和第一随机图像对第一生成器进行训练,提高了模型训练效果。提高了模型训练效果。提高了模型训练效果。
技术研发人员:吴捷
受保护的技术使用者:北京字跳网络技术有限公司
技术研发日:2022.03.21
技术公布日:2023/10/6
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/