信息处理装置、信息处理方法和机器可读存储介质与流程

未命名 07-27 阅读：55 评论：0

1.本公开涉及信息处理的技术领域，具体地涉及用于无监督领域自适应的信息处理装置、信息处理方法和机器可读存储介质。

背景技术：

2.这个部分提供了与本公开有关的背景信息，这不一定是现有技术。
3.图1示出了几种机器学习方法的比较，其中，横轴是标注成本，纵轴是模型性能。如图1所示，传统的有监督学习虽然性能高，但是需要对目标域数据集进行大量人工标注，成本很高。为了减少标注成本，无监督领域自适应(unsupervised domain adaptation，uda)学习成为了当前热门的研究方向。无监督领域自适应学习包含两个具有相同任务的子数据集：带标注的源域数据集以及无标注的目标域数据集。无监督领域自适应学习的目标是利用有标注的源域数据集提升模型在目标域数据集上的性能，从而减少在目标域数据集上的标注成本。
4.uda已经在很多领域被广泛应用，例如手写体识别、图像分类、图像分割以及目标检测等。然而，现在的无监督领域自适应技术都是基于离线训练，但是离线uda具有以下限制：需要预先收集到大量的目标域数据集，从而冷启动的能力弱；需要较长时间完成模型的训练；对数据变化不敏感，在数据变化时，需要重新训练模型，从而导致开销较大。
5.因此，离线训练的方式并不能满足大多数实际应用的需求，尤其是在实时系统中。在现实应用中，用户通常以实时数据流的形式进行数据收集，并希望以在线的形式对模型进行实时的更新，即基于小批次的目标域数据完成模型的实时更新。因此，本技术将讨论在线无监督领域自适应技术(online unsupervised domain adaptation，ouda)，即基于实时数据流的模型无监督在线实时更新。

技术实现要素：

6.这个部分提供了本公开的一般概要，而不是其全部范围或其全部特征的全面披露。
7.本公开的目的在于提供一种用于在线无监督领域自适应的信息处理装置、信息处理方法和机器可读存储介质。
8.根据本公开的一方面，提供了一种用于在线无监督领域自适应的信息处理装置，包括：特征生成单元，其被配置成针对输入分布生成特征；差异生成单元，其被配置成生成在预定阶段训练好的特征生成单元与当前阶段被训练的特征生成单元针对相同的特定输入分布的输出特征差异；以及更新单元，其被配置成基于输出特征差异使用当前阶段被训练的特征生成单元针对当前阶段在线更新的输入分布的输出特征来训练当前阶段的特征生成单元。
9.根据本公开的另一方面，提供了一种用于在线无监督领域自适应的信息处理方法，包括：生成在预定阶段训练好的特征生成单元与当前阶段被训练的特征生成单元针对
相同的特定输入分布的输出特征差异；以及基于输出特征差异使用当前阶段被训练的特征生成单元针对当前阶段在线更新的输入分布的输出特征来训练当前阶段的特征生成单元。
10.根据本公开的另一方面，提供了一种机器可读存储介质，其上携带有包括存储在其中的机器可读指令代码的程序产品，其中，所述指令代码当由计算机读取和执行时，能够使所述计算机执行根据本公开的信息处理方法。
11.使用根据本公开的信息处理装置、信息处理方法和机器可读存储介质，可以利用特征生成单元对相同输入分布的输出特征差异来训练特征生成单元，从而有效地解决在线无监督领域自适应中的遗忘问题。
12.从在此提供的描述中，进一步的适用性区域将会变得明显。这个概要中的描述和特定例子只是为了示意的目的，而不旨在限制本公开的范围。
附图说明
13.在此描述的附图只是为了所选实施例的示意的目的而非全部可能的实施，并且不旨在限制本公开的范围。在附图中：
14.图1图示了对几种机器学习方法的比较；
15.图2为图示根据本公开的ouda的原理的示意图；
16.图3为图示根据本公开的实施例的信息处理装置的结构的框图；
17.图4为图示根据本公开的另一实施例的信息处理装置的结构的框图；
18.图5为图示根据本公开的另一实施例的信息处理装置的原理的示意图；
19.图6为图示根据本公开的实施例的信息处理装置的效果图；
20.图7为图示根据本公开的实施例的信息处理装置的抵抗遗忘的效果图；
21.图8为图示根据本公开的实施例的信息处理方法的流程图；
22.图9为图示根据本公开的另一实施例的信息处理方法的流程图；以及
23.图10为其中可以实现根据本公开的实施例的信息处理装置和方法的通用个人计算机的示例性结构的框图。
24.虽然本公开容易经受各种修改和替换形式，但是其特定实施例已作为例子在附图中示出，并且在此详细描述。然而应当理解的是，在此对特定实施例的描述并不打算将本公开限制到公开的具体形式，而是相反地，本公开目的是要覆盖落在本公开的精神和范围之内的所有修改、等效和替换。要注意的是，贯穿几个附图，相应的标号指示相应的部件。
具体实施方式
25.现在参考附图来更加充分地描述本公开的例子。以下描述实质上只是示例性的，而不旨在限制本公开、应用或用途。
26.提供了示例实施例，以便本公开将会变得详尽，并且将会向本领域技术人员充分地传达其范围。阐述了众多的特定细节如特定部件、装置和方法的例子，以提供对本公开的实施例的详尽理解。对于本领域技术人员而言将会明显的是，不需要使用特定的细节，示例实施例可以用许多不同的形式来实施，它们都不应当被解释为限制本公开的范围。在某些示例实施例中，没有详细地描述众所周知的过程、众所周知的结构和众所周知的技术。
27.与uda一样，ouda包含两个具有相同任务的子数据集：带标注的源域数据集以及无
标注的目标域数据集。ouda的目标是利用有标注的源域数据集提升模型在在线更新的目标域数据集上的性能，从而减少在目标域数据集上的标注成本并且实现模型的实时更新。ouda由连续的学习阶段组成。对于每个阶段，算法都会继承上一阶段生成的模型，并使用当前得到的未标记的目标域数据集更新模型。ouda的一个关键挑战是将新知识与旧知识联系起来，即在抵制遗忘的同时学习。
28.为了便于理解，作为示例，ouda的任务可以是区分床、椅子、自行车和叉子四类对象。源域数据集可以是关于床、椅子、自行车和叉子的实际生活场景的图像，而目标域数据集可以是关于床、椅子、自行车和叉子的卡通风格的图像。由于源域数据集具有标注，因此可以针对源域数据集得到性能很好的源模型。但是，目标域数据集是不具有标注的，而且由于目标域数据集的数据集风格与源域数据集风格不一样，因此源模型对于目标域数据集也不是有效可用的，ouda期望通过将知识从有标签的源域数据集迁移到无标签的目标域数据集来改进目标域数据集的性能。
29.在ouda中，假设以小批次依次得到目标域数据集，每次只针对小批次的目标域数据集来迁移模型，这样每次训练时间相对较短，从而能够实现以在线的形式对模型进行实时的更新。在此，小批次可以表示包括几个到几十个数据样本的数据集。并且，本文中的模型是指特征生成器(以下也称为特征生成单元)的模型。此外，本文中的ouda采用神经网络来实现。
30.《ouda中的遗忘问题》
31.与离线学习不同，模型的在线更新会带来严重的遗忘问题，即基于新收集的目标域数据进行的模型更新会降低模型在之前目标域数据上的性能表现，从而导致较差的泛化性能及模型训练不收敛。首先，参考图6来简单描述遗忘问题。
32.在图6中，横轴表示在线训练中的阶段数(即分批次增加目标域数据集的批次数)，纵轴表示当前阶段的整个目标域的分类精度。在图6的示例中，每个阶段获得36个目标样本。此外，圆点表示经典无监督领域自适应算法dann和cdan在在线训练中的性能表现，向上的三角形表示两者在加入了根据本技术的损失函数后的性能表现，而向下的三角形表示直接将source-only(仅有源域)模型应用于目标域时的性能表现。该实验基于office-31数据集。office-31是一个广泛应用于迁移学习算法评估的公开数据集。如图6的圆点连线所示，dann和cdan在该任务中在目标域的性能上出现很大的波动，出现灾难性遗忘，即泛化和收敛性差，因此传统的离线训练方法并不能适用于在线学习任务中。
33.《用于测量遗忘的度量》
34.在本技术中，提出对在线无监督领域自适应中的遗忘问题进行建模，并提出用于测量遗忘的度量即输出特征差异。该度量主要是用于评估在连续的在线学习中，不同阶段模型对于同一个输入分布的输出分布差异。如果该差异较小，则说明不同阶段模型具有很好的抵抗遗忘的性能，如果该差异较大，则说明该方法具有较强的遗忘性。为了抵抗遗忘，需要对模型的更新进行更多的约束。
35.可以将特征生成器g对同一个输入分布的输出特征差异表示为：
[0036][0037]
在式(1)中，g1和g2分别表示不同阶段训练的特征生成器的模型，x表示输入分布
中的数据，g1(x)和g2(x)分别表示g1和g2针对数据x的输出特征，和分别表示g1(x)和g2(x)的分布，表示求两个特征生成器在任意共同输入分布上输出分布差异的上确界。
[0038]
为了最小化当前阶段的模型与当前阶段之前的模型的输出特征差异，可以通过尽可能宽的公共输入分布来最小化两模型之间的特征移动。例如，由于目标域数据集用于获取新知识，因此可以考虑对性能稳定的源域特征施加约束，以减少输出特征差异。在这种情况下，约束不会削弱模型对目标域的学习能力。如图2所示，与图1中的uda的构架相比，根据本技术的ouda可以利用源模型来对当前阶段的当前模型施加约束，以抵制遗忘。
[0039]
《信息处理装置的原理和结构》
[0040]
下面参考图3来说明根据本技术的信息处理装置的结构。如图3所示，根据本技术的信息处理装置100可以包括特征生成单元110、差异生成单元120和更新单元130。
[0041]
特征生成单元110可以针对输入分布生成对应特征。
[0042]
进一步，差异生成单元120可以生成在预定阶段训练好的特征生成单元与当前阶段被训练的特征生成单元针对相同的特定输入分布的输出特征差异，并且将得到的输出特征差异提供给更新单元130。
[0043]
特别地，相同的特定输入分布是相同的具有标注的源域数据集。在预定阶段训练好的特征生成单元是在输入分布只有源域数据集的情况下训练好的特征生成单元，并且当前阶段被训练的特征生成单元是在输入分布在源域数据集的基础上分阶段增加不具有标注的目标域数据集的情况下被训练的特征生成单元，其中，当前阶段是增加目标域数据集的多个阶段中的任一阶段。
[0044]
进一步，更新单元130可以基于差异生成单元120生成的输出特征差异，使用当前阶段被训练的特征生成单元针对当前阶段在线更新的输入分布的输出特征来训练当前阶段的特征生成单元。
[0045]
由此，根据本技术的信息处理装置100可以利用特征生成单元对相同输入分布的输出特征差异来训练特征生成单元，从而有效地解决ouda中的遗忘问题。
[0046]
下面结合图4和图5来描述根据本技术的另一实施例的信息处理装置200的结构和原理。
[0047]
如上所述，为了解决在线学习中的遗忘难题，需要尽可能降低输出特征差异同时保留模型对目标域数据集的学习能力，由此本技术提出源域特征蒸馏(source feature distillation,sfd)。sfd利用额外的源模型(基于源域数据训练得到的收敛模型)对目标模型进行约束，从而学习到不会被遗忘的源域特征。sfd并不对目标域数据特征的记忆性进行约束，因而可以最大限度的保留模型对目标域数据的学习能力。
[0048]
如图4所述，信息处理装置200可以包括特征生成单元210、差异生成单元220、更新单元230和损失函数生成单元240，其中更新单元230可以包括训练单元2301、分类单元2302和域判别单元2303。特征生成单元210、差异生成单元220和更新单元230对应于图3中的特征生成单元110、差异生成单元120和更新单元130。
[0049]
特征生成单元210可以针对输入分布生成对应特征。
[0050]
进一步，差异生成单元220可以生成在预定阶段训练好的特征生成单元与当前阶
段被训练的特征生成单元针对相同的特定输入分布的输出特征差异。
[0051]
特别地，相同的特定输入分布是相同的具有标注的源域数据集。在预定阶段训练好的特征生成单元是在输入分布只有源域数据集的情况下训练好的特征生成单元，并且当前阶段被训练的特征生成单元是在输入分布在源域数据集的基础上分阶段增加不具有标注的目标域数据集的情况下被训练的特征生成单元，其中，当前阶段是增加目标域数据集的多个阶段中的任一阶段。
[0052]
进一步，损失函数生成单元240可以生成用于表示输出特征差异的损失函数，并且提供给更新单元230。需要注意的是，也可以将差异生成单元220和损失函数生成单元240合并，也就是说可以直接生成表示输出特征差异的损失函数。
[0053]
作为示例，损失函数是当前阶段的特征生成单元针对源域数据集的输出特征与在输入分布只有源域数据集的情况下的特征生成单元针对源域数据集的输出特征的损失函数。
[0054]
作为另一示例，损失函数是当前阶段的特征生成单元针对源域数据集的输出特征与当前阶段之前的各个阶段的特征生成单元针对源域数据集的输出特征的损失函数之和。
[0055]
此外，上面所述的损失函数可以是任意距离损失函数，例如l2距离损失函数、l1距离损失函数、cosine距离损失函数等。
[0056]
进一步，更新单元230可以基于损失函数使用当前阶段被训练的特征生成单元针对当前阶段在线更新的输入分布的输出特征来训练当前阶段的特征生成单元。
[0057]
具体地，更新单元230中的训练单元2301可以基于损失函数使用对当前阶段的特征生成单元针对当前阶段的输入分布的输出特征的分析结果来训练当前阶段的特征生成单元，以实时更新特征生成单元。
[0058]
更新单元230中的分类单元2302可以基于当前阶段的特征生成单元针对当前阶段的输入分布的输出特征对当前阶段的输入分布中的对象进行分类，并且将分类结果提供给训练单元2301以用于训练特征生成单元。
[0059]
更新单元230中的域判别单元2303可以基于当前阶段的特征生成单元针对当前阶段的输入分布的输出特征对当前阶段的输入分布是属于源域还是目标域进行分类，并且将分类结果提供给训练单元2301以用于训练特征生成单元。
[0060]
此外，如图4所示，图4中的域判别单元2303由虚线框表示，这意指域判别单元2303不是必须的。替代域判别单元2303或者除了域判别单元2303以外，更新单元230还可以具有用于分析源域与目标域的混合状况的另外单元。
[0061]
下面结合图5来更详细地描述图4中的信息处理装置200的处理。图5为图示根据本公开的另一实施例的信息处理装置的原理的示意图。为了方便描述，在图5中省略了信息处理装置200的一些单元。在图5中，x表示输入分布中的数据(其中xs表示源域的数据，x
t
表示当前阶段t的目标域的数据，t为大于等于1的自然数)，g
t
表示当前阶段t要学习的特征生成单元(的模型)，g0是仅有源域数据集时的特征生成单元(的模型)，z表示由特征生成单元生成的输出特征空间。
[0062]
由于只有源域的数据集是具有标签的，因此分类单元2302依据源域的输出特征来对源域的数据集(例如图像)中的对象进行分类，然后将分类结果提供给训练单元2301。训练单元2301可以依据源域的数据集的真实标签和分类单元的2302的分类结果来对特征生
成单元进行训练。
[0063]
此外，训练单元2301还可以依据域判别单元2303对源域和目标域的判别结果来对特征生成单元进行训练，使得源域和目标域可以混合在一起，不容易被区别出来。也就是说，训练单元2301旨在得到领域不变特征，即对源域和目标域都有效的特征。
[0064]
作为示例，假设任务是区分猫和狗，并且源域中的图像是关于真实场景中的猫、狗的图像，而目标域中的图像是关于卡通风格的猫、狗的图像。例如，在只有源域数据集的情况下的特征生成单元可能学习到利用颜色(为了方便描述，作为示例)来区分猫和狗，但是在增加目标域数据集后，颜色可能变得不那么好用了，特征生成单元可能会学习到利用猫和狗的腿长(为了方便描述，作为示例)可以更好地区分源域和目标域中的猫和狗。因此，在该示例中，训练单元2301可能学习到的领域不变特征是猫和狗的腿长。
[0065]
下面将描述图5中为了解决ouda的遗忘问题而对性能稳定的源域特征应用的约束即损失函数损失函数可以通过图4中的损失函数生成单元240得到。
[0066]
可以将ouda在当前阶段t的总损失表示为：
[0067][0068]
在式(2)中，表示uda的损失函数，而表示源域的数据蒸馏损失函数，α表示用于平衡和的系数。
[0069]
其中，可以表示为：
[0070][0071]
在式(3)中，g
t
是当前阶段t要学习的特征生成单元(的模型)，gi是当前阶段之前的先前阶段i中的特征生成单元(的模型)，i∈t-1，符号表示求和，符号表示a与b的损失函数，而ds表示源域的数据集(数据分布)。
[0072]
为了简化的计算，可以使用仅有源域的模型作为初始化模型并且将重新表示为：
[0073][0074]
在此，需要注意的是，损失函数可以是任何距离损失函数，例如l2距离损失函数、l1距离损失函数、cosine距离损失函数等。
[0075]
作为示例，在损失函数为l2距离损失函数的情况下，可以得到：
[0076][0077]
由上面的的公式可见，损失函数表征了当前阶段t的特征生成单元的当前模型与源模型之间的输出特征差异。
[0078]
再次参考图6，从图6中的向上的三角形的连线可以看出，与圆点连线表示的未应用sfd的情况相比，ouda的遗忘问题得到了很好的改善。
[0079]
此外，如图5所示，本技术所提出的sfd可以看作是一种插件方法。值得注意的是，所提出的sfd与域对抗训练方法并没有紧密结合。因此，sfd可以应用于学习领域不变特征
的任何ouda方法，即在两个域中引入相似分布的单个特征生成器。这也可以从图6中看出来，不论是对于cdan还是dann，sfd都可以解决ouda的遗忘问题。
[0080]
图7为图示根据本公开的实施例的信息处理装置的抵抗遗忘的效果图。图7的横轴表示阶段数，纵轴表示在目标域上的平均遗忘度，纵轴数值越高，则遗忘度越高。图7中的抵抗遗忘的实验采用了三种基准算法：dann、cdan和mcc。浅灰色为无sfd的情况下的实验结果，而深灰色为有sfd的情况下的实验结果。从实验结果可以看出，在目标域，通过采用sfd可以降低大约70％的遗忘。
[0081]
由此，根据本公开的另一实施例的信息处理装置200可以通过使用基于sfd的损失函数来尽可能降低输出特征差异同时保留模型对目标域数据集的学习能力，从而解决ouda的遗忘问题并且有效提升模型在在线学习中的泛化性和收敛性。
[0082]
《信息处理方法》
[0083]
下面结合图8来描述根据本公开的实施例的信息处理方法。
[0084]
如图8所示，根据本公开的实施例的信息处理方法开始于步骤s110。在步骤s110中，生成在预定阶段训练好的特征生成单元与当前阶段被训练的特征生成单元针对相同的特定输入分布的输出特征差异。
[0085]
特别地，相同的特定输入分布属是相同的具有标注的源域数据集。在预定阶段训练好的特征生成单元是在输入分布只有源域数据集的情况下训练好的特征生成单元，并且在当前阶段被训练的特征生成单元是在输入分布在源域数据集的基础上分阶段增加不具有标注的目标域数据集的情况下被训练的特征生成单元，其中，当前阶段是增加目标域数据集的多个阶段中的任一阶段。
[0086]
接下来，在步骤s120中，基于输出特征差异使用当前阶段被训练的特征生成单元针对当前阶段在线更新的输入分布的输出特征来训练当前阶段的特征生成单元。在这之后，过程结束。
[0087]
由此，根据本公开的实施例的信息处理方法可以利用特征生成单元对相同输入分布的输出特征差异来训练特征生成单元，从而有效地降低ouda中的遗忘问题。
[0088]
下面结合图9来描述根据本公开的另一实施例的信息处理方法。
[0089]
如图9所示，根据本公开的实施例的信息处理方法开始于步骤s210。在步骤s210中，生成用于表示输出特征差异的损失函数。在此，输出特征差异是在预定阶段训练好的特征生成单元与当前阶段被训练的特征生成单元针对相同的特定输入分布的输出特征差异。
[0090]
特别地，相同的特定输入分布属是相同的具有标注的源域数据集。在预定阶段训练好的特征生成单元是在输入分布只有源域数据集的情况下训练好的特征生成单元，并且在当前阶段被训练的特征生成单元是在输入分布在源域数据集的基础上分阶段增加不具有标注的目标域数据集的情况下被训练的特征生成单元，其中，当前阶段是增加目标域数据集的多个阶段中的任一阶段。
[0091]
作为示例，损失函数是当前阶段的特征生成单元针对源域数据集的输出特征与在输入分布只有源域数据集的情况下的特征生成单元针对源域数据集的输出特征的损失函数。
[0092]
作为另一示例，损失函数是当前阶段的特征生成单元针对源域数据集的输出特征与当前阶段之前的各个阶段的特征生成单元针对源域数据集的输出特征的损失函数之和。
[0093]
此外，上面所述的损失函数可以是任意距离损失函数，例如l2距离损失函数、l1距离损失函数、cosine距离损失函数等。
[0094]
接下来，在步骤s220中，基于当前阶段的特征生成单元针对当前阶段的输入分布的输出特征对当前阶段的输入分布中的对象进行分类。
[0095]
接下来，在步骤s230中，基于当前阶段的特征生成单元针对当前阶段的输入分布的输出特征对当前阶段的输入分布是属于源域还是目标域进行分类。
[0096]
接下来，在步骤s240中，基于损失函数使用分类结果来训练当前阶段的特征生成单元。在这之后，过程结束。
[0097]
由此，根据本公开的实施例的信息处理方法可以通过使用基于源域特征蒸馏的损失函数来尽可能降低输出特征差异同时保留模型对目标域数据集的学习能力，从而解决ouda的遗忘问题并且有效提升模型在在线学习中的泛化性和收敛性。
[0098]
根据本公开的实施例的信息处理方法的上述步骤的各种具体实施方式前面已经作过详细描述，在此不再重复说明。
[0099]
显然，根据本公开的信息处理方法的各个操作过程可以以存储在各种机器可读的存储介质中的计算机可执行程序的方式实现。
[0100]
而且，本公开的目的也可以通过下述方式实现：将存储有上述可执行程序代码的存储介质直接或者间接地提供给系统或设备，并且该系统或设备中的计算机或者中央处理单元(cpu)读出并执行上述程序代码。此时，只要该系统或者设备具有执行程序的功能，则本公开的实施方式不局限于程序，并且该程序也可以是任意的形式，例如，目标程序、解释器执行的程序或者提供给操作系统的脚本程序等。
[0101]
上述这些机器可读存储介质包括但不限于：各种存储器和存储单元，半导体设备，磁盘单元例如光、磁和磁光盘，以及其它适于存储信息的介质等。
[0102]
另外，计算机通过连接到因特网上的相应网站，并且将依据本公开的计算机程序代码下载和安装到计算机中然后执行该程序，也可以实现本公开的技术方案。
[0103]
图10为其中可以实现根据本公开的实施例的信息处理装置和方法的通用个人计算机的示例性结构的框图。
[0104]
如图10所示，cpu 1301根据只读存储器(rom)1302中存储的程序或从存储部分1308加载到随机存取存储器(ram)1303的程序执行各种处理。在ram 1303中，也根据需要存储当cpu 1301执行各种处理等等时所需的数据。cpu 1301、rom 1302和ram 1303经由总线1304彼此连接。输入/输出接口1305也连接到总线1304。
[0105]
下述部件连接到输入/输出接口1305：输入部分1306(包括键盘、鼠标等等)、输出部分1307(包括显示器，比如阴极射线管(crt)、液晶显示器(lcd)等，以及扬声器等)、存储部分1308(包括硬盘等)、通信部分1309(包括网络接口卡比如lan卡、调制解调器等)。通信部分1309经由网络比如因特网执行通信处理。根据需要，驱动器1310也可连接到输入/输出接口1305。可拆卸介质1311比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器1310上，使得从中读出的计算机程序根据需要被安装到存储部分1308中。
[0106]
在通过软件实现上述系列处理的情况下，从网络比如因特网或存储介质比如可拆卸介质1311安装构成软件的程序。
[0107]
本领域的技术人员应当理解，这种存储介质不局限于图10所示的其中存储有程
序、与设备相分离地分发以向用户提供程序的可拆卸介质1311。可拆卸介质1311的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(cd-rom)和数字通用盘(dvd))、磁光盘(包含迷你盘(md)(注册商标))和半导体存储器。或者，存储介质可以是rom 1302、存储部分1308中包含的硬盘等等，其中存有程序，并且与包含它们的设备一起被分发给用户。
[0108]
在本公开的系统和方法中，显然，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。并且，执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行，但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
[0109]
以上虽然结合附图详细描述了本公开的实施例，但是应当明白，上面所描述的实施方式只是用于说明本公开，而并不构成对本公开的限制。对于本领域的技术人员来说，可以对上述实施方式作出各种修改和变更而没有背离本公开的实质和范围。因此，本公开的范围仅由所附的权利要求及其等效含义来限定。
[0110]
关于包括以上实施例的实施方式，还公开下述的附记：
[0111]
附记1.一种用于在线无监督领域自适应的信息处理装置，包括：
[0112]
特征生成单元，其被配置成针对输入分布生成特征；
[0113]
差异生成单元，其被配置成生成在预定阶段训练好的特征生成单元与当前阶段被训练的特征生成单元针对相同的特定输入分布的输出特征差异；以及
[0114]
更新单元，其被配置成基于所述输出特征差异使用当前阶段被训练的特征生成单元针对当前阶段在线更新的输入分布的输出特征来训练当前阶段的特征生成单元。
[0115]
附记2.根据附记1所述的信息处理装置，其中，
[0116]
所述相同的特定输入分布是相同的具有标注的源域数据集。
[0117]
附记3.根据附记2所述的信息处理装置，其中，
[0118]
在预定阶段训练好的特征生成单元是在输入分布只有所述源域数据集的情况下训练好的特征生成单元，并且
[0119]
当前阶段被训练的特征生成单元是在所述输入分布在所述源域数据集的基础上分阶段增加不具有标注的目标域数据集的情况下被训练的特征生成单元，其中，所述当前阶段是增加目标域数据集的多个阶段中的任一阶段。
[0120]
附记4.根据附记2所述的信息处理装置，还包括：
[0121]
损失函数生成单元，其被配置成生成用于表示所述输出特征差异的损失函数。
[0122]
附记5.根据附记4所述的信息处理装置，其中，
[0123]
所述损失函数是当前阶段的特征生成单元针对所述源域数据集的输出特征与在输入分布只有源域数据集的情况下的特征生成单元针对所述源域数据集的输出特征的损失函数。
[0124]
附记6.根据附记5所述的信息处理装置，其中，
[0125]
所述损失函数为距离损失函数。
[0126]
附记7.根据附记4所述的信息处理装置，其中，
[0127]
所述损失函数是当前阶段的特征生成单元针对所述源域数据集的输出特征与当前阶段之前的各个阶段的特征生成单元针对所述源域数据集的输出特征的损失函数之和。
[0128]
附记8.根据附记4至7中任一项所述的信息处理装置，其中，
[0129]
所述更新单元包括训练单元，所述训练单元被配置成基于所述损失函数使用对当前阶段的特征生成单元针对当前阶段的输入分布的输出特征的分析结果来训练当前阶段的特征生成单元，以实时更新所述特征生成单元。
[0130]
附记9.根据附记8所述的信息处理装置，其中，
[0131]
所述更新单元还包括：分类单元，其基于当前阶段的特征生成单元针对当前阶段的输入分布的输出特征对当前阶段的输入分布中的对象进行分类，并且将分类结果提供给所述训练单元以用于训练所述特征生成单元。
[0132]
附记10.根据附记9所述的信息处理装置，其中，
[0133]
所述更新单元还包括：域判别单元，其基于当前阶段的特征生成单元针对当前阶段的输入分布的输出特征对当前阶段的输入分布是属于源域还是目标域进行分类，并且将分类结果提供给所述训练单元以用于训练所述特征生成单元。
[0134]
附记11.根据附记6所述的信息处理装置，其中，
[0135]
所述距离损失函数是l2距离损失函数、l1距离损失函数和cosine距离损失函数中之一。
[0136]
附记12.一种用于在线无监督领域自适应的信息处理方法，包括：
[0137]
生成在预定阶段训练好的特征生成单元与当前阶段被训练的特征生成单元针对相同的特定输入分布的输出特征差异；以及
[0138]
基于所述输出特征差异使用当前阶段被训练的特征生成单元针对当前阶段在线更新的输入分布的输出特征来训练当前阶段的特征生成单元。
[0139]
附记13.根据附记12所述的信息处理方法，其中，
[0140]
所述相同的特定输入分布是相同的具有标注的源域数据集。
[0141]
附记14.根据附记13所述的信息处理方法，其中，
[0142]
在预定阶段训练好的特征生成单元是在输入分布只有所述源域数据集的情况下训练好的特征生成单元，并且
[0143]
当前阶段被训练的特征生成单元是在所述输入分布在所述源域数据集的基础上分阶段增加不具有标注的目标域数据集的情况下被训练的特征生成单元，其中，所述当前阶段是增加目标域数据集的多个阶段中的任一阶段。
[0144]
附记15.根据附记13所述的信息处理方法，还包括：
[0145]
生成用于表示所述输出特征差异的损失函数。
[0146]
附记16.根据附记15所述的信息处理方法，其中，
[0147]
所述损失函数是当前阶段的特征生成单元针对所述源域数据集的输出特征与在输入分布只有源域数据集的情况下的特征生成单元针对所述源域数据集的输出特征的损失函数。
[0148]
附记17.根据附记16所述的信息处理方法，其中，
[0149]
所述损失函数为距离损失函数。
[0150]
附记18.根据附记15所述的信息处理方法，其中，
[0151]
所述损失函数是当前阶段的特征生成单元针对所述源域数据集的输出特征与当前阶段之前的各个阶段的特征生成单元针对所述源域数据集的输出特征的损失函数之和。
[0152]
附记19.根据附记15至18中任一项所述的信息处理方法，其中，
[0153]
训练所述当前阶段的特征生成单元包括：基于所述损失函数使用对当前阶段的特征生成单元针对当前阶段的输入分布的输出特征的分析结果来训练所述当前阶段的特征生成单元，以实时更新所述特征生成单元。
[0154]
附记20.一种机器可读存储介质，其上携带有包括存储在其中的机器可读指令代码的程序产品，其中，所述指令代码当由计算机读取和执行时，能够使所述计算机执行根据附记12-19所述的信息处理方法。

技术特征：
1.一种用于在线无监督领域自适应的信息处理装置，包括：特征生成单元，其被配置成针对输入分布生成特征；差异生成单元，其被配置成生成在预定阶段训练好的特征生成单元与当前阶段被训练的特征生成单元针对相同的特定输入分布的输出特征差异；以及更新单元，其被配置成基于所述输出特征差异使用当前阶段被训练的特征生成单元针对当前阶段在线更新的输入分布的输出特征来训练当前阶段的特征生成单元。2.根据权利要求1所述的信息处理装置，其中，所述相同的特定输入分布是相同的具有标注的源域数据集。3.根据权利要求2所述的信息处理装置，其中，在预定阶段训练好的特征生成单元是在输入分布只有所述源域数据集的情况下训练好的特征生成单元，并且当前阶段被训练的特征生成单元是在所述输入分布在所述源域数据集的基础上分阶段增加不具有标注的目标域数据集的情况下被训练的特征生成单元，其中，所述当前阶段是增加目标域数据集的多个阶段中的任一阶段。4.根据权利要求2所述的信息处理装置，还包括：损失函数生成单元，其被配置成生成用于表示所述输出特征差异的损失函数。5.根据权利要求4所述的信息处理装置，其中，所述损失函数是当前阶段的特征生成单元针对所述源域数据集的输出特征与在输入分布只有源域数据集的情况下的特征生成单元针对所述源域数据集的输出特征的损失函数。6.根据权利要求5所述的信息处理装置，其中，所述损失函数为距离损失函数。7.根据权利要求4所述的信息处理装置，其中，所述损失函数是当前阶段的特征生成单元针对所述源域数据集的输出特征与当前阶段之前的各个阶段的特征生成单元针对所述源域数据集的输出特征的损失函数之和。8.根据权利要求4至7中任一项所述的信息处理装置，其中，所述更新单元包括训练单元，所述训练单元被配置成基于所述损失函数使用对当前阶段的特征生成单元针对当前阶段的输入分布的输出特征的分析结果来训练当前阶段的特征生成单元，以实时更新所述特征生成单元。9.一种用于在线无监督领域自适应的信息处理方法，包括：生成在预定阶段训练好的特征生成单元与当前阶段被训练的特征生成单元针对相同的特定输入分布的输出特征差异；以及基于所述输出特征差异使用当前阶段被训练的特征生成单元针对当前阶段在线更新的输入分布的输出特征来训练当前阶段的特征生成单元。10.一种机器可读存储介质，其上携带有包括存储在其中的机器可读指令代码的程序产品，其中，所述指令代码当由计算机读取和执行时，能够使所述计算机执行根据权利要求9所述的信息处理方法。

技术总结
本公开涉及信息处理装置、信息处理方法和机器可读存储介质。信息处理装置包括：特征生成单元，其被配置成针对输入分布生成特征；差异生成单元，其被配置成生成在预定阶段训练好的特征生成单元与当前阶段被训练的特征生成单元针对相同的特定输入分布的输出特征差异；以及更新单元，其被配置成基于输出特征差异使用当前阶段被训练的特征生成单元针对当前阶段在线更新的输入分布的输出特征来训练当前阶段的特征生成单元。该信息处理装置可以利用特征生成单元对相同输入分布的输出特征差异来训练特征生成单元，从而有效地解决在线无监督领域自适应中的遗忘问题。督领域自适应中的遗忘问题。督领域自适应中的遗忘问题。

技术研发人员：冯成钟朝亮汪洁张颖孙俊
受保护的技术使用者：富士通株式会社
技术研发日：2022.01.13
技术公布日：2023/7/26

版权声明

本文仅代表作者观点，不代表航家之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

上一篇：一种基于工业互联网标识的处理方法及装置与流程 下一篇：成熟作品的评估方法、系统及其移动终端与流程

信息处理装置、信息处理方法和机器可读存储介质与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

信息处理装置、信息处理方法和机器可读存储介质与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表