一种基于异质图神经网络的数据处理方法及装置与流程
未命名
08-23
阅读:168
评论:0
1.本技术涉及人工智能技术领域,尤其涉及一种基于异质图神经网络的数据处理方法及装置。
背景技术:
2.现有的异质图神经网络虽然在许多应用中得到广泛使用,但其还面临着对抗攻击问题,导致其在鲁棒性方面存在着许多不足。
技术实现要素:
3.本技术的实施例提供一种基于异质图神经网络的数据处理方法及装置,使异质图神经网络可以对抗攻击,具有较好的鲁棒性。
4.第一方面,本技术实施例提供了一种基于异质图神经网络的数据处理方法,包括:获取目标业务的异质图信息,异质图包括多个节点和表征多个节点连接关系的连接边,多个节点中包括多种类型的节点,多个节点中不同类型的节点表示目标业务的业务数据中不同类型的对象;基于多条元路径,确定各条元路径对应的目标节点的邻居节点;基于各条所述元路径对应的目标节点与目标节点的各个所述邻居节点的转移概率,以及目标节点与目标节点的各个所述邻居节点的相似性,确定各条元路径对应的目标节点的各个邻居节点的置信度;将置信度达标的各条元路径对应的目标节点的邻居节点进行聚合,确定各条元路径对应的目标节点的节点级嵌入表示;将各条元路径对应的目标节点的节点级嵌入表示进行聚合,确定目标节点的语义级嵌入表示,语义级嵌入表示用于实现目标业务的预测任务。
5.示例性的,目标业务可以是研究领域中论文与作者关系预测业务、电子商务领域中为用户推荐商品业务、金融领域中欺诈用户检测业务等。
6.本技术实施例提供的基于异质图神经网络的数据处理方法,通过目标节点到其每个邻居节点的转移概率和目标节点和其各个邻居节点的相似性作为判据,判断目标节点的各个邻居节点的置信度,过滤掉置信度不达标的邻居节点(不达标的邻居节点为攻击节点),以获得真实有效的邻居节点,增加了异质图神经网络的对抗攻击能力,提高了异质图神经网络的鲁棒性。
7.在一个可能的实现中,上述基于各条元路径对应的所述目标节点与目标节点的各个邻居节点的转移概率,以及目标节点与目标节点的各个所述邻居节点的相似性,确定各条元路径对应的目标节点的各个邻居节点的置信度,包括:基于各条所述元路径对应的所述目标节点与目标节点的各个所述邻居节点的转移概率,确定各条元路径对应的目标节点的各个邻居节点的先验置信度;基于各条元路径对应的目标节点的各个邻居节点的先验置信度和目标节点与目标节点的各个邻居节点的相似性,确定各条元路径对应的目标节点的各个邻居节点的置信度。
8.在一个可能的实现中,各条元路径对应的目标节点与各个邻居节点的转移概率基于目标节点与目标节点的各个邻居节点的转移频率确定,具体而言,目标节点与邻居节点
的转移概率基于目标节点与目标节点的转移频率负相关。
9.在另一个可能的实现中,异质图信息包括节点特征矩阵,节点特征矩阵包括多个节点中各个节点的初始语义特征,节点的初始语义特征表征节点对应的对象的自身属性信息;将节点特征矩阵中不同类型的节点初始语义特征映射至公共特征空间,确定多个节点中各个节点的转换特征;基于目标节点的转换特征和目标节点的各个邻居节点的转换特征,确定目标节点与目标节点的各个邻居节点的相似性。
10.在另一个可能的实现中,邻居节点的置信度大于或等于预设阈值,则确定邻居节点的置信度达标;或者,对目标节点的邻居节点的置信度进行降序排列,前t个邻居节点为达标的邻居节点。
11.在另一个可能的实现中,上述将置信度达标的各条元路径对应的目标节点的邻居节点进行聚合,确定各条元路径对应的目标节点的节点级嵌入表示,包括:基于节点级的注意力机制确定各条元路径对应的目标节点的达标的邻居节点的注意力权重;基于各条元路径对应的目标节点的达标的邻居节点的注意力权重,对置信度达标的各条元路径对应的目标节点的邻居节点进行聚合,确定各条元路径对应的目标节点的节点级嵌入表示。
12.在一个示例中,上述将各条元路径对应的目标节点的节点级嵌入表示进行聚合,确定目标节点的语义级嵌入表示,包括:基于语义级的注意力机制确定各条元路径对应的目标节点的节点级嵌入表示的注意力权重;基于各条元路径对应的目标节点的节点级嵌入表示的注意力权重,对各条元路径对应的目标节点的节点级嵌入表示进行聚合,确定目标节点的语义级嵌入表示。
13.在另一个可能的实现中,目标业务的预测任务包括节点分类预测任务、链接预测任务、聚类任务、推荐任务、异常检测任务中的一个或多个。
14.第二方面,本技术实施例提出一种基于异质图神经网络的数据处理装置,包括:
15.获取模块,用于获取目标业务的异质图信息,所述异质图包括多个节点和表征多个节点连接关系的连接边,所述多个节点中包括多种类型的节点,所述多个节点中不同类型的节点表示所述目标业务的业务数据中不同类型的对象;
16.第一确定模块,用于基于多条元路径,确定各条所述元路径对应的目标节点的邻居节点;
17.第二确定模块,用于基于各条所述元路径对应的所述目标节点与所述目标节点的各个所述邻居节点的转移概率,以及所述目标节点与所述目标节点的各个所述邻居节点的相似性,确定各条所述元路径对应的所述目标节点的各个所述邻居节点的置信度;
18.节点级聚合模块,用于将所述置信度达标的各条所述元路径对应的所述目标节点的邻居节点进行聚合,确定各条所述元路径对应的目标节点的节点级嵌入表示;
19.语义级聚合模块,用于将各条所述元路径对应的目标节点的节点级嵌入表示进行聚合,确定所述目标节点的语义级嵌入表示,所述语义级嵌入表示用于实现所述目标业务的预测任务。
20.在一个可能的实现中,所述第二确定模块具体用于,基于所述各条所述元路径对应的所述目标节点与所述目标节点的各个所述邻居节点的转移概率,确定所述各条所述元路径对应的所述目标节点的各个所述邻居节点的先验置信度;
21.基于所述各条所述元路径对应的所述目标节点的各个所述邻居节点的先验置信
度和所述目标节点与所述目标节点的各个所述邻居节点的相似性,确定各条所述元路径对应的所述目标节点的各个所述邻居节点的置信度。
22.在另一个可能的实现中,所述各条所述元路径对应的所述目标节点与各个所述邻居节点的转移概率基于所述目标节点与所述目标节点的各个所述邻居节点的转移频率确定。
23.在另一个可能的实现中,所述异质图信息包括节点特征矩阵,所述节点特征矩阵包括所述多个节点中各个节点的初始语义特征,所述节点的初始语义特征表征所述节点对应的对象的自身属性信息;
24.将所述节点特征矩阵中不同类型的节点初始语义特征映射至公共特征空间,确定所述多个节点中各个节点的转换特征;
25.基于所述目标节点的转换特征和所述目标节点的各个所述邻居节点的转换特征,确定所述目标节点与所述目标节点的各个所述邻居节点的相似性。
26.在另一个可能的实现中,所述邻居节点的置信度大于或等于预设阈值,则确定所述邻居节点的置信度达标。
27.在另一个可能的实现中,所述节点级聚合模块具体用于,基于节点级的注意力机制确定所述各条所述元路径对应的目标节点的达标的邻居节点的注意力权重;
28.基于所述各条所述元路径对应的目标节点的达标的邻居节点的注意力权重,对所述置信度达标的各条所述元路径对应的所述目标节点的邻居节点进行聚合,确定各条所述元路径对应的目标节点的节点级嵌入表示。
29.在另一个可能的实现中,所述语义级聚合模块具体用于,基于语义级的注意力机制确定所述各条元路径对应的目标节点的节点级嵌入表示的注意力权重;
30.基于所述各条元路径对应的目标节点的节点级嵌入表示的注意力权重,对所述各条元路径对应的目标节点的节点级嵌入表示进行聚合,确定所述目标节点的语义级嵌入表示。
31.在另一个可能的实现中,所述目标业务的预测任务包括节点分类预测任务、链接预测任务、聚类任务、推荐任务、异常检测任务中的一个或多个。
32.第三方面,本技术实施例提供一种计算设备,包括存储器和处理器,所述存储器中存储有指令,当所述指令被处理器执行时,使得第一方面所述的方法被实现。
33.第四方面,本技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在被处理器执行时,使得第一方面所述的方法被实现。
34.第五方面,本技术实施例还提供一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括指令,当所述指令执行时,令计算机执行第一方面所述的方法。
35.第六方面,本技术实施例还提供一种芯片,包括至少一个处理器和通信接口,所述处理器用于执行第一方面所述的方法。
附图说明
36.图1为一种引文网络的异质图;
37.图2为基于rgcn提高图神经网络对抗鲁棒性的示意图;
38.图3为基于simpgcn提高图神经网络对抗鲁棒性的示意图;
39.图4a示出了被攻击情况下的引文网络的异质图,以及两条不同的元路径,以及基于元路径获取到的邻居节点的示意图;
40.图4b示出了在被攻击情况下基于元路径获取到的邻居节点,以及计算各邻居节点的注意力的示意图;
41.图4c示出了在被攻击情况下基于元路径获取到的邻居节点,以及采用本技术提供的方案过滤掉攻击邻居节点的示意图;
42.图5为本技术实施例提供的基于异质图神经网络的数据处理方法的流程图;
43.图6为本技术实施例提供的异质图神经网络防御攻击的示意图;
44.图7为本技术实施例提供的一种基于异质图神经网络的数据处理装置的结构示意图;
45.图8为本技术实施例提供的计算设备的结构示意图。
具体实施方式
46.下面通过附图和实施例,对本技术的技术方案做进一步的详细描述。
47.异质图被定义为g=(v,e),由一个对象集v和一个边集e组成。异质图g还与一个节点类型映射函数φ:v
→
a和一个边类型映射函数ψ:e
→
r有关。a和r表示预定义的节点类型和边类型集,其中|a|+|r|》2。对于r中的每个边类型有对应的二进制邻接矩阵mr。
48.异质图属于图结构的一种,由于其包含了不同类型的对象和关系,它可以自然地表示许多真实世界的数据集。举例来说,被广泛使用的引文网络就是一种反映论文之间关系的异质图。具体可以如图1所示,它由三种类型的对象和两种类型的关系组成,对象包括作者(author,a)、论文(paper,p)和主题(subject,s),两种关系包括论文与作者的关系 (用p-a表示)和论文与主题的关系(用p-s表示)。由于异质图包含丰富的高阶结构信息,元路径(两个节点类型之间的关系类型序列)被广泛用作获取此类信息的基本工具,如元路径p-a-p表示同一作者写的论文,元路径p-s-p表示属于同一主题的论文。
49.随着深度学习技术的应用,异质图神经网络(heterogeneous graph neural network, hgnn)兴起,hgnn通常采用层次聚合(包括节点级和语义级)从基于元路径的邻居中获取信息,并在许多任务(如节点分类、链接预测、聚类、推荐、异常检测等)上取得了最先进的性能。还是以引文网络为例,将图1中的三类节点对象和它们之间的边关系输入hgnn 中,根据输出的不同可以对应不同的任务。比如输出为预测的论文所属主题类别,则属于节点分类任务;输出为两篇论文之间是否存在引用关系,则对应的是链接预测任务;输出为相似主题的论文划分到同一个簇,则属于聚类任务。
50.图数据对抗攻击的定义是给定一个图(节点和边),通过修改这个图,使得这种修改在不被察觉到的情况下,能够降低算法(例如节点分类和链接预测算法)在图数据上的表现。和优化问题相似,攻击方的目标是在一定约束的条件下最大可能地干扰算法的表现。例如,在对图结构进行扰动(加边或者减边的条数)不能太多,要保持图的基本结构,这是对抗攻击实现的前提。具体来说,有以下两种类型的扰动:
51.维持结构的扰动(structure-preserving perturbation):加减节点和边会改变一些图的结构属性,例如度分布、节点中心性。其本质都是对边进行改变,所以新产生的对抗样本要保持这些结构属性的变化在一定范围内。
52.维持属性的扰动(attribute-preserving perturbation):通过修改节点属性特征来实现,攻击者要保证这些属性不能发生明显变化,可以通过衡量节点(边)特征向量的相似度来维持特征的稳定性。
53.尽管hgnn取得了巨大的成功,但目前还没有系统地了解hgnn的对抗鲁棒性,即hgnn 是否容易被输入的轻微扰动所欺骗。这对于hgnn模型尤其重要,如今hgnn模型被广泛应用于许多现实世界的应用中,例如电子商务和网络安全。由于数据源通常是部分公开的,一旦发生对抗性攻击,脆弱的hgnn模型将给这些应用程序带来严重的损害和经济损失。到目前为止,同质gnn的对抗性漏洞已在最近的研究中得到验证,但hgnn的对抗性漏洞还需要被验证。
54.针对图结构神经网络提高攻击鲁棒性有两种方案,第一种方案为关系图卷积网络 (relational graph convolutional network,rgcn),rgcn是一个鲁棒的图卷积网络(graphconvolutional network,gcn)模型,被设计用来防御对抗攻击,采用基于方差的注意机制来阻止攻击的传播。
55.如图2所示,在rgcn中输入为节点特征矩阵和邻接矩阵,对于单个节点,rgcn利用高斯分布建模节点表示(均值表示m和方差表示σ),其中方差表示可以用于吸收扰动。具体地,施加同样的扰动,传统的节点向量的具体数值会被直接改变,而高斯节点向量中方差表示的存在可以容许节点表示存在一定范围的误差;rgcn由多层图卷积层(gcl)组成,但不同于普通的图卷积层,rgcn设计了基于高斯的图卷积层(ggcl)。在每个ggcl中,利用基于方差的注意力机制融合邻居节点的高斯表示。其中,方差更大的邻居倾向于获得更小的注意力权重,从而降低这些不稳定邻居(即扰动)对其他节点的影响;对于节点分类任务,从最后一层高斯表示中采样得到最终节点表示,计算任务损失,并用于更新网络参数。
56.但是第一种方案不适用于异质图,由于该方案只考虑同质节点,即只针对同质图的对抗攻击进行研究,对于异质图上不同类型节点之间特有的高阶语义信息不太适用。如果利用单一和对称的元路径将异质图转化为同质图,再使用该方法,则会损失大量信息;同时防御效果有限,由于异质图神经网络存在特殊脆弱性,该方案无法准确捕捉到异质图神经网络中的特殊漏洞,对其防御效果有限。
57.第二种方案为simpgcn,simpgcn是一个鲁棒的gcn模型,通过在训练中保持属性间的相似度信息,以此提高gcn的对抗鲁棒性。
58.如图3所示,首先构建属性图,利用k近邻算法(knn)计算每个节点属性最相似的k 个邻居,得到属性图gf;维持节点相似的聚合模块(node similarity preservingaggregation):首先进行自适应图融合(adaptive integration),利用单层神经网络自适应地学习融合分数s,分别以1-s和s融合属性图和原始的拓扑图。在融合后的图上根据gcn方法进行邻居聚合,得到最终节点表示,例如节点i和节点j的最终节点表示为hi和 hj。基于节点表示可以进行节点分类的任务,得到该任务下的损失l
class
;与此同时,simpgcn 还设计了一个自监督学习(self-supervised learning)模块。该模块分别基于邻居节点对的最终表示(hi,hj)和原始属性(xi,xj)来计算相似度,通过缩小二者的差值,显式捕捉节点之间复杂的特征相似和相异关系。基于这个模块的任务得到自监督损失l
self
。最终基于节点分类损失l
class
和自监督损失l
self
,用于更新网络参数。
59.但是该方案存在这如下问题:
60.不适用于无属性图:由于simpgcn需要依赖图中节点的原始特征来进行自监督学习的模块,对于没有属性的图来说,该方法并不适用。
61.不适用于异质图:simpgcn只考虑同质图,没有考虑异质图上不同类型节点之间特有的高阶语义信息,因此也不适用于异质图上的对抗攻击防御。
62.防御效果有限:由于异质图神经网络存在特殊脆弱性,该方法无法准备捕捉到异质图神经网络中的特殊漏洞,对其防御效果有限。
63.上述两种方案均没有考虑到hgnn中特有的攻击漏洞,导致了无法适用于异质图上的对抗攻击防御。由于hgnn一般采用基于元路径的方式来直接聚合远程邻居节点,这种方式导致了两种特殊的攻击漏洞:
64.扰动放大漏洞:将目标节点链接到高度数的节点,可能产生大量恶意的远程邻居;
65.注意退化漏洞:目标节点的接受域中存在大量基于元路径的邻居,不同的邻居最终会有相似的注意值。
66.对于以上两种漏洞,下面通过对引文网络的举例来进行解释。
67.如图4a所示,将论文p1链接到一个高产作者a3(虚线表示两者的关联),这个作者a3可能是一个涉及多领域研究的学术工作者(高度数节点),他的主要研究领域不同于论文p1所在的主题,那么这个学术工作者链接的论文中大多数都是与论文p1不相关的其他主题论文。这样就导致了对于节点p1,它通过p-a-p元路径得到了大量无用的邻居节点(如p4到pn),这些远程邻居节点对于节点p1的表示来说是有害的,容易使其表示产生巨大的偏差。也就是这种由于链接高度数节点的扰动,使错误被放大,我们称之为扰动放大漏洞。
68.注意退化漏洞是说之前的hgnn对大量基于元路径得到的邻居节点进行聚合,其对不同邻居节点聚合的权重(注意力值)都是相似的,那么对于如图4b中存在的干扰邻居(p4到 pn)也采用相似的注意力值就会使hgnn方法受到攻击。我们称这种现象为注意退化导致的攻击漏洞。
69.因此,本技术实施例要解决的技术问题是:如何提供一种方法和装置,以深入理解异质图神经网络存在的攻击漏洞,从而抵御hgnn可能存在的攻击,并且提高和适配支持不同hgnn方法在应用中的对抗鲁棒性。具体而言,需要解决两个方面的需求,第一,减少扰动放大漏洞中对抗邻居节点的置信度,对于减缓其负面影响至关重要;第二,防止注意退化,设计更有分辨力的注意机制。
70.本技术实施例提出的基于异质图神经网络的数据处理方法。在技术上是第一次考虑异质图中的对抗攻击防御问题,通过对hgnn上的攻击漏洞分析,提出了针对拓扑对抗攻击的异质图神经网络框架rohe。
71.具体来说,本技术实施例提出的基于异质图神经网络的数据处理方法,主要针对异质图上的注意力防御问题,为了解决hgnn中的扰动放大和注意力退化漏洞,设计了注意力净化器模块来增强hgnn的节点级注意力。简单而言,通过引入基于元路径的转移概率(该元路径对应的目标节点到每个邻居节点的转移概率)作为净化器的先验判据,以抑制扩大扰动邻居节点的置信度,因为这些邻居节点往往是通过一个高度数(即低转移概率)的单节点链接到目标节点的。而现有的hgnn忽略了这种转移概率,平等对待所有的邻居节点,导致了扰动放大的漏洞。因此,本技术实施例提出的基于异质图神经网络的数据处理方法,提出基于转移概率和特征相似性(即目标节点和其各个邻居节点的相似性),来过滤低置信度的
邻居,同时相对于原来的大感受野,这种过滤操作可以有效地缩小感受野以缓解注意退化。图4c为采用了本技术实施例提供的方案,过滤掉了低置信度的邻居节点,也就是被攻击的邻居节点(例如图4c中的p4至pn),不同于现有的hgnn,本技术实施例提出 rohe模型通过转移先验trans(
·
,
·
)和特征相似性sim(
·
,
·
),可以过滤掉低置信度邻居节点 {p4,
…
,pn},并获得真实有效的邻居节点{p1,p2,p3}。
72.下面详细介绍本技术实施例提供的基于异质图神经网络的数据处理方法。
73.图5为本技术实施例提供的基于异质图神经网络的数据处理方法的流程图。该方法可由计算设备实施,该计算设备可以为各种类型的终端设备,例如便携式手持设备、笔记本电脑、台式计算机等,也可以为服务器,服务器可以包括一个或多个通用计算机、专用服务器计算机服务器、刀片式服务器、大型计算机、服务器集群或任何其他适当的布置或组合。下面结合图5示出的步骤,对本技术实施例提供的基于异质图神经网络的数据处理方法进行说明。
74.在步骤s501中,获取目标业务的异质图信息。
75.异质图包括多个节点和表征多个节点连接关系的连接边,多个节点中包括多种类型的节点,多个节点中不同类型的节点表示目标业务的业务数据中不同类型的对象。以图1中的引文网络的异质图为例,该异质图包括多个不同类型的节点,例如主题节点s1、s2、s3,论文节点p1、p2、p3、p4···
pn,作者节点a1、a2、a3;异质图信息包括节点特征矩阵和邻接矩阵,节点特征矩阵包括各个节点的初始语义特征,表征节点对应的对象的自身属性信息,例如,论文节点p1节点的初始语义特征表示论文p1的属性信息,例如该论文的关键词、字数、发表时间等属性信息。邻接矩阵表示异质图的拓扑结构信息,也就是说各个节点的连接关系。
76.在步骤s502中,基于多条元路径,确定各条元路径对应的目标节点的邻居节点。
77.首先对元路径进行解释:元路径被定义为一个路径,描述了节点类型a1和a
121
之间的复合关系那么,对于元路径的邻居节点,是给定异质图中的一个目标节点v和一条元路径φ,得到通过元路径φ连接目标节点v的邻居节点集合。
78.以引文网络为例,如图4a所示,目标节点为论文p1时,在p-s-p这类元路径下存在着 p
1-s
1-p1的连接关系,因此其包括自身在内的邻居节点集合为{p1,p2};而对于同样的目标节点,在p-a-p这类元路径下,由于目标节点p1与节点a1,a2,a3都存在着连接,因此在这种情况下得到的邻居节点集合为{p1,p2,p3,p4,
…
,pn},也就是说,某条路径的目标节点的邻居节点为在该条路径下与目标节点类型相同的节点。
79.在步骤s503和步骤s504中,基于各条元路径对应的目标节点与目标节点的各个邻居节点的转移概率,以及目标节点与目标节点的各个邻居节点的相似性,确定各条元路径对应的目标节点的各个邻居节点的置信度;然后将置信度达标的各条元路径对应的目标节点的邻居节点进行聚合,确定各条元路径对应的目标节点的节点级嵌入表示。
80.首先根据据节点特征估计每个边(v,u)的注意力值,以量化边的重要性。但由于异质性,不同类型的节点具有不同的特征空间。因此,本技术实施例首先将不同类型节点的特征投射到公共特征空间中。具体来说,对于邻接矩阵中类型为a的目标节点v,用xv表示其特征,使用特定类型的转换矩阵wa来获得投影的特征hv:hv=waxv。接着,对任意类型的节点v及
其邻居节点u,得到基于特征的注意力值e
vu
:e
6u
=h6·hu
。由于异质图通常具有无标度的特性,图数据的方差相当高。因此,本技术实施例将节点级注意扩展为多头注意形式,从而使训练过程更加稳定。特别地,本技术实施例对上述节点级的注意重复 k次,可以得到多头注意力值向量e
vu
∈rk:
81.可以理解的是,e
vu
=hv·hu
也可表示目标节点v与目标节点v的邻居节点u的相似性。
82.在节点级注意向量e
vu
的条件下,本技术实施例的目标是通过转移概率(即目标节点与目标节点的各个邻居节点的转移概率)作为先验和特征相似性(即目标节点与目标节点的各个邻居节点的相似性)的准则掩盖冗余和噪声,将大的接受域缩小到一个固定的大小。
83.转移概率先验:给定元路径将沿元路径φ的转移概率编码为先验。首先计算转移概率矩阵,对于{r1,...,r1}中的关系ri,其转移概率矩阵具体计算为:
[0084][0085]
其中每个元素表示相当于在关系ri下,从中的节点vi到中的节点v
i+1
概率,表示这两个节点转移的频率。进一步地,沿着φ连乘基于每种关系的转移概率矩阵,将得到基于元路径的转移概率矩阵p
φ
:其中元素可以作为目标节点v的邻居节点u的基于φ的先验置信度。
[0086]
净化器:以转移概率作为先验准则,通过平均k-heads注意向量e
vu
,结合基于特征的稳定相似度,得到基于元路径φ的邻居的最终置信度分数向量的最终置信度分数向量其中,作为的一个元素,是节点中的置信度,表明具有相似特征,且转移概率高的邻居更有可能是可靠的,而不是对抗的。
[0087]
进一步,针对目标节点v的所有邻居节点,建模净化操作为掩蔽向量进一步,针对目标节点v的所有邻居节点,建模净化操作为掩蔽向量其中t是要保留的邻居节点个数,函数top(.)可基于邻居节点的置信度返回t个最可靠的邻居节点集合。然后其他邻居节点将被删除,通过在掩蔽向量中设置掩码值为-∞。最后,本技术实施例使用来屏蔽冗余和噪声邻居节点,接着通过softmax函数得到归一化且纯净的k头注意居节点,接着通过softmax函数得到归一化且纯净的k头注意
[0088]
为了更方便理解以上过程,可以通过图6所示的过程来简单阐述。
[0089]
首先,根据特定元路径中不同节点的转移,可以计算它们的转移概率先验(transitingprior),如图6中标注1的框线,对于p-a-p这条元路径,计算得到p1转移到a1的
概率为 0.33,a1再转移到p1的概率为0.5。第二步(图6中标注2的框线)是计算目标节点p1与它自身及邻居节点p2,...,pn在特定路径下的多头注意力值,也可以理解为特征相似性;第三步(图6中标注3的框线)则结合前面两步的结果,计算节点之间边存在的置信度,筛选出topt个可靠的邻居节点作为后续节点聚合表征的输入。即置信度topt个邻居节点即为达标的邻居节点。或者也可以通过设置预设置阈值的方式筛选出达标的邻居节点,也就是筛选出可靠的邻居节点,即置信度大于或等于预设阈值的邻居节点则为置信度达标的邻居节点。
[0090]
综上所述,本技术实施例采用上述注意力净化器进行鲁棒的节点级聚合表征。最后,纯化后的注意力分数将被用于聚合邻居,来学习特定语义的节点级嵌入将被用于聚合邻居,来学习特定语义的节点级嵌入
[0091]
回到图5,在步骤s505中,将各条元路径对应的目标节点的节点级嵌入表示进行聚合,确定目标节点的语义级嵌入表示,语义级嵌入表示用于实现所目标业务的预测任务。
[0092]
由于不同的元路径可以获取异质图中不同方面的语义信息,在hgnn中设计了一个语义级注意力机制来学习每个元路径的重要性。给定元路径集合{φ0,φ1,...,φ
p
},在将节点特性引入节点级注意之后,可以获得p组语义特定的节点嵌入表示,记为为了有效地聚合不同的语义嵌入表示,本技术实施例采用语义级的注意机制:其中w和b分别表示mlp的权值矩阵和偏置,q是语义级的注意力向量。为了防止节点嵌入值太大,本技术实施例采用了softmax函数规范化因此,最终的嵌入z可以通过语义级聚合获得:其中表示标准化的表示语义的重要性。最后,可以将最终得到的嵌入应用到特定的任务中,设计不同的损失函数。对于半监督节点分类,可以最小化所有训练节点的交叉熵v
l
:其中w
clf
是分类器的参数,cv和zv是标记节点v的类和预测。在标记数据的指导下,可以通过反向传播优化所提出的模型,并学习节点的嵌入表示。
[0093]
本技术实施例提供的基于异质图神经网络的数据处理方法可以处理多种业务场景的业务数据,例如研究领域中对论文与作者关系的预测业务,电子商务领域中为用户推荐商品的推荐业务,金融领域中的欺诈用户检测业务,异常检测业务等等。由于异质图神经网络在各行业的快速应用和发展,很多业务场景中都会涉及可用本技术实施例提供的基于异质图神经网络的数据处理方法来进行更加鲁棒的应用。
[0094]
示例性的,研究领域中对论文与作者关系的预测业务:这是一个作者与论文关系的链接预测问题。由于引文网络是一个异质图网络,存在作者-论文-主题之间的关系,要预测一篇论文是否与某个作者存在联系,可以通过hgnn方法得到某个论文与作者具有富信息的表征向量,接着通过论文与作者各自表征之间的操作得到两者具有连边关系的概率。
[0095]
电子商务领域中为用户推荐商品的推荐业务:这是一个用户与商品的推荐问题。随着数据获取的便利,用户和商品的信息也更加多元丰富。例如商品的信息可以包括所属
的商品类别、和该商品具有特定关系(如互补关系、竞争关系)等的商品。用户与用户之间也具有一定的联系,比如好友关系、具有相似的兴趣爱好等。在这样多元异构的结构下,也可以通过hgnn方法分别得到用户和商品更加丰富的表征,进而预测两者在未来存在关联 (用户会购买该商品)的可能性,据此来为用户进行个性化推荐。
[0096]
金融领域中的欺诈用户检测业务:这是一个检测用户异常与否的问题。在金融交易中,用户可以通过不同设备与不同实体(如商户)进行交互,用户之间也可以进行交易。在这样的场景中,存在一些欺诈用户(例如信用卡欺诈)通过伪装自己来获取非法利益。通过不同实体之间的交互信息,构成了一个异质图网络,则欺诈用户检测是通过hgnn方法来对每个用户进行表征,从而预测其是欺诈用户的概率,据此来进行欺诈用户的检测。
[0097]
本技术实施例提供基于异质图神经网络的数据处理方法可以解决hgnn中存在的扰动放大和注意退化的漏洞,通过在节点级聚合中设计了注意力净化器,可以筛选出可靠的邻居进行聚合来避免以上漏洞的出现。目前通过在实际数据集中的实验测试,初步验证了预期的优势和有益效果。比如:
[0098]
鲁棒性提高:这个主要由本技术实施例提出的注意力净化器模块实现,通过先验知识的引入,保证了筛选的邻居节点更加可靠,并且通过邻居节点之间注意力值的计算,从相似性的角度也能避免一定的漏洞出现。
[0099]
具有泛化性:这个是由于本技术实施例提供的架构是基于普遍广泛使用的hgnn方式,可以用于具有代表性的hgnn,如han、magnn、gtn等方法。其中,han具有层次聚合,可以捕获节点和语义重要性。magnn是一种采用分层注意的高级hgnn,进一步考虑了元路径上的中间节点来实现节点级注意。gtn是一种基于层次聚合而无注意机制的hgnn,学习在节点级聚合中有用元路径的软生成器。
[0100]
通过在真实数据集(以引文网络数据集为例)上进行试验,验证了本技术实施例提供的基于异质图神经网络的数据处理方法的有益效果,即具有较好的防御能力和泛化能力。
[0101]
基线对比方法:由于目前没有鲁棒的hgnn方法,将本技术实施例提出的rohe方法与这些基线进行比较:1)rgcn是一个鲁棒的gcn模型,被设计用于防御对抗攻击,采用基于方差的注意机制来阻止攻击的传播;2)simpgcn通过在训练中保持特征相似度,提高了 gcn的对抗鲁棒性;3)han-jac利用节点特征之间的jaccard相似性来去除敌对边缘。 rohe
t
:hgnn(例如han-rohe
t
)只采用转移概率作为节点级注意值。rohe
p
:对节点级的注意采用了注意净化器,而没有使用转移概率(例如,han-rohe
p
)。注意simpgcn和 han-jac依赖于节点特性,不能用于非属性aminer数据集。
[0102]
执行对抗攻击:为了验证在不同方式的对抗攻击下的效果,首先要对数据进行扰动,即创造一个对抗攻击的环境。本技术实施例采用三种不同的环境:对抗攻击(attack)、随机噪声(noise)、干净数据(clean)。
[0103]
效果说明:通过在三种真实数据集(分别为acm数据集、dblp数据集、aminer数据集)下评估了三种情况下(干净、噪声和攻击)在所有基线上对han方法进行本发明关键技术点的有效性。一般更加关注最坏的情况,即对抗攻击。总体结果如表一所示:
[0104][0105]
表一
[0106]
在对抗攻击(即攻击场景)下,本技术实施例的模型han-rohe在所有指标上均优于其他基线。同时还可以观察到,随着攻击个数δ的增加,对于acm和aminer数据集,han-rohe 的性能仅略微下降约5%。这是因为han可以极大地受益于rohe,解决了扰动增大和注意力退化的脆弱性。
[0107]
在攻击场景下,本技术实施例的模型han-rohe比所有基线具有更好的对抗鲁棒性。这是因为其他模型没有考虑直接远程聚合带来的两个漏洞:han-jac和simpgcn,基于特征相似度减少虚假的对抗边,能够缓解注意退化,但仍存在扰动放大问题。han-rohe
t
和han-rohe
p
只能分别解决扰动增大和注意力退化问题,未能达到最佳的对抗鲁棒性。而rgcn不能解决这两个漏洞,导致改进较少。
[0108]
为了证明本技术实施例提出的防御框架能在其他hgnn模型上通用,将rohe推广到 magnn和gtn方法,它们也遵循层次聚合。而消耗内存的gtn只能由变量rohe
t
配置,产生gtn-rohe
t
。具体来说,用扰动预算δ={1,3,5}来评估hgnn在对抗性攻击下的鲁棒性。结果显示在表二中。从表二中可以看出,rohe可以显著提高不同hgnn的鲁棒性,特别是对于han和magnn。原因是这些hgnn都有扰动增大和注意力退化的弱点,因此可以从我们健壮的进化注意力净化器中大大受益。对于gtn,由于rohe
t
在净化器中不进行掩蔽操作,只是减少了放大的扰动邻居的权值,但仍在聚集中吸收它们,因此改进有限。
[0109][0110]
表二
[0111]
与前述方法实施例基于相同的构思,本技术实施例中还提供了一种基于异质图神
经网络的数据处理装置700,该基于异质图神经网络的数据处理装置700包括用以实现图5 和6所示的基于异质图神经网络的数据处理方法中的各个步骤的单元或模块。
[0112]
图7为本技术实施例提供的一种基于异质图神经网络的数据处理装置的结构示意图。该装置部署于计算设备后可实现图5和图6所示的方法,如图7所示,该一种基于异质图神经网络的数据处理装置700至少包括:
[0113]
获取模块701,用于获取目标业务的异质图信息,所述异质图包括多个节点和表征多个节点连接关系的连接边,所述多个节点中包括多种类型的节点,所述多个节点中不同类型的节点表示所述目标业务的业务数据中不同类型的对象;
[0114]
第一确定模块702,用于基于多条元路径,确定各条所述元路径对应的目标节点的邻居节点,所述邻居节点为与所述目标节点有连接边的节点;
[0115]
第二确定模块703,用于基于各条所述元路径对应的所述目标节点与所述目标节点的各个所述邻居节点的转移概率,以及所述目标节点与所述目标节点的各个所述邻居节点的相似性,确定各条所述元路径对应的所述目标节点的各个所述邻居节点的置信度;
[0116]
节点级聚合模块704,用于将所述置信度达标的各条所述元路径对应的所述目标节点的邻居节点进行聚合,确定各条所述元路径对应的目标节点的节点级嵌入表示;
[0117]
语义级聚合模块705,用于将各条所述元路径对应的目标节点的节点级嵌入表示进行聚合,确定所述目标节点的语义级嵌入表示,所述语义级嵌入表示用于实现所述目标业务的预测任务。
[0118]
在一个可能的实现中,所述第二确定模块703具体用于,基于所述各条所述元路径对应的所述目标节点与所述目标节点的各个所述邻居节点的转移概率,确定所述各条所述元路径对应的所述目标节点的各个所述邻居节点的先验置信度;
[0119]
基于所述各条所述元路径对应的所述目标节点的各个所述邻居节点的先验置信度和所述目标节点与所述目标节点的各个所述邻居节点的相似性,确定各条所述元路径对应的所述目标节点的各个所述邻居节点的置信度。
[0120]
在另一个可能的实现中,所述各条所述元路径对应的所述目标节点与各个所述邻居节点的转移概率基于所述目标节点与所述目标节点的各个所述邻居节点的转移频率确定。
[0121]
在另一个可能的实现中,所述异质图信息包括节点特征矩阵,所述节点特征矩阵包括所述多个节点中各个节点的初始语义特征,所述节点的初始语义特征表征所述节点对应的对象的自身属性信息;
[0122]
将所述节点特征矩阵中不同类型的节点初始语义特征映射至公共特征空间,确定所述多个节点中各个节点的转换特征;
[0123]
基于所述目标节点的转换特征和所述目标节点的各个所述邻居节点的转换特征,确定所述目标节点与所述目标节点的各个所述邻居节点的相似性。
[0124]
在另一个可能的实现中,所述邻居节点的置信度大于或等于预设阈值,则确定所述邻居节点的置信度达标。
[0125]
在另一个可能的实现中,所述节点级聚合模块704具体用于,基于节点级的注意力机制确定所述各条所述元路径对应的目标节点的达标的邻居节点的注意力权重;
[0126]
基于所述各条所述元路径对应的目标节点的达标的邻居节点的注意力权重,对所
述置信度达标的各条所述元路径对应的所述目标节点的邻居节点进行聚合,确定各条所述元路径对应的目标节点的节点级嵌入表示。
[0127]
在另一个可能的实现中,所述语义级聚合模块705具体用于,基于语义级的注意力机制确定所述各条元路径对应的目标节点的节点级嵌入表示的注意力权重;
[0128]
基于所述各条元路径对应的目标节点的节点级嵌入表示的注意力权重,对所述各条元路径对应的目标节点的节点级嵌入表示进行聚合,确定所述目标节点的语义级嵌入表示。
[0129]
所述目标业务的预测任务包括节点分类预测任务、链接预测任务、聚类任务、推荐任务、异常检测任务中的一个或多个。
[0130]
根据本技术实施例的基于异质图神经网络的数据处理装置700可对应于执行本技术实施例中描述的方法,并且一种基于异质图神经网络的数据处理装置700中的各个模块的上述和其它操作和/或功能分别为了实现图5和6中的各个方法的相应流程,为了简洁,在此不再赘述。
[0131]
本技术实施例还提供一种计算设备,包括至少一个处理器、存储器和通信接口,所述处理器用于执行图5和6所述的方法。
[0132]
图8为本技术实施例提供的计算设备的结构示意图。
[0133]
如图8所示,所述计算设备800包括至少一个处理器801、存储器803和通信接口802。其中,处理器801和存储器803、通信接口802通信连接,也可以通过无线传输等其他手段实现通信。该通信接口802用于接收其他设备发送的数据(例如目标业务的异质图信息);存储器803存储有计算机指令,处理器801执行该计算机指令,执行前述方法实施例中的基于异质图神经网络的数据处理方法。
[0134]
应理解,在本技术实施例中,该处理器801可以是中央处理单元cpu,该处理器 801还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(fieldprogrammable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。
[0135]
该存储器803可以包括只读存储器和随机存取存储器,并向处理器801提供指令和数据。存储器803还可以包括非易失性随机存取存储器。
[0136]
该存储器803可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasableprom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(static ram,sram)、动态随机存取存储器(dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器 (double data date sdram,ddr sdram)、增强型同步动态随机存取存储器(enhancedsdram,esdram)、同步连接动态随机存取存储器(synchlink dram,sldram) 和直接内存总线随机存取存储器(direct rambus ram,dr ram)。
[0137]
应理解,根据本技术实施例的计算设备800可以执行实现本技术实施例中图5和6
所示方法,该方法实现的详细描述参见上文,为了简洁,在此不再赘述。
[0138]
本技术的实施例提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机指令在被处理器执行时,使得上文提及的基于异质图神经网络的数据处理方法被实现。
[0139]
本技术的实施例提供了一种芯片,该芯片包括至少一个处理器和接口,所述至少一个处理器通过所述接口确定程序指令或者数据;该至少一个处理器用于执行所述程序指令,以实现上文提及的基于异质图神经网络的数据处理方法。
[0140]
本技术的实施例提供了一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括指令,当该指令执行时,令计算机执行上文提及的基于异质图神经网络的数据处理方法。
[0141]
本领域普通技术人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执轨道,取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0142]
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执轨道的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
[0143]
以上所述的具体实施方式,对本技术的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本技术的具体实施方式而已,并不用于限定本技术的保护范围,凡在本技术的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
技术特征:
1.一种基于异质图神经网络的数据处理方法,其特征在于,包括:获取目标业务的异质图信息,所述异质图包括多个节点和表征多个节点连接关系的连接边,所述多个节点中包括多种类型的节点,所述多个节点中不同类型的节点表示所述目标业务的业务数据中不同类型的对象;基于多条元路径,确定各条所述元路径对应的目标节点的邻居节点;基于各条所述元路径对应的所述目标节点与所述目标节点的各个所述邻居节点的转移概率,以及所述目标节点与所述目标节点的各个所述邻居节点的相似性,确定各条所述元路径对应的所述目标节点的各个所述邻居节点的置信度;将所述置信度达标的各条所述元路径对应的所述目标节点的邻居节点进行聚合,确定各条所述元路径对应的目标节点的节点级嵌入表示;将各条所述元路径对应的目标节点的节点级嵌入表示进行聚合,确定所述目标节点的语义级嵌入表示,所述语义级嵌入表示用于实现所述目标业务的预测任务。2.根据权利要求1所述的方法,其特征在于,所述基于各条所述元路径对应的所述目标节点与所述目标节点的各个所述邻居节点的转移概率,以及所述目标节点与所述目标节点的各个所述邻居节点的相似性,确定各条所述元路径对应的所述目标节点的各个所述邻居节点的置信度,包括:基于所述各条所述元路径对应的所述目标节点与所述目标节点的各个所述邻居节点的转移概率,确定所述各条所述元路径对应的所述目标节点的各个所述邻居节点的先验置信度;基于所述各条所述元路径对应的所述目标节点的各个所述邻居节点的先验置信度和所述目标节点与所述目标节点的各个所述邻居节点的相似性,确定各条所述元路径对应的所述目标节点的各个所述邻居节点的置信度。3.根据权利要求1或2所述的方法,其特征在于,所述各条所述元路径对应的所述目标节点与各个所述邻居节点的转移概率基于所述目标节点与所述目标节点的各个所述邻居节点的转移频率确定。4.根据权利要求1-3任一项所述的方法,其特征在于,所述异质图信息包括节点特征矩阵,所述节点特征矩阵包括所述多个节点中各个节点的初始语义特征,所述节点的初始语义特征表征所述节点对应的对象的自身属性信息;将所述节点特征矩阵中不同类型的节点初始语义特征映射至公共特征空间,确定所述多个节点中各个节点的转换特征;基于所述目标节点的转换特征和所述目标节点的各个所述邻居节点的转换特征,确定所述目标节点与所述目标节点的各个所述邻居节点的相似性。5.根据权利要求1-4任一项所述的方法,其特征在于,所述邻居节点的置信度大于或等于预设阈值,则确定所述邻居节点的置信度达标。6.根据权利要求1-5任一项所述的方法,其特征在于,所述将所述置信度达标的各条所述元路径对应的所述目标节点的邻居节点进行聚合,确定各条所述元路径对应的目标节点的节点级嵌入表示,包括:基于节点级的注意力机制确定所述各条所述元路径对应的目标节点的达标的邻居节点的注意力权重;
基于所述各条所述元路径对应的目标节点的达标的邻居节点的注意力权重,对所述置信度达标的各条所述元路径对应的所述目标节点的邻居节点进行聚合,确定各条所述元路径对应的目标节点的节点级嵌入表示。7.根据权利要求1-6任一项所述的方法,其特征在于,所述将各条所述元路径对应的目标节点的节点级嵌入表示进行聚合,确定所述目标节点的语义级嵌入表示,包括:基于语义级的注意力机制确定所述各条元路径对应的目标节点的节点级嵌入表示的注意力权重;基于所述各条元路径对应的目标节点的节点级嵌入表示的注意力权重,对所述各条元路径对应的目标节点的节点级嵌入表示进行聚合,确定所述目标节点的语义级嵌入表示。8.根据权利要求1-7任一项所述的方法,其特征在于,所述目标业务的预测任务包括节点分类预测任务、链接预测任务、聚类任务、推荐任务、异常检测任务中的一个或多个。9.一种基于异质图神经网络的数据处理装置,其特征在于,包括:获取模块,用于获取目标业务的异质图信息,所述异质图包括多个节点和表征多个节点连接关系的连接边,所述多个节点中包括多种类型的节点,所述多个节点中不同类型的节点表示所述目标业务的业务数据中不同类型的对象;第一确定模块,用于基于多条元路径,确定各条所述元路径对应的目标节点的邻居节点;第二确定模块,用于基于各条所述元路径对应的所述目标节点与所述目标节点的各个所述邻居节点的转移概率,以及所述目标节点与所述目标节点的各个所述邻居节点的相似性,确定各条所述元路径对应的所述目标节点的各个所述邻居节点的置信度;节点级聚合模块,用于将所述置信度达标的各条所述元路径对应的所述目标节点的邻居节点进行聚合,确定各条所述元路径对应的目标节点的节点级嵌入表示;语义级聚合模块,用于将各条所述元路径对应的目标节点的节点级嵌入表示进行聚合,确定所述目标节点的语义级嵌入表示,所述语义级嵌入表示用于实现所述目标业务的预测任务。10.根据权利要求9所述的装置,其特征在于,所述第二确定模块具体用于,基于所述各条所述元路径对应的所述目标节点与所述目标节点的各个所述邻居节点的转移概率,确定所述各条所述元路径对应的所述目标节点的各个所述邻居节点的先验置信度;基于所述各条所述元路径对应的所述目标节点的各个所述邻居节点的先验置信度和所述目标节点与所述目标节点的各个所述邻居节点的相似性,确定各条所述元路径对应的所述目标节点的各个所述邻居节点的置信度。11.根据权利要求9或10所述的装置,其特征在于,所述各条所述元路径对应的所述目标节点与各个所述邻居节点的转移概率基于所述目标节点与所述目标节点的各个所述邻居节点的转移频率确定。12.根据权利要求9-11任一项所述的装置,其特征在于,所述异质图信息包括节点特征矩阵,所述节点特征矩阵包括所述多个节点中各个节点的初始语义特征,所述节点的初始语义特征表征所述节点对应的对象的自身属性信息;将所述节点特征矩阵中不同类型的节点初始语义特征映射至公共特征空间,确定所述多个节点中各个节点的转换特征;
基于所述目标节点的转换特征和所述目标节点的各个所述邻居节点的转换特征,确定所述目标节点与所述目标节点的各个所述邻居节点的相似性。13.根据权利要求9-12任一项所述的装置,其特征在于,所述邻居节点的置信度大于或等于预设阈值,则确定所述邻居节点的置信度达标。14.根据权利要求9-13任一项所述的装置,其特征在于,所述节点级聚合模块具体用于,基于节点级的注意力机制确定所述各条所述元路径对应的目标节点的达标的邻居节点的注意力权重;基于所述各条所述元路径对应的目标节点的达标的邻居节点的注意力权重,对所述置信度达标的各条所述元路径对应的所述目标节点的邻居节点进行聚合,确定各条所述元路径对应的目标节点的节点级嵌入表示。15.根据权利要求9-14任一项所述的装置,其特征在于,所述语义级聚合模块具体用于,基于语义级的注意力机制确定所述各条元路径对应的目标节点的节点级嵌入表示的注意力权重;基于所述各条元路径对应的目标节点的节点级嵌入表示的注意力权重,对所述各条元路径对应的目标节点的节点级嵌入表示进行聚合,确定所述目标节点的语义级嵌入表示。16.根据权利要求9-15任一项所述的装置,其特征在于,所述目标业务的预测任务包括节点分类预测任务、链接预测任务、聚类任务、推荐任务、异常检测任务中的一个或多个。17.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有指令,当所述指令被处理器执行时,使得如权利要求1-8任一项所述的方法被实现。18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在被处理器执行时,使得如权利要求1-8任一项所述的方法被实现。
技术总结
本申请提供一种基于异质图神经网络的数据处理方法,包括:获取目标业务的异质图信息,异质图包括多个节点和表征多个节点连接关系的连接边;基于多条元路径,确定各条元路径对应的目标节点的邻居节点;基于各条元路径对应的目标节点与各个邻居节点的转移概率,以及目标节点与各个邻居节点的相似性,确定各条元路径对应的目标节点的各个邻居节点的置信度;将置信度达标的各条元路径对应的目标节点的邻居节点进行聚合,确定各条元路径对应的目标节点的节点级嵌入表示;将各条元路径对应的目标节点的节点级嵌入表示进行聚合,确定目标节点的语义级嵌入表示,语义级嵌入表示用于实现目标业务的预测任务。本申请的异质图神经网络具有很好的鲁棒性。有很好的鲁棒性。有很好的鲁棒性。
技术研发人员:石川 王啸 王桂凤 张梦玫
受保护的技术使用者:华为技术有限公司
技术研发日:2022.02.07
技术公布日:2023/8/21
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种线屑处理装置及衣物护理设备的制作方法 下一篇:一种储能装置及旋转开关的制作方法
