一种基于图卷积神经网络的物品同质图邻域聚合推荐算法

未命名 09-10 阅读:106 评论:0


1.本发明涉及一种基于图卷积神经网络的物品同质图邻域聚合推荐算法,属于推荐系统技术相关领域。


背景技术:

2.在科技革命的信息化程度飞速发展情况下,特别是近年来人工智能技术、物联网技术、云计算技术等不断发展,社会所产生的数据量也在快速地膨胀,全球数据量无限制快速积累,为了有效得化解信息过载带来的影响,学术界、工业界提出了很多不错的解决方案,其中推荐算法是最有效且应用最为广泛的方法之一。推荐算法根据用户和物品间的关系来学习用户的兴趣偏好,从而可以过滤掉绝大多数的无用的物品。
3.协同过滤是推荐算法中应用最广泛的技术,基于物品的协同过滤具备很强的可解释性、实时性和准确性,并且由于推荐场景下大部分数据本质上都是图结构以及图神经网络在聚合低阶与高阶邻域信息上展现出的优势,基于图神经网络的物品协同过滤推荐模型被广泛部署在各种电子商务平台,不仅为用户节约了大量的时间,同时也大大提高了服务商的成交记录,可以在海量商品和服务中为用户推荐更适合用户的商品。
4.但基于图神经网络的物品协同过滤推荐模型面临着图结构建模和邻域信息噪声问题,现有的推荐算法模型都是构建用户-物品交互异质图,但图神经网络更加适用于处理同质图结构数据,并且同质图能够更好的捕捉物品之间的关联信息,另外在图神经网络迭代聚合低阶与高阶邻域协作信息时,邻域信息的噪声会在聚合过程中被放大,这两个问题都限制了基于图神经网络的物品推荐算法的性能,对推荐算法的进一步发展产生了制约,如果无法从数据中高效抽取出有用的信息,也就无法做到高准确率的推荐商品。其次,社会物质生活的不断丰富,人们对商品和服务推荐的个性化有着强烈的需求,因此对图结构数据合理建模以及缓解邻域信息噪声是十分迫切且必要的。


技术实现要素:

5.本发明为解决上述技术问题,提供一种基于图卷积神经网络的物品同质图邻域聚合推荐算法,在图卷积神经网络物品协同过滤推荐模型的基础上,对物品-物品同质图建模,将用户和物品的交互信息编码在物品-物品同质图中,增强了物品与物品之间的关联信息,另外,还通过残差连接因子分解方法缓解模型在聚合高阶邻域信息时潜在噪声对模型性能的影响,提高了模型推荐的效果。
6.为解决上述技术问题,本发明所采用的技术方案是:
7.一种基于图卷积神经网络的物品同质图邻域聚合推荐算法,包括以下的步骤:
8.s1、数据收集,从雅虎音乐,last.fm在线音乐系统,yelp挑战赛搜集用户信息、物品信息和用户对物品的交互信息,三个数据源中的三个信息以文件形式存储在本地磁盘;
9.s2、对收集的数据进行预处理,根据用户信息和物品信息分别对用户和物品建立索引号,根据用户对物品的交互信息,为了保证收集到数据的质量,删除用户与物品交互数
量少于10次的数据;
10.s3、根据用户与物品之间的交互信息,构建用户-物品交互异质图;
11.s4、在构建好的用户-物品交互异质图的基础上,利用图中用户节点和物品节点的连接信息,建模物品-物品同质图,通过xavier初始化方法对用户和物品初始化,分别得到用户和物品的初始化嵌入向量;
12.s5、将物品-物品同质图采用图卷积神经网络,对图中所有的节点进行特征提取,对于每个节点在通过图卷积神经网络后,得到图卷积神经网络生成的特征向量,该向量聚合了该节点的低阶与高阶邻域协作信息;
13.s6、将初始的用户嵌入向量与最终经过图卷积得到物品嵌入向量进行拼接,将初始用户嵌入向量和初始物品嵌入向量进行拼接,分别计算正样本和负样本的交互概率分数;
14.s7、不断更新网络权重,利用bpr损失函数对模型进行优化,使得正确的用户和物品的交互的概率分数即正样本的交互概率分数比错误的用户和物品的交互的概率分数即负样本概率分数更高。
15.本发明技术方案的进一步改进在于:所述s4根据用户-物品交互异质图中用户和物品的连接信息,如果两个物品与同一个用户都有连接,则认为这两个物品互相影响,就将这两个物品连接在一起,构建成一个以物品为中心的同质图。
16.本发明技术方案的进一步改进在于:所述s5的具体操作为:
17.s51、对用户和物品索引进行初始化得到用户和物品初始化嵌入向量;
18.s52、对物品初始化嵌入向量经过图卷积神经网络对每个物品节点迭代聚合其低阶与高阶邻域协作信息,聚合过程计算方法如下:
[0019][0020]
其中,表示物品i经过k层聚合后得到的新的物品表示向量,k表示聚合的层数,nei表示物品i在物品-物品同质图中的邻居节点的集合;
[0021]
s53、聚合函数f
acg
()有两个关键层,物品信息聚合层和物品信息更新层;前者聚合相邻的物品特征,后者更新物品特征,表示物品i相邻物品经过k层聚合后得到的邻域特征向量,物品信息聚合层计算方法如下:
[0022][0023]
其中是对称归一化项,用于防止由于聚合操作引起的规模增大的问题,物品信息更新层采用多个全连接层的方式,计算方法如下:
[0024]
[0025]
其中w
(k)
表示线性变换矩阵,[
·
,
·
]表示特征连接操作,σ()表示激活函数,具体来说使用leakyrelu()激活函数;
[0026]
s54、上述操作得到的为图卷积神经网络生成的每一层物品节点的嵌入向量;
[0027]
s55、在得到每一层物品嵌入向量之后,以每一层物品嵌入向量相加的方式来聚合各层的不同信息从而得到最终的物品嵌入向量计算方法如下:
[0028][0029]
本发明技术方案的进一步改进在于:所述s6的具体操作如下:
[0030]
s61、将初始用户嵌入表示和最终物品嵌入表示拼接为e,将初始物品嵌入表示和初始用户嵌入表示拼接为s,计算方法如下:
[0031][0032][0033]
其中||为concatenate操作;
[0034]
s62、将两个拼接向量利用残差连接因子分解方法计算用户与物品交互概率分数,计算方法如下:
[0035][0036]
其中f
fm
()为因子分解机函数,计算方法如下:
[0037][0038]
其中w表示全局偏差,wj表示e中第j个元素的强度,vj,vk表示的是fm中系数矩阵的第j维,第k维向量,《vj,vk》表示二阶特征交互。
[0039]
本发明技术方案的进一步改进在于:所述s7的具体操作如下:
[0040]
正确的用户和物品的交互的概率分数表示为即正样本的交互概率分数,错误的用户和物品的交互的概率分数表示为即负样本概率分数;
[0041]
对模型进行优化采用bpr损失函数,假设用户交互过的历史物品应该比未交互到的物品分配更高的预测分数,计算方法如下:
[0042][0043]
其中表示由观测到的交互数据组成的训练数据和用户与物品未交互的数据σ()表示sigmoid函数。
[0044]
由于采用了上述技术方案,本发明取得的技术进步是:
[0045]
本发明提供的一种基于图卷积神经网络的物品同质图邻域聚合推荐算法,在图卷积神经网络物品协同过滤推荐模型的基础上,对物品-物品同质图建模,将用户和物品的交互信息编码在物品-物品同质图中,增强了物品与物品之间的关联信息,还通过残差连接因子分解方法缓解模型在聚合高阶邻域信息时潜在噪声对模型性能的影响,提高了模型推荐的效果。
附图说明
[0046]
图1是本发明的算法流程图;
[0047]
图2是本发明的模型图。
具体实施方式
[0048]
下面结合实施例对本发明做进一步详细说明:
[0049]
本实例提供一种基于图卷积神经网络的物品同质图邻域聚合推荐算法,如图1所示,所涉及的模型如图2所示,推荐算法包括如下步骤:
[0050]
s1、数据收集:
[0051]
从雅虎音乐,last.fm在线音乐系统,yelp挑战赛搜集用户信息、物品信息和用户对物品的交互信息,三个数据源中的三个信息以文件形式存储在本地磁盘;
[0052]
s2、数据预处理:
[0053]
根据用户信息和物品信息分别对用户和物品建立索引号,根据用户对物品的交互信息,为了保证收集到数据的质量,删除用户与物品交互数量少于10次的数据;
[0054]
s3、根据用户与物品之间的交互信息,构建用户-物品交互异质图;
[0055]
s4、在构建好的用户-物品交互异质图的基础上,利用图中用户节点和物品节点的连接信息,建模物品-物品同质图,通过xavier初始化方法对用户和物品初始化,分别得到用户和物品的初始化嵌入向量;
[0056]
其中,根据用户-物品交互异质图中用户和物品的连接信息,如果两个物品它们与同一个用户都有连接,则认为这两个物品互相影响,就将这两个物品连接在一起,构建成一个以物品为中心的同质图;
[0057]
s5、将物品-物品同质图采用图卷积神经网络,对图中所有的节点进行特征提取,对于每个节点在通过图卷积神经网络后,得到图卷积神经网络生成的特征向量,该向量聚合了该节点的低阶与高阶邻域协作信息;
[0058]
s51、对用户和物品索引进行初始化得到用户和物品初始化嵌入向量;
[0059]
s52、对物品初始化嵌入向量经过图卷积神经网络对每个物品节点迭代聚合其低阶与高阶邻域协作信息,聚合过程计算方法如下:
[0060][0061]
其中表示物品i经过k层聚合后得到的新的物品表示向量,k表示聚合的层数,nei表示物品i在物品-物品同质图中的邻居节点的集合;
[0062]
s53、聚合函数f
acg
()有两个关键层,物品信息聚合层和物品信息更新层。前者聚合
相邻的物品特征,后者更新物品特征,表示物品i相邻物品经过k层聚合后得到的邻域特征向量,物品信息聚合层计算方法如下:
[0063][0064]
其中是对称归一化项,用于防止由于聚合操作引起的规模增大的问题,物品信息更新层采用多个全连接层的方式,计算方法如下:
[0065][0066]
其中w
(k)
表示线性变换矩阵,[
·
,
·
]表示特征连接操作,σ()表示激活函数,具体来说使用leakyrelu()激活函数;
[0067]
s54、上述操作得到的为图卷积神经网络生成的每一层物品节点的嵌入向量;
[0068]
s55、在得到每一层物品嵌入向量之后,本文以每一层物品嵌入向量相加的方式来聚合各层的不同信息从而得到最终的物品嵌入向量计算方法如下:
[0069][0070]
s6、将初始的用户嵌入向量与最终经过图卷积得到物品嵌入向量进行拼接,将初始用户嵌入向量和初始物品嵌入向量进行拼接,分别计算正样本和负样本的交互概率分数;
[0071]
进一步的,步骤s6的具体过程为:
[0072]
s61、初始用户嵌入表示和最终物品嵌入表示将其拼接为e,将初始物品嵌入表示和初始用户嵌入表示拼接为s,计算方法如下:
[0073][0074][0075]
其中||为concatenate操作;
[0076]
s62、将两个拼接向量利用残差连接因子分解方法计算用户与物品交互概率分数,计算方法如下:
[0077]
[0078]
其中f
fm
()为因子分解机函数,计算方法如下:
[0079][0080]
其中w表示全局偏差,wj表示e中第j个元素的强度,vj,vk表示的是fm中系数矩阵的第j维,第k维向量,《vj,vk》表示二阶特征交互;
[0081]
s7、不断更新网络权重,利用bpr损失函数对模型进行优化,使得正确的用户和物品的交互的概率分数比错误的用户和物品的交互的概率分数更高,也就是正样本的交互概率分数比负样本的交互概率分数更高。
[0082]
其中,正确的用户和物品的交互的概率分数表示为即正样本的交互概率分数,错误的用户和物品的交互的概率分数表示为即负样本概率分数;
[0083]
对模型进行优化采用bpr损失函数,它假设用户交互过的历史物品应该比未交互到的物品分配更高的预测分数,计算方法如下:
[0084][0085]
其中表示由观测到的交互数据组成的训练数据和用户与物品未交互的数据σ()表示sigmoid函数。
[0086]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

技术特征:
1.一种基于图卷积神经网络的物品同质图邻域聚合推荐算法,其特征在于:包括以下的步骤:s1、数据收集,从雅虎音乐,last.fm在线音乐系统,yelp挑战赛搜集用户信息、物品信息和用户对物品的交互信息,三个数据源中的三个信息以文件形式存储在本地磁盘;s2、对收集的数据进行预处理,根据用户信息和物品信息分别对用户和物品建立索引号,根据用户对物品的交互信息,为了保证收集到数据的质量,删除用户与物品交互数量少于10次的数据;s3、根据用户与物品之间的交互信息,构建用户-物品交互异质图;s4、在构建好的用户-物品交互异质图的基础上,利用图中用户节点和物品节点的连接信息,建模物品-物品同质图,通过xavier初始化方法对用户和物品初始化,分别得到用户和物品的初始化嵌入向量;s5、将物品-物品同质图采用图卷积神经网络,对图中所有的节点进行特征提取,对于每个节点在通过图卷积神经网络后,得到图卷积神经网络生成的特征向量,该向量聚合了该节点的低阶与高阶邻域协作信息;s6、将初始的用户嵌入向量与最终经过图卷积得到物品嵌入向量进行拼接,将初始用户嵌入向量和初始物品嵌入向量进行拼接,分别计算正样本和负样本的交互概率分数;s7、不断更新网络权重,利用bpr损失函数对模型进行优化,使得正确的用户和物品的交互的概率分数即正样本的交互概率分数比错误的用户和物品的交互的概率分数即负样本概率分数更高。2.根据权利要求1所述的一种基于图卷积神经网络的物品同质图邻域聚合推荐算法,其特征在于:所述s4根据用户-物品交互异质图中用户和物品的连接信息,如果两个物品与同一个用户都有连接,则认为这两个物品互相影响,就将这两个物品连接在一起,构建成一个以物品为中心的同质图。3.根据权利要求1所述的一种基于图卷积神经网络的物品同质图邻域聚合推荐算法,其特征在于:所述s5的具体操作为:s51、对用户和物品索引进行初始化得到用户和物品初始化嵌入向量;s52、对物品初始化嵌入向量经过图卷积神经网络对每个物品节点迭代聚合其低阶与高阶邻域协作信息,聚合过程计算方法如下:其中,表示物品i经过k层聚合后得到的新的物品表示向量,k表示聚合的层数,ne
i
表示物品i在物品-物品同质图中的邻居节点的集合;s53、聚合函数f
acg
()有两个关键层,物品信息聚合层和物品信息更新层;前者聚合相邻的物品特征,后者更新物品特征,表示物品i相邻物品经过k层聚合后得到的邻域特征向量,物品信息聚合层计算方法如下:
其中是对称归一化项,用于防止由于聚合操作引起的规模增大的问题,物品信息更新层采用多个全连接层的方式,计算方法如下:其中w
(k)
表示线性变换矩阵,[
·
,
·
]表示特征连接操作,σ()表示激活函数,具体来说使用leakyrelu()激活函数;s54、上述操作得到的为图卷积神经网络生成的每一层物品节点的嵌入向量;s55、在得到每一层物品嵌入向量之后,以每一层物品嵌入向量相加的方式来聚合各层的不同信息从而得到最终的物品嵌入向量计算方法如下:4.根据权利要求1所述的一种基于图卷积神经网络的物品同质图邻域聚合推荐算法,其特征在于:所述s6的具体操作如下:s61、将初始用户嵌入表示和最终物品嵌入表示拼接为e,将初始物品嵌入表示和初始用户嵌入表示拼接为s,计算方法如下:拼接为s,计算方法如下:其中||为concatenate操作;s62、将两个拼接向量利用残差连接因子分解方法计算用户与物品交互概率分数,计算方法如下:其中f
fm
()为因子分解机函数,计算方法如下:其中w表示全局偏差,w
j
表示e中第j个元素的强度,v
j
,v
k
表示的是fm中系数矩阵的第j维,第k维向量,<v
j
,v
k
>表示二阶特征交互。5.根据权利要求1所述的一种基于图卷积神经网络的物品同质图邻域聚合推荐算法,其特征在于:所述s7的具体操作如下:
正确的用户和物品的交互的概率分数表示为即正样本的交互概率分数,错误的用户和物品的交互的概率分数表示为即负样本概率分数;对模型进行优化采用bpr损失函数,假设用户交互过的历史物品应该比未交互到的物品分配更高的预测分数,计算方法如下:其中表示由观测到的交互数据组成的训练数据和用户与物品未交互的数据σ()表示sigmoid函数。6.根据权利要求1所述的一种基于图卷积神经网络的物品同质图邻域聚合推荐算法,其特征在于:在图卷积神经网络物品协同过滤推荐模型的基础上,对物品-物品同质图建模,将用户和物品的交互信息编码在物品-物品同质图中,增强了物品与物品之间的关联信息,还通过残差连接因子分解方法缓解模型在聚合高阶邻域信息时潜在噪声对模型性能的影响,提高了模型推荐的效果。

技术总结
本发明公开了一种基于图卷积神经网络的物品同质图邻域聚合推荐算法,利用公开的用户与物品的交互信息数据集,生成用户与物品的交互异质图图,根据用户与物品的交互信息,构建物品-物品交互同质图,在获得以物品为中心的同质图后,利用图卷积神经网络迭代聚合低阶与高阶邻域协作信息,从而使得物品的表示更加丰富,从而获得每个物品的嵌入表示,将用户的嵌入表示与物品的嵌入表示结合,通过残差连接因式分解缓解邻域协作信息的噪声影响,生成用户-物品交互概率得分,从而得到模型的推荐结果。果。果。


技术研发人员:宫继兵 寇肖萌
受保护的技术使用者:燕山大学
技术研发日:2023.06.25
技术公布日:2023/9/7
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐