针对多目标的调参方法、装置、设备及计算机存储介质与流程
未命名
08-05
阅读:202
评论:0

1.本技术涉及计算机处理技术领域,尤其涉及一种针对多目标的调参方法、装置、设备及计算机存储介质。
背景技术:
2.目前,推荐系统是通过向用户推荐用户感兴趣的物料实现用户增长的目的,推荐系统在为用户推荐物料的过程中,会预测出候选物料的点击率预测值、互动率预测值、观看时长预测值等,并基于融合参数向量对上述预测值进行加权求和,以得到候选物料的融合预测分,然后再根据该融合预测分向用户进行物料推荐。为更好的探索用户兴趣倾向,在每一次物料推荐过程中都会根据用户的历史行为信息更新融合参数向量。
3.目前,推荐系统的调参算法产生的新的融合参数向量可能会陷入局部最优点,无法再寻优出更优的融合参数向量,影响推荐系统的推荐准确率。
技术实现要素:
4.本技术提供一种针对多目标的调参方法、装置、设备及计算机存储介质,能够提高融合参数向量寻优的效率和速度,实现更精准的物料推荐。
5.本技术的技术方案是这样实现的:
6.本技术提供一种针对多目标的调参方法,该方法包括:采集多个用户对推荐物料的历史行为信息;根据历史行为信息,确定融合网络的n组融合参数向量中的每一组融合参数向量对应的收益参数向量,融合网络基于融合参数向量对候选物料的x个目标的预测值进行融合,收益参数向量用于表示用户对推荐物料的感兴趣程度,n、x为大于或者等于2的整数;确定每一组融合参数向量与每一组融合参数向量对应的收益参数向量的相关系数;确定n组融合参数向量对应的n组收益参数向量中的第一收益参数向量与每一组第二收益参数向量之间的增量向量,第一收益参数向量为n组收益参数向量中的最优收益参数向量,第二收益参数向量为除最优收益参数向量之外的其他组收益参数向量;基于每一组增量向量,更新对应于每一组第二收益参数向量的融合参数向量的均值向量;根据更新后的均值向量和相关系数,更新n组融合参数向量。
7.在一些可能的实施方式中,确定每一组融合参数向量与每一组融合参数向量对应的收益参数向量的相关系数,包括:对每一组融合参数向量中的x个参数和每一组融合参数向量对应的收益参数向量中的x个参数进行皮尔逊相关系数计算,得到x个相关系数组,其中,x个相关系数组中的每一个相关系数组都包括x个相关系数。
8.在一些可能的实施方式中,确定n组融合参数向量对应的n组收益参数向量中的第一收益参数向量与每一组第二收益参数向量之间的增量向量,包括:针对任一组第二收益参数向量,通过计算第二收益参数向量中的x个参数相对于第一收益参数向量中的x个参数的增量,得到第一收益参数向量与第二收益参数向量之间的增量向量。
9.在一些可能的实施方式中,针对任一组第二收益参数向量,通过计算第二收益参
数向量中的x个参数相对于第一收益参数向量中的x个参数的增量,得到第一收益参数向量与第二收益参数向量之间的增量向量满足以下表达式(1):
[0010][0011]
式中,δri为第i组增量向量,1≤i≤n-1,r
ai
,r
bi
,
…
,r
xi
为第i组第二收益参数向量中的x个参数,r
a0
,r
b0
,
…
,r
x0
为第一收益参数向量中的x个参数,[δr
ai
,δr
bi
,
…
,δr
xi
]为第i组增量向量中的x个参数。
[0012]
在一些可能的实施方式中,基于每一组增量向量,更新对应于每一组第二收益参数向量的融合参数向量的均值向量,包括:针对任一组增量向量,采集增量向量中的x个参数的值;将增量向量中的x个参数中的最大值减去最小值,得到更新后的均值向量。
[0013]
在一些可能的实施方式中,第一收益参数向量对应于n组融合参数向量中的第一融合参数向量,每一组第二收益参数向量对应于n组融合参数向量中除第一融合参数向量之外的每一组第二融合参数向量;根据更新后的均值向量和相关系数,更新n组融合参数向量,包括:根据更新后的均值向量和x个相关系数组,计算更新后的每一组第二融合参数向量中的x个参数的值;基于更新后的各组第二融合参数向量和第一融合参数向量,得到更新后的n组融合参数向量。
[0014]
在一些可能的实施方式中,根据更新后的均值向量和x个相关系数组,计算更新后的每一组第二融合参数向量中的x个参数的值满足以下表达式(2):
[0015][0016]
式中,ai'、bi'、
…
、xi'为更新后的n-1组第二融合参数向量中的第i组第二融合参数向量中的x个参数的值,1≤i≤n-1,ai、bi、
…
、xi为n-1组第二融合参数向量中的第i组第二融合参数向量中的x个参数的值,μ
ai
',μ
bi
',
…
,μ
xi
'为更新后的第i组均值向量中的x个参数的值,ρ
(a,r)
为每一组融合参数向量中的第1个参数和每一组融合参数向量对应的收益参数向量中的x个参数的相关系数组,ρ
(b,r)
为每一组融合参数向量中的第2个参数和每一组融合参数向量对应的收益参数向量中的x个参数的相关系数组,ρ
(x,r)
为每一组融合参数向量中的第x个参数和每一组融合参数向量对应的收益参数向量中的x个参数的相关系数组,其中,r
min
为收益参数向量的x个参数中的最小值,r
max
为收益参数向量的x个参数中的最大值。
[0017]
本技术提供一种针对多目标的调参装置,设置于推荐系统中,该装置包括:数据采集模块,用于采集多个用户对推荐物料的历史行为信息;数据处理模块,用于根据历史行为信息,确定融合网络的n组融合参数向量中的每一组融合参数向量对应的收益参数向量,融合网络基于融合参数向量对候选物料的x个目标的预测值进行融合,收益参数向量用于表
示用户对推荐物料的感兴趣程度,n、x为大于或者等于2的整数;确定每一组融合参数向量与每一组融合参数向量对应的收益参数向量的相关系数;确定n组融合参数向量对应的n组收益参数向量中的第一收益参数向量与每一组第二收益参数向量之间的增量向量,第一收益参数向量为n组收益参数向量中的最优收益参数向量,第二收益参数向量为除最优收益参数向量之外的其他组收益参数向量;更新模块,用于基于每一组增量向量,更新对应于每一组第二收益参数向量的融合参数向量的均值向量;根据更新后的均值向量和相关系数,更新n组融合参数向量。
[0018]
在一些可能的实施方式中,数据处理模块,还用于对每一组融合参数向量中的x个参数和每一组融合参数向量对应的收益参数向量中的x个参数进行皮尔逊相关系数计算,得到x个相关系数组,其中,x个相关系数组中的每一个相关系数组都包括x个相关系数。
[0019]
在一些可能的实施方式中,数据处理模块,还用于针对任一组第二收益参数向量,通过计算第二收益参数向量中的x个参数相对于第一收益参数向量中的x个参数的增量,得到第一收益参数向量与第二收益参数向量之间的增量向量。
[0020]
在一些可能的实施方式中,通过计算第二收益参数向量中的x个参数相对于第一收益参数向量中的x个参数的增量,得到增量向量满足表达式(1)。
[0021]
在一些可能的实施方式中,数据采集模块,还用于针对任一组增量向量,采集增量向量中的x个参数的值;数据处理模块,还用于将增量向量中的x个参数中的最大值减去最小值,得到更新后的均值向量。
[0022]
在一些可能的实施方式中,第一收益参数向量对应于n组融合参数向量中的第一融合参数向量,每一组第二收益参数向量对应于n组融合参数向量中除第一融合参数向量之外的每一组第二融合参数向量;数据处理模块,还用于根据更新后的均值向量和x个相关系数组,计算更新后的每一组第二融合参数向量中的x个参数的值;更新模块,还用于基于更新后的各组第二融合参数向量和第一融合参数向量,得到更新后的n组融合参数向量。
[0023]
在一些可能的实施方式中,根据更新后的均值向量和x个相关系数组,计算更新后的n-1组第二融合参数向量中的x个参数的值满足表达式(2)。
[0024]
本技术提供一种电子设备,包括:存储器,用于存储可执行指令;处理器,用于执行所述存储器中存储的可执行指令时,以实现本技术提供的方法。
[0025]
本技术提供一种计算机存储介质,存储有可执行指令,用于可执行指令被处理器执行时,以实现本技术提供的方法。
[0026]
本技术提供一种计算机程序产品,包括计算机程序或指令,用于计算机程序或指令被处理器执行时,以实现本技术提供的方法。
[0027]
本技术具有以下有益效果:
[0028]
本技术通过计算每一组融合参数向量与每一组融合参数向量对应的收益参数向量的相关系数以及计算n组融合参数向量对应的n组收益参数向量中的第一收益参数向量与第二收益参数向量的增量向量,来更新均值向量,可以提升数据涨幅最小的目标类型以及抑制数据涨幅最大的目标类型,实现探索方向的确定性;另外,根据更新后的均值向量和相关系数,更新n组融合参数向量,使得融合参数的更新步长取决于更新后的均值向量以及相关系数,融合参数的更新步长可以灵活调整,避免参数组陷入局部最优点,进而使得更新后的融合参数向量更能表达用户的兴趣倾向,实现更精准的物料推荐。
附图说明
[0029]
图1是本技术实施例提供的推荐系统的一种架构示意图;
[0030]
图2是本技术实施例提供的电子设备的一种结构示意图;
[0031]
图3是本技术实施例提供的推荐系统的信息流推荐流程的一种示意图;
[0032]
图4是本技术实施例提供的针对多目标的调参方法的一种流程示意图;
[0033]
图5是本技术实施例提供的针对多目标的调参方法的一个可选的流程示意图;
[0034]
图6是本技术实施例提供的针对多目标的调参方法的一个可选的流程示意图;
[0035]
图7是本技术实施例提供的调参方法应用于社交应用软件的一个流程示意图。
具体实施方式
[0036]
为了使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术作进一步地详细描述,所描述的实施例不应视为对本技术的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
[0037]
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
[0038]
如果申请文件中出现“第一/第二”的类似描述则增加以下的说明,在以下的描述中,所涉及的术语“第一/第二/第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一/第二/第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本技术实施例能够以除了在这里图示或描述的以外的顺序实施。
[0039]
除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本技术实施例的目的,不是旨在限制本技术。
[0040]
在信息流推荐系统中,用户对物料的兴趣偏好程度的表述行为有:浏览、点击、互动、投诉等,推荐系统需要预测用户的潜在兴趣偏好倾向,并权衡多种表述行为的可能性,从而对物料进行综合排序,提高用户体验质量,提升物料推荐的精准度。常见的推荐目标包括但不限于用户对于物料发生点击行为的概率(下称点击率)、发生互动行为的概率(下称互动率)和用户的消费时长(下称观看时长),推荐系统会分别预测用户对物料的点击率、互动率、消费时长,并基于一组固定的参数对各个预测分加权求和,得到物料评估总分,基于总分对候选物料进行排序。
[0041]
目前,推荐系统中的融合网络一般针对点击率、互动率和观看时长这三个推荐目标设定一组固定的融合参数向量w=(a,b,c),a是点击率的融合参数,b是互动率的融合参数,c是观看时长的融合参数。假设上述融合参数为高斯分布,设置两个向量,即均值向量μ=(μa,μb,μc)和方差向量σ=(σa,σb,σc)。更新融合参数向量的具体流程如下:(1)、推荐系统基于w、μ和σ对融合参数进行高斯随机采样,得到n组融合参数向量(也可以称为探索向量):w1,w2,w3,
…
,wn;(2)、推荐系统将每个用户随机映射到某一组探索向量中,并结合用户对物料的点击率、互动率、观看时长等推荐目标的预测分值,以加权求和的方式得到物料评估总分s,s=a
×
点击率预测值+b
×
互动率预测值+c
×
消费时长预测值;(3)、推荐系统收集推荐系统分发的n组融合参数向量和用户行为日志,分别计算每组融合参数向量带来的收益,并
选取收益最高的k组融合参数向量对应的收益参数向量(k《n),基于k组收益参数向量分别计算新的均值向量μ'和方差向量σ';(4)、将第一步中的w更新为w1,w2,w3,
…
,wn中收益最大的一组融合参数向量,μ和σ分别更新为μ'和σ';(5)重复步骤(1)至(4)。通过以上步骤,可以实现在线调整多目标融合参数。
[0042]
在上述调参过程中,通过随机采样的方式来探索新的参数向量组,如基于初始的融合参数向量w=(a,b,c)进行随机采样,得到新参数向量w1=(a1,b1,c1)。其中,a1可能大于a(下称正方向),也可能小于a(下称负方向),概率均为0.5,这说明探索方向具有不确定性。此外,一个融合参数向量中a、b、c共可形成8种不同的采样方向组合。理论上存在一组收益最高的最优参数向量w0=[a0,b0,c0],w0相对于w而言,各参数的方向是确定的。但是,根据上述w1可知,通过上述调参过程产生的探索向量,仅有八分之一的概率与最优参数向量方向相同,降低了探索的有效性。另外,探索参数向量中每个参数与初始融合参数向量的距离(即更新步长γ=(γa,γb,γc),γa=a
1-a,γb=b
1-b,γc=c
1-c)与σ有关,σ是基于收益最高的k组融合参数向量计算而来,这k组融合参数向量可能会陷入局部最优点,导致更新步长有限,无法跳出局部最优点,使得调参算法无法再寻优出更优的融合参数向量组,进而影响推荐系统的推荐准确率。
[0043]
针对上述问题,本技术实施例提供一种针对多目标的调参方法、装置、设备及计算机存储介质,能够提高融合参数向量寻优的效率和速度,实现更精准的物料推荐,下面说明本技术实施例提供的电子设备的示例性应用,本技术实施例提供的设备可以实施为笔记本电脑,平板电脑,台式计算机,移动设备(例如,移动电话,可穿戴智能手表,专用消息设备)等各种类型的用户终端,也可以实施为服务器。下面,将说明电子设备实施为服务器时的示例性应用。
[0044]
参见图1,图1是本技术实施例提供的推荐系统的一种架构示意图,为实现本技术实施例所述的调参方法,电子设备(示例性示出了电子设备400-1和电子设备400-2)通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合。
[0045]
在一些可能的实施方式中,用户a可以通过电子设备400-1发布物料信息a,用户b可以通过电子设备400-2发布物料信息b。物料信息a和物料信息b通过网络300上传至服务器200。服务器200可以将物料信息a和物料信息b存储至数据库500中。为了实现对用户的精准推荐,服务器200可以经过神经网络的处理,将与用户的兴趣匹配程度最高的物料信息推荐给用户,推荐给用户的物料信息可以在电子设备400的图形界面410(示例性示出了图形界面410-1和图形界面410-2)显示。
[0046]
在一些实施例中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务以及大数据和人工智能平台等基础云计算服务的云服务器。电子设备400可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本发明实施例中不做限制。
[0047]
参见图2,图2是本技术实施例提供的电子设备的一种结构示意图,图2所示的电子设备400包括:至少一个处理器410、存储器450、至少一个网络接口420和用户接口430。电子设备400中的各个组件通过总线系统440耦合在一起。可理解,总线系统440用于实现这些组
logic device,cpld)、现场可编程门阵列(field-programmable gate array,fpga)或其他电子元件。
[0059]
下面将结合本技术实施例提供的电子设备的示例性应用和实施,说明本技术实施例提供的调参方法。
[0060]
在说明本技术实施例所述的针对多目标的调参方法之前,先对本技术实施例中的针对多目标的调参方法在推荐系统的信息流中的流程进行说明。参见图3,图3是本技术实施例提供的推荐系统的信息流推荐流程的一种示意图,下面将结合图3示出的推荐系统的推荐流程进行说明。
[0061]
需要说明的是,本技术实施例中提及的目标为推荐目标。
[0062]
s101,推荐系统接收来自用户的物料推荐请求。
[0063]
s102,推荐系统根据用户个人兴趣偏好,从大量候选物料中筛选一批符合用户兴趣的物料。
[0064]
s103,推荐系统对筛选后的物料进行点击率、互动率和观看时长的预测,得到点击率预测值、互动率预测值和观看时长预测值。
[0065]
s104,推荐系统基于点击率预测值、互动率预测值、观看时长预测值以及融合参数向量(即w=(a,b,c),以加权求和的方式得到融合预估值s,即:s=a
×
点击率预测值+b
×
互动率预测值+c
×
观看时长预测值。
[0066]
s105,推荐系统根据融合预估值s分别对每个候选物料进行排序,分数从大到小筛选出规定数量的推荐物料。
[0067]
s106,推荐系统将排序筛选后的候选物料曝光给用户。
[0068]
s107,推荐系统将用户对推荐物料的行为、用户对应的融合参数向量等信息进行关联保存。
[0069]
s108,推荐系统基于收集的日志,根据本技术实施例提供的针对多目标的调参方法对融合参数向量进行更新,计算出新的融合参数向量,供下一次目标融合使用。
[0070]
需要说明的是,上述候选物料是还未给用户推荐的物料,即还在候选池中储备的即将推荐给用户的物料;而推荐物料则是已经给用户推荐,已经产生用户行为的物料。
[0071]
在一些可能的实施方式中,参见图4,图4是本技术实施例提供的针对多目标的调参方法(下称调参方法)的一种流程示意图,图4所示的针对多目标的调参方法为图3中的推荐系统的推荐流程中的s108,下面将结合图4示出的步骤s201至s203进行说明。
[0072]
s201,采集多个用户对推荐物料的历史行为信息。
[0073]
在一些实施例中,调参装置在调整融合网络的参数(即融合参数向量)时,会从多个用户的行为日志中采集这多个用户对推荐物料的历史行为信息。在一实施例中,历史行为信息可以包括但不限于:点击、互动、观看时长等。其中,多个用户是与n组融合参数向量对应的,即每个用户都有与之对应的融合参数向量。因为用户的数量更为庞大,所以,多个用户和n组融合参数向量通常是以多对一的形式形成映射关系的。
[0074]
在一实施例中,推荐系统中的融合网络是基于上述融合参数向量对候选物料的x个目标的预测值进行融合,得到候选物料的融合预估值,并储存在服务器的数据库中,排序模型在对候选物料进行排序时,直接从数据库中获取上述融合预估值,并基于融合预估值向用户进行物料推荐。
[0075]
在一些可能的实施方式中,在步骤s201执行之前,调参装置还可以基于预设的均值向量和方差向量,得到n组融合参数向量。
[0076]
在一些实施例中,调参装置可以对预设的均值向量和方差向量进行高斯随机采样,得到n组融合参数向量。这里,具体描述可以参见上述调参流程中的步骤(1)。
[0077]
在一示例中,假设推荐系统对候选物料的3个目标进行融合(即x=3),其中,上述目标分别为点击率、互动率和观看时长。均值向量的初始化值为μ=(μa,μb,μc),其中,μa=2,μb=2,μc=2;方差向量的初始化值为σ=(σa,σb,σc),其中,σa=0.04,σb=0.04,σc=0.04,对均值向量和方差向量进行高斯随机采样,得到n组融合参数向量,融合参数向量为w=(a,b,c),那么,n组融合参数向量分别为w1,w2,w3,
…
,wn;在上述向量中,a对应于点击率,b对应于互动率,c对应于观看时长。
[0078]
在一些可能的实施方式中,调参装置可以基于融合参数向量,以加权求和的方式对候选物料的x个目标的预测值进行融合,以得到融合预估值;其中,计算融合预估值的表达式如下:
[0079]
s=a
×
点击率预测值+b
×
互动率预测值+c
×
观看时长预测值
ꢀꢀ
(3)
[0080]
式中,s为融合预估值,a为点击率的融合参数,b为互动率的融合参数,c为观看时长的融合参数。
[0081]
需要说明的是,上述表达式(3)是候选物料的目标为点击率、互动率和观看时长时的示例,但不限于上述3个目标。计算融合预估值的表达式为多个融合参数分别与对应于该融合参数的目标的预测值相乘,并将这多个相乘的结果相加。
[0082]
s202,根据历史行为信息,确定融合网络的n组融合参数向量中的每一组融合参数向量对应的收益参数向量,所述融合网络基于所述融合参数向量对候选物料的x个目标的预测值进行融合。其中,收益参数向量用于表示用户对推荐物料的感兴趣程度,n、x为大于或者等于2的整数。
[0083]
在一些实施例中,推荐系统在得到融合网络计算的候选物料的x个目标的融合预估值之后,根据该融合预估值对用户进行物料推荐。此时,调参装置可以根据用户对推荐物料的行为信息(该行为信息可以从用户行为日志中获取),确定与融合参数向量对应的收益参数向量。在一实施例中,收益参数向量可以包括但不限于用户在预设时长内对推荐物料的点击率、互动率、观看时长等参数,收益参数向量可以表示用户对推荐物料的感兴趣程度。
[0084]
在一示例中,假设用户数量为6,分别为用户a、用户b、用户c、用户d、用户e和用户f,融合参数向量的数量为3,分别为w1、w2和w3,其中,用户a和用户b对应于w1,用户c和用户d对应于w2,用户e和用户f对应于w3。推荐系统基于上述融合参数向量为上述用户进行物料推荐之后,推荐系统中的调参装置可以采集用户a、用户b、用户c、用户d、用户e和用户f的用户行为日志,获取这些用户在7日内对推荐物料的点击率、互动率和观看时长,以获得相应的收益参数向量。其中,w1对应的收益参数向量为r1=(r
a1
,r
b2
,r
c1
),r
a1
为用户a和用户b在7日内对推荐物料的点击率,r
b1
为用户a和用户b在7日内对推荐物料的互动率,r
c1
为用户a和用户b在7日内对推荐物料的观看时长,w2对应的收益参数向量为r2=(r
a2
,r
b2
,r
c2
),r
a2
为用户c和用户d在7日内对推荐物料的点击率,r
b2
为用户c和用户d在7日内对推荐物料的互动率,r
c2
为用户c和用户d在7日内对推荐物料的观看时长,w3对应的收益参数向量为r3=(r
a3
,r
b3
,rc3
),r
a3
为用户e和用户f在7日内对推荐物料的点击率,r
b3
为用户e和用户f在7日内对推荐物料的互动率,r
c3
为用户e和用户f在7日内对推荐物料的观看时长。
[0085]
s203,确定每一组融合参数向量与每一组融合参数向量对应的收益参数向量的相关系数。
[0086]
在一些实施例中,调参装置在确定收益参数向量后,可以对每一组融合参数向量与每一组融合参数向量对应的收益参数向量进行线性相关计算,以确定每一组融合参数向量与每一组融合参数向量对应的收益参数向量的相关系数。
[0087]
在一些可能的实施方式中,上述s203可以包括:对每一组融合参数向量中的x个参数和每一组融合参数向量对应的收益参数向量中的x个参数进行皮尔逊相关系数计算,得到x个相关系数组,其中,x个相关系数组中的每一个相关系数组都包括x个相关系数。
[0088]
在一示例中,融合参数向量w1=(a,b,c),w1对应的收益参数向量为r1=(r
a1
,r
b1
,r
c1
),调参装置对w1和r1中的参数做皮尔逊相关系数计算,计算公式如下:
[0089][0090]
式中,ρ
(x,y)
为w1和r1的相关系数,x的取值为(a,b,c)中的任意一个参数,y的取值为(r
a1
,r
b1
,r
c1
)中的任意一个参数,cov(x,y)为x和y的协方差,σ
x
σy为x和y的标准差的乘积。
[0091]
如此,通过公式(4)可以得到3个相关系数组,其中,每个相关系数组中都有三个相关系数,分别为和
[0092]
需要说明的是,在本技术实施例中,引入了皮尔逊相关系数计算,可以度量融合参数向量和收益参数向量之间的相关性,得到的相关系数的值在1至-1之间,相关系数的越大,相关性越高,其中,相关系数的值大于0是正相关,小于0是负相关。
[0093]
s204,确定n组融合参数向量对应的n组收益参数向量中的第一收益参数向量与每一组第二收益参数向量之间的增量向量。
[0094]
其中,第一收益参数向量为n组收益参数向量中的最优收益参数向量,第二收益参数向量为除最优收益参数向量之外的其他组收益参数向量。
[0095]
在一些实施例中,n组收益参数向量中最优的一组收益参数向量可以记为第一收益参数向量,其它n-1组收益参数向量可以记为第二收益参数向量,调参装置在确定第一收益参数向量和第二收益参数向量之后,计算n-1组第二收益参数向量相对于第一收益参数向量的n-1组增量向量。
[0096]
在一些可能的实施方式中,调参装置可以根据n个收益参数向量中的每一个收益参数向量的参数之间的差值,确定第一收益参数向量和第二收益参数向量。
[0097]
在一示例中,假设有4个收益参数向量,分别为r1=(0.85,0.95,3),r2=(0.93,0.85,2.5),r3=(0.89,0.92,3),r4=(0.82,0.92,2),其中,收益参数向量中的第1个参数表示7日内用户对推荐物料的点击率,第2个参数表示7日内用户对推荐物料的互动率,第3个参数表示7日内用户对推荐物料的观看时长。调参装置先获取r1和r2,并计算r1与r2中的各个参数的差值,可以得到r1与r2中:点击率的差值=0.08,互动率的差值=0.1,观看时长的
差值=0.5,其中,差值最大的推荐目标是观看时长,那么将观看时长大的r1作为第一收益参数向量;调参装置继续计算r1与r3中的各个参数的差值,可以得到r1与r3中:点击率的差值=0.04,互动率的差值=0.03,观看时长的差值=0,其中,差值最大的推荐目标是点击率,那么将点击率大的r3作为新的第一收益参数向量;调参装置继续计算r3与r4中的各个参数的差值,可以得到r3与r4中:点击率的差值=0.07,互动率的差值=0,观看时长的差值=1,其中,差值最大的推荐目标是观看时长,那么观看时长大的r3依然为第一收益参数向量;参数的差值小于r3的r1、r2和r4都为第二收益参数向量。
[0098]
在一些可能的实施方式中,s204可以包括:针对任一组第二收益参数向量,通过计算第二收益参数向量中的x个参数相对于第一收益参数向量中的x个参数的增量,得到第一收益参数向量与第二收益参数向量之间的增量向量。
[0099]
示例性的,可以通过以下表示式(1)得到增量向量:
[0100][0101]
式中,δri为第i个增量向量,1≤i≤n-1,r
ai
,r
bi
,
…
,r
xi
为第i个第二收益参数向量中的x个参数,r
a0
,r
b0
,
…
,r
x0
为第一收益参数向量中的x个参数,[δr
ai
,δr
bi
,
…
,δr
xi
]为第i个增量向量中的x个参数。
[0102]
s205,基于每一组增量向量,更新对应于每一组第二收益参数向量的融合参数向量的均值向量。
[0103]
在一些实施例中,调参装置在计算n-1组增量向量之后,可以基于该n-1组增量向量更新n-1组均值向量,n-1组均值向量对应于第二收益参数向量对应的n-1组融合参数向量,更新后的n-1组均值向量中的第i组均值向量可以表示为μi'=(μ'
ai
,μ'
bi
,
…
,μ'
xi
)。
[0104]
在一些可能的实施方式中,上述s205可以包括s301至s302,参见图5,图5是本技术实施例提供的针对多目标的调参方法的一个可选的流程示意图,下面将结合图5示出的步骤进行说明。
[0105]
s301,针对任一组增量向量,采集增量向量中的x个参数的值。
[0106]
在一些实施例中,调参装置在得到n-1组增量向量之后,可以采集n-1组增量向量中的每一组增量向量中的x个参数的值。
[0107]
s302,将增量向量中的x个参数中的最大值减去最小值,得到更新后的均值向量。
[0108]
在一些实施例中,调参装置在采集每一组增量向量中的x个参数的值之后,先确定每一组增量向量中的x个参数中的最大值和最小值,并用最大值减去最小值,得到的差值即为更新后的均值向量中的x个参数的值。
[0109]
在一些可能的实施方式中,计算更新后的均值向量中的x个参数的值可以参见表达式(5):
[0110]
μ'i=(μ'
ai
,μ'
bi
,
…
,μ'
xi
)=(δr
imax-δr
imax
,δr
imax-δr
imax
,
…
,δr
imax-δr
imax
) (5)
[0111]
式中,μ'i为更新后的n-1组均值向量中的第i组均值向量,其中,1≤i≤n-1,μ'
ai
,μ'
bi
,
…
,μ'
xi
为更新后的第i组均值向量中的x个参数的值,δr
imax
为δri中的最大值,δr
imin
为δri中的最小值。
[0112]
在本技术实施例中,确定增量向量中的最小值相当于确定数据涨幅最小的目标类型,确定最大值相当于确定了数据涨幅最大的目标类型,目标类型可以包括但不限于以下任一种:点击率、互动率、观看时长。当前,更新融合参数向量的原则是尽可能地提升数据涨幅最小的目标类型,尽可能地抑制数据涨幅最大的目标类型。根据增量向量中的最大值和最小值来更新均值向量,可以尽可能的满足上述更新融合参数向量的原则。
[0113]
s206,根据更新后的均值向量和相关系数,更新n组融合参数向量。
[0114]
在一些实施例中,调参装置可以根据更新后的均值向量和相关系数,调整n组融合参数向量中的融合参数(即更新n组融合参数向量)。
[0115]
在一些可能的实施方式中,第一收益参数向量对应于n组融合参数向量中的第一融合参数向量,每一组第二收益参数向量对应于n组融合参数向量中除第一融合参数向量之外的其他组第二融合参数向量;上述s206可以包括s401至s402,参见图6,图6是本技术实施例提供的针对多目标的调参方法的一个可选的流程示意图,下面将结合图6示出的步骤进行说明。
[0116]
s401,根据更新后的均值向量和x个相关系数组,计算更新后的n-1组第二融合参数向量中的每一组第二融合参数向量中的x个参数的值。
[0117]
在一些实施例中,调参装置在s205得到更新后的均值向量,在s203得到x个相关系数组之后,可以根据上述更新后的均值向量和x个相关系数组,更新第二融合参数向量(即更新第二融合参数向量中的每一组第二融合参数向量中的x个参数的值)。
[0118]
在一些可能的实施方式中,上述s401可以通过表达式(2)实现:
[0119][0120]
式中,ai'、bi'、
…
、xi'为更新后的n-1组第二融合参数向量中的第i组第二融合参数向量中的x个参数的值,ai、bi、
…
、xi为n-1组第二融合参数向量中的第i组第二融合参数向量中的x个参数的值,μ
ai
',μ
bi
',
…
,μ
xi
'为更新后的第i组均值向量中的x个参数的值,ρ
(a,r)
为每一组融合参数向量中的第1个参数和每一组融合参数向量对应的收益参数向量中的x个参数的相关系数组,ρ
(b,r)
为每一组融合参数向量中的第2个参数和每一组融合参数向量对应的收益参数向量中的x个参数的相关系数组,ρ
(x,r)
为每一组融合参数向量中的第x个参数和每一组融合参数向量对应的收益参数向量中的x个参数的相关系数组,其中,r
min
为收益参数向量的x个参数中的最小值,r
max
为收益参数向量的x个参数中的最大值。
[0121]
在本技术实施例中,根据融合参数向量中的融合参数与收益参数向量的最小值的相关系数与融合参数向量中的融合参数与收益参数向量的最大值的相关系数的差值来确定更新融合参数向量的方向,可以实现探索方向的确定性。例如:假设当前数据涨幅最小的目标类型是点击率,数据涨幅最大的目标类型是观看时长,原则是提升点击率或降低消费时长。当融合参数向量中的对应于点击率的融合参数(即a)更新时,需要将与a相关的相关
系数组,即作为更新融合参数向量的方向,假设相关系数大于0,则正相关,a越大,点击率越高,提升a便可以提升点击率,则当考虑a与观看时长的相关系数(即ρ
(a,rc)
)作为其方向时,假设对应的相关系数大于0,则正相关,a越大,消费时长越高,降低a便可以降低消费时长,则当综合考虑数据涨幅最小的目标类型和数据涨幅最大的目标类型时,则最终a的更新方向取决于的方向,即a与数据涨幅最小的目标类型和数据涨幅最大的目标类型的相关系数的差值。
[0122]
在本技术实施例中,影响融合参数向量的更新步长的变量为μ'和其中,的主要作用是用于探索更新的方向,μ'则是更新步长的重要影响因素。根据s302可知,μ'的值的大小取决于增量向量中的x个参数中的最大值和最小值。根据增量向量中的x个参数中的最大值与最小值的差值,可以确定更合适的更新步长。当差值越大,说明两组参数(即上述最大值和最小值对应的参数)产生的收益差距较大,两组参数分布有较大差异,需要更大的更新步长。因此,每次更新步长的大小取决于增量向量中的最大值和最小值的差距,步长值可灵活调整,避免参数组陷入局部最优点。
[0123]
s402,基于更新后的各组第二融合参数向量和第一融合参数向量,得到更新后的n组融合参数向量。
[0124]
在一些实施例中,调参装置将更新后的n-1组第二融合参数向量和第一融合参数向量组合在一起,得到更新后的n组融合参数向量,推荐系统在下一次为多个用户推荐物料时,将根据更新后的n组融合参数向量计算候选物料的融合预估值。
[0125]
至此,调参装置完成针对多目标的调参过程。
[0126]
下面,将说明本技术实施例的调参方法在一个实际的应用场景中的示例性应用。
[0127]
当上述调参方法应用于社交应用的服务器(如微博服务器)时,上述调参方法应用于微博中的实施流程参见图7。图7是本技术实施例提供的调参方法应用于社交应用软件的一个流程示意图。下面将结合图7示出的步骤进行说明。
[0128]
在本技术实施例中,图7所示的使用场景为推荐系统根据用户a、用户b、用户c、用户d、用户e和用户f的行为日志中的历史行为信息调整与用户a、用户b、用户c、用户d、用户e和用户f有映射关系的3组融合参数向量(分别为w1、w2、w3,其中,用户a和用户b与w1对应,用户c和用户d与w2对应,用户e和用户f与w3对应),再根据这3组融合参数向量计算候选物料的预估点击率、预估互动率和预估观看时长的融合预估值,根据该融合预估值向上述用户进行物料推荐。
[0129]
需要说明的是,图7所示的调参方法仅为本技术实施例的其中一种示例,并不能用于限定本技术实施例的其它实施方式。另外,图7中提及的融合网络、调参装置、排序装置等都为推荐系统中的软件模块。
[0130]
s501,调参装置根据预设的均值向量μ和方差向量σ生成3组融合参数向量,记为w1、w2、w3。
[0131]
s502,融合网络根据w1、w2和w3计算针对用户a和用户b、用户c和用户d、用户e和用户f的候选物料的融合预估值。
[0132]
s503,排序装置根据候选物料的融合预估值,向用户进行物料推荐。
[0133]
s504,调参装置采集用户的用户日志。
[0134]
s505,调参装置根据用户日志中的用户行为信息,计算w1、w2、w3对应的收益参数向量,记为r1,r2,和r3。
[0135]
s506,调参装置计算w1和r1、w2和r2、w3和r3之间的相关系数,得到3个相关系数组,每个相关系数组中有3个相关系数。
[0136]
s507,调参装置确定r1为最优收益参数向量,计算r2和r3相对于r1的增量向量,其中,r1对应的w1为最优融合参数向量。
[0137]
s508,调参装置基于s507中的增量向量,更新均值向量,更新后的均值向量为μ'。
[0138]
s509,调参装置根据s508中的μ'和s506中的相关系数更新w2和w3,得到w'2和w'3。
[0139]
s510,调参装置将融合网络中的融合参数向量更新为w1、w'2和w'3。
[0140]
s511,响应于更新后的融合参数向量w1、w'2和w'3,重复s502至s510。
[0141]
至此,便完成了上述针对多目标的调参方法。
[0142]
本技术实施例通过计算每一组融合参数向量与每一组融合参数向量对应的收益参数向量的相关系数以及计算n组融合参数向量对应的n组收益参数向量中的第一收益参数向量与第二收益参数向量的增量向量,来更新均值向量,可以提升数据涨幅最小的目标类型以及抑制数据涨幅最大的目标类型,实现探索方向的确定性;另外,根据更新后的均值向量和相关系数,更新n组融合参数向量,使得融合参数的更新步长取决于更新后的均值向量以及相关系数,融合参数的更新步长可以灵活调整,避免参数组陷入局部最优点,进而使得更新后的融合参数向量更能表达用户的兴趣倾向,实现更精准的物料推荐。
[0143]
下面继续说明本技术实施例提供的针对多目标的调参装置455的实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器450的针对多目标的调参装置455中的软件模块可以包括:数据采集模块4551,用于采集多个用户对推荐物料的历史行为信息;数据处理模块4552,用于根据历史行为信息,确定融合网络的n组融合参数向量中的每一组融合参数向量对应的收益参数向量,融合网络基于所述融合参数向量对候选物料的x个目标的预测值进行融合,收益参数向量用于表示用户对推荐物料的感兴趣程度,n、x为大于或者等于2的整数;确定每一组融合参数向量与每一组融合参数向量对应的收益参数向量的相关系数;确定n组融合参数向量对应的n组收益参数向量中的第一收益参数向量与每一组第二收益参数向量之间的增量向量,第一收益参数向量为n组收益参数向量中的最优收益参数向量,第二收益参数向量为除最优收益参数向量之外的其他组收益参数向量;更新模块4553,用于基于每一组增量向量,更新对应于每一组第二收益参数向量的融合参数向量的均值向量;根据更新后的均值向量和相关系数,更新n组融合参数向量。
[0144]
在一些可能的实施方式中,数据处理模块4552,还用于对每一组融合参数向量中的x个参数和每一组融合参数向量对应的收益参数向量中的x个参数进行皮尔逊相关系数计算,得到x个相关系数组,其中,x个相关系数组中的每一个相关系数组都包括x个相关系数。
[0145]
在一些可能的实施方式中,数据处理模块4552,还用于针对任一组第二收益参数
向量,通过计算第二收益参数向量中的x个参数相对于第一收益参数向量中的x个参数的增量,得到第一收益参数向量与第二收益参数向量之间的增量向量。
[0146]
在一些可能的实施方式中,通过计算第二收益参数向量中的x个参数相对于第一收益参数向量中的x个参数的增量,得到增量向量满足表达式(1)。
[0147]
在一些可能的实施方式中,数据采集模块4551,还用于针对任一组增量向量,采集增量向量中的x个参数的值;数据处理模块4552,还用于将增量向量中的x个参数中的最大值减去最小值,得到更新后的均值向量。
[0148]
在一些可能的实施方式中,第一收益参数向量对应于n组融合参数向量中的第一融合参数向量,每一组第二收益参数向量对应于n组融合参数向量中除第一融合参数向量之外的每一组第二融合参数向量;数据处理模块4552,还用于根据更新后的均值向量和x个相关系数组,计算更新后的每一组第二融合参数向量中的x个参数的值;更新模块4553,还用于基于更新后的各组第二融合参数向量和第一融合参数向量,得到更新后的n组融合参数向量。
[0149]
在一些可能的实施方式中,根据更新后的均值向量和x个相关系数组,计算更新后的n-1组第二融合参数向量中的x个参数的值满足表达式(2)。
[0150]
本技术实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机存储介质中。计算机设备的处理器从计算机存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本技术实施例上述的调参方法。
[0151]
本技术实施例提供一种存储有可执行指令的计算机存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本技术实施例提供的针对多目标的调参方法,例如图3示出的针对多目标的调参方法。
[0152]
在一些实施例中,计算机存储介质可以是fram、rom、prom、epro m、eeprom、闪存、磁表面存储器、光盘、或cd-rom等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
[0153]
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
[0154]
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(hhyper text markup language,tml)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
[0155]
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
[0156]
以上所述,仅为本技术的实施例而已,并非用于限定本技术的保护范围。凡在本技术的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本技术的保护范围之内。
技术特征:
1.一种针对多目标的调参方法,应用于推荐系统中,其特征在于,所述方法包括:采集多个用户对推荐物料的历史行为信息;根据所述历史行为信息,确定融合网络的n组融合参数向量中的每一组融合参数向量对应的收益参数向量,所述融合网络基于所述融合参数向量对候选物料的x个目标的预测值进行融合,所述收益参数向量用于表示用户对推荐物料的感兴趣程度,n、x为大于或者等于2的整数;确定所述每一组融合参数向量与所述每一组融合参数向量对应的收益参数向量的相关系数;确定所述n组融合参数向量对应的n组收益参数向量中的第一收益参数向量与每一组第二收益参数向量之间的增量向量,所述第一收益参数向量为所述n组收益参数向量中的最优收益参数向量,所述第二收益参数向量为除所述最优收益参数向量之外的其他组收益参数向量;基于每一组增量向量,更新对应于每一组第二收益参数向量的融合参数向量的均值向量;根据更新后的均值向量和所述相关系数,更新所述n组融合参数向量。2.根据权利要求1所述的方法,其特征在于,所述确定所述每一组融合参数向量与所述每一组融合参数向量对应的收益参数向量的相关系数,包括:对所述每一组融合参数向量中的x个参数和所述每一组融合参数向量对应的收益参数向量中的x个参数进行皮尔逊相关系数计算,得到x个相关系数组,其中,所述x个相关系数组中的每一个相关系数组都包括x个相关系数。3.根据权利要求1所述的方法,其特征在于,所述确定所述n组融合参数向量对应的n组收益参数向量中的第一收益参数向量与每一组第二收益参数向量之间的增量向量,包括:针对任一组第二收益参数向量,通过计算所述第二收益参数向量中的x个参数相对于所述第一收益参数向量中的x个参数的增量,得到所述第一收益参数向量与所述第二收益参数向量之间的增量向量。4.根据权利要求3所述的方法,其特征在于,所述针对任一组第二收益参数向量,通过计算所述第二收益参数向量中的x个参数相对于所述第一收益参数向量中的x个参数的增量,得到所述第一收益参数向量与所述第二收益参数向量之间的增量向量满足以下表达式:式中,δr
i
为第i组增量向量,1≤i≤n-1,r
ai
,r
bi
,
…
,r
xi
为第i组第二收益参数向量中的x个参数,r
a0
,r
b0
,
…
,r
x0
为第一收益参数向量中的x个参数,[δr
ai
,δr
bi
,
…
,δr
xi
]为第i组增量向量中的x个参数。5.根据权利要求1所述的方法,其特征在于,所述基于每一组增量向量,更新对应于每一组第二收益参数向量的融合参数向量的均值向量,包括:针对任一组增量向量,采集所述增量向量中的x个参数的值;将所述增量向量中的x个参数中的最大值减去最小值,得到更新后的均值向量。
6.根据权利要求2所述的方法,其特征在于,所述第一收益参数向量对应于n组融合参数向量中的第一融合参数向量,每一组第二收益参数向量对应于所述n组融合参数向量中除所述第一融合参数向量之外的每一组第二融合参数向量;所述根据更新后的均值向量和所述相关系数,更新所述n组融合参数向量,包括:根据所述更新后的均值向量和所述x个相关系数组,计算更新后的每一组第二融合参数向量中的x个参数的值;基于更新后的各组第二融合参数向量和所述第一融合参数向量,得到更新后的n组融合参数向量。7.根据权利要求6所述的方法,其特征在于,所述根据所述更新后的均值向量和所述x个相关系数组,计算更新后的每一组第二融合参数向量中的x个参数的值满足以下表达式:式中,a
i
'、b
i
'、
…
、x
i
'为更新后的第i组第二融合参数向量中的x个参数的值,1≤i≤n-1,a
i
、b
i
、
…
、x
i
为第i组第二融合参数向量中的x个参数的值,μ
ai
',μ
bi
',
…
,μ
xi
'为更新后的第i组均值向量中的x个参数的值,ρ
(a,r)
为每一组融合参数向量中的第1个参数和所述每一组融合参数向量对应的收益参数向量中的x个参数的相关系数组,ρ
(b,r)
为每一组融合参数向量中的第2个参数和所述每一组融合参数向量对应的收益参数向量中的x个参数的相关系数组,ρ
(x,r)
为每一组融合参数向量中的第x个参数和所述每一组融合参数向量对应的收益参数向量中的x个参数的相关系数组,其中,r
min
为收益参数向量的x个参数中的最小值,r
max
为收益参数向量的x个参数中的最大值。8.一种针对多目标的调参装置,设置于推荐系统中,其特征在于,所述装置包括:数据采集模块,用于采集多个用户对推荐物料的历史行为信息;数据处理模块,用于根据所述历史行为信息,确定融合网络的n组融合参数向量中的每一组融合参数向量对应的收益参数向量,所述融合网络基于所述融合参数向量对候选物料的x个目标的预测值进行融合,所述收益参数向量用于表示用户对推荐物料的感兴趣程度,n、x为大于或者等于2的整数;确定所述每一组融合参数向量与所述每一组融合参数向量对应的收益参数向量的相关系数;确定所述n组融合参数向量对应的n组收益参数向量中的第一收益参数向量与每一组第二收益参数向量之间的增量向量,所述第一收益参数向量为所述n组收益参数向量中的最优收益参数向量,所述第二收益参数向量为除所述最优收益参数向量之外的其他组收益参数向量;更新模块,用于基于每一组增量向量,更新对应于每一组第二收益参数向量的融合参数向量的均值向量;根据更新后的均值向量和所述相关系数,更新所述n组融合参数向量。9.根据权利要求8所述的装置,其特征在于,所述数据处理模块,具体用于对所述每一组融合参数向量中的x个参数和所述每一组融合参数向量对应的收益参数向量中的x个参
数进行皮尔逊相关系数计算,得到x个相关系数组,其中,所述x个相关系数组中的每一个相关系数组都包括x个相关系数。10.根据权利要求8所述的装置,其特征在于,所述数据处理模块,具体用于针对任一组第二收益参数向量,通过计算所述第二收益参数向量中的x个参数相对于所述第一收益参数向量中的x个参数的增量,得到所述第一收益参数向量与所述第二收益参数向量之间的增量向量。11.根据权利要求8所述的装置,其特征在于,所述数据采集模块,具体用于针对任一组增量向量,采集所述增量向量中的x个参数的值;所述数据处理模块,具体用于将所述增量向量中的x个参数中的最大值减去最小值,得到更新后的均值向量。12.根据权利要求9所述的装置,其特征在于,所述第一收益参数向量对应于n组融合参数向量中的第一融合参数向量,每一组第二收益参数向量对应于所述n组融合参数向量中除所述第一融合参数向量之外的每一组第二融合参数向量;所述数据处理模块,具体用于根据所述更新后的均值向量和所述x个相关系数组,计算更新后的每一组第二融合参数向量中的x个参数的值;所述更新模块,具体用于基于更新后的各组第二融合参数向量和所述第一融合参数向量,得到更新后的n组融合参数向量。13.一种电子设备,其特征在于,所述电子设备包括:存储器,用于存储可执行指令;处理器,用于执行所述存储器中存储的可执行指令或者计算机程序时,实现权利要求1至7任一项所述的方法。14.一种计算机存储介质,存储有可执行指令或者计算机程序,其特征在于,所述可执行指令被处理器执行时实现权利要求1至7任一项所述的方法。
技术总结
本申请提供了一种针对多目标的调参方法、装置、设备及计算机存储介质,该方法包括:采集多个用户对推荐物料的历史行为信息;根据历史行为信息,确定融合网络的N组融合参数向量中的每一组融合参数向量对应的收益参数向量;确定每一组融合参数向量与每一组融合参数向量对应的收益参数向量的相关系数;确定N组融合参数向量对应的N组收益参数向量中的第一收益参数向量与每一组第二收益参数向量之间的增量向量;基于每一组增量向量,更新对应于每一组第二收益参数向量的融合参数向量的均值向量;根据更新后的均值向量和相关系数,更新N组融合参数向量。通过本申请,能够提高融合参数向量寻优的效率和速度,实现更精准的物料推荐。荐。荐。
技术研发人员:刘松 苏振涛 林中平
受保护的技术使用者:微梦创科网络科技(中国)有限公司
技术研发日:2023.04.14
技术公布日:2023/8/4
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/