一种点击率预估模型训练方法和装置与流程
未命名
08-23
阅读:212
评论:0
1.本技术涉及序列推荐技术领域,尤其涉及一种点击率预估模型训练方法和装置。
背景技术:
2.序列推荐的目标是根据用户之前的动作序列预测用户的下一个动作。以定位为线上获客的app产品为例,其产品目标是提升用户的线上成交量,因此,为了提升用户浏览时间、留存时长和线上用户体验,需要更准确的序列推荐服务,以帮助用户快速定位意向目标推荐。常用经典序列推荐算法,通常从用户历史行为序列中挖掘序列模型,并利用预测损失来学习模型参数或者嵌入表征,由于可能存在用户线上行为不足,模型容易受数据稀疏问题的影响。此外,上述序列推荐算法关注最终性能,忽略了上下文数据和序列数据之间的关联或者融合,导致序列推荐效果不达预期。
3.特别是在序列推荐最为关键的精排阶段,通常会采用点击率预估模型来预测用户选择物品的概率,再按照概率大小形成有序的推荐列表,因此如何使得点击率预估模型能够体现序列全局信息和物品之间相关性,以达到获得更好的序列推荐结果,是需要解决的技术问题。
技术实现要素:
4.有鉴于此,本技术实施例提供了一种点击率预估模型训练方法、装置、电子设备及计算机可读存储介质,以解决现有技术缺乏在点击率预估模型中融合序列上下文和物品属性信息的问题。
5.本技术实施例的第一方面,提供了一种点击率预估模型训练方法,包括:获取训练集,其中所述训练集至少包括物品特征和物品属性特征;将所述物品特征和所述物品属性特征输入至点击率预估模型,以获得第一增强特征;以及依据第一损失函数迭代更新所述点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经预训练的所述点击率预估模型;将所述第一增强特征和所述物品特征输入至经预训练的所述点击率预估模型,以获得点击率预估结果;以及依据第二损失函数迭代更新所述点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经微调的所述点击率预估模型。
6.本技术实施例的第二方面,提供了一种点击率预估模型训练装置,适用于第一方面所述的点击率预估模型训练方法,包括:训练集获取模块,能够获取训练集,其中所述训练集至少包括物品特征和物品属性特征;模型预训练模块,能够将所述物品特征和所述物品属性特征输入至点击率预估模型,以获得第一增强特征;以及依据第一损失函数迭代更新所述点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经预训练的所述点击率预估模型;模型微调模块,能够将所述第一增强特征和所述物品特征输入至经预训练的所述
点击率预估模型,以获得点击率预估结果;以及依据第二损失函数迭代更新所述点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经微调的所述点击率预估模型。
7.本技术实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现第一方面所述方法的步骤。
8.本技术实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现第一方面所述方法的步骤。
9.本技术实施例与现有技术相比存在的有益效果至少包括:本技术实施例通过获取包括物品特征和物品属性特征的训练集,并将物品特征和物品属性特征输入至点击率预估模型并获得第一增强特征,依据第一损失函数迭代更新点击率预估模型的参数并获得经预训练的点击率预估模型;将第一增强特征和物品特征输入至经预训练的点击率预估模型并获得点击率预估结果,依据第二损失函数迭代更新点击率预估模型的参数,最终获得经微调的点击率预估模型。本技术实施例可有效融合序列上下文和物品属性信息,提高点击率预估模型精排结果准确性。
附图说明
10.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
11.图1是本技术实施例提供的序列推荐流程示意图;图2是本技术实施例提供的点击率预估模型结构示意图之一;图3是本技术实施例提供的点击率预估模型训练方法的流程示意图之一;图4是本技术实施例提供的点击率预估模型训练方法的流程示意图之二;图5是本技术实施例提供的点击率预估模型结构示意图之二;图6是本技术实施例提供的点击率预估模型训练装置的结构示意图;图7是本技术实施例提供的电子设备的结构示意图。
具体实施方式
12.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
13.下面将结合附图详细说明根据本技术实施例的一种点击率预估模型训练方法、装置、电子设备和存储介质。
14.如背景技术所述,在序列推荐任务中常用的是基于卷积神经网络cnn-based模型,该模型主要工作过程为:首先,将输入的序列,例如文本、音乐、视频等表示成一个矩阵,其中每行表示一个时间步,每列表示一个特征。其次,通过一系列的卷积层来提取输入序列的局部特征,每个卷积层由多个卷积核组成,每个卷积核会对输入矩阵中的一部分进行卷积
操作,提取出该部分的局部特征,卷积操作可以通过滑动窗口实现。在卷积层之后,使用池化层来进一步提取输入序列的特征,池化层通常采用最大池化或平均池化的方式,从每个卷积核的输出中选择最大值或平均值作为该卷积核的输出。再将池化层的输出展开成一维向量,作为全连接层的输入。在全连接层中,可以使用多个全连接层来提高模型的表示能力,每个全连接层都可以包含多个神经元。全连接层可以实现输入序列的特征组合和分类。最后,输出层根据具体的任务要求而定,比如在文本推荐任务中,可以使用softmax层来输出每个词的概率,选择概率最高的词作为推荐结果。
15.通过以上过程,cnn-based序列推荐模型可以学习到输入序列的局部和全局特征,并能够有效地处理不同长度的序列。在训练时,可以使用反向传播算法来更新模型参数,使得模型能够更好地适应训练数据。在预测时,可以将输入序列送入模型中,根据模型的输出进行推荐。但由于cnn-based模型过分强调最终性能,尤其关注局部特征提取,对于序列全局信息、上下文间信息并没有很好捕捉,导致该模型在一些需要全局信息的场景中表现不佳,且更容易受数据稀疏问题的影响。
16.图1是目前序列推荐系统典型的技术架构,即召回、粗排、精排和重排,其中粗排、精排和重排都属于排序阶段。如图1所示,其中,召回是从上海量物品中选出可能“几千条”用户感兴趣的,但是“几千条”物品仍然不可能直接丢给用户,再通过后续的多层排序,在这“几千条”物品中找出用户最有可能感兴趣的。粗排通常会用比较轻量级的机器学习模型,对“几千条”物品逐一打分,截断分数最高的“几百条”物品进入下一个模型。粗排模型由于模型结构简单,一般计算速度会很快。精排一般会用比较重量级的机器学习模型,比如深度神经网络,给“几百条”物品打分,分数打好之后可以选择再一次做截断,然后送到下一层重排。重排的目的主要是为了保证结果的多样性,重排的结果会是最后真正展现给用户的物品。
17.如图1所示,精排是多层排序中最关键的环节,也是保证最后结果最重要的环节。通常,精排模型会采用点击率预估模型来预测用户选择物品的概率,然后按照概率大小形成有序的物品推荐列表。但是物品推荐场景下,存在长尾物品得不到有效曝光的问题,在点击率预估模型中引入注意力增强机制来优化点击率预估模型,以提升长尾物品的预测概率值,给予物品有效曝光。所谓长尾物品tail items在推荐系统中非常常见,长尾的存在导致了样本不均衡,对于热门头部物品head items的样本量多,模型学习此部分的效果越好,而长尾物品的样本量少,导致模型对该部分物品的理解不够充分,效果自然也就较差。
18.如前所述,点击率预估模型ctr是工业级的序列推荐系统中非常重要的一个环节, 其预估效果会直接影响推荐系统的性能。点击率预估模型ctr常伴有训练数据量大、特征高度稀疏、推断性能要求高等特点, 使得算法的设计多围绕这些特点来进行。工业级的序列推荐系统常因为候选集数据量、系统响应时效等因素的影响,需要分多个阶段完成整个推荐的流程。具体地, 常将其分为召回与排序两大阶段。对于具有一定规模的互联网业务而言, 其所面对的待推荐品库通常能达到千万甚至亿量级. 若针对某一特定的用户我们都需要对全体物品进行打分排序以给出最终推荐结果的话, 在有限的计算资源和响应时间下显然是不现实的事情。所以,通常先采用召回策略从待推荐物品库中先召回一批数据, 使数据量下降到千量级。由于召回阶段的数据量较大,所以要求该阶段所使用的策略和模型要足够的简单。通过召回阶段, 可以顺利地将待排序数据量降至千量级,此时便可以通
过用户画像、物品画像、用户行为记录等数据来进行排序,从而得到用户对每个物品的点击率预估值。因此,点击率预估模型研究的问题是已知当前要推荐的用户、当前所处上下文、待计算的物品,通过模型计算出用户点击该物品概率,将待排序物品全部计算出预估点击率,再由高至低排序输出。
19.下面基于图2所示的点击率预估模型结构示意图。该点击率预估模型包括特征增强子模型;其中,该特征增强子模型包括物品特征嵌入层、物品属性特征嵌入层和最大化信息增益层;该最大化信息增益层能够基于最大化信息增益融合该物品特征和该物品属性,得到第一增强特征。
20.在一些实施例中,物品特征输入至物品特征嵌入层得到物品特征嵌入表征序列;物品属性特征输入至物品属性特征嵌入层后得到物品属性特征嵌入表征序列。
21.具体地,将物品特征嵌入表征序列和物品属性特征嵌入表征序列同时输入至最大化信息增益层以便融合该物品特征和该物品属性。
22.在一些实施例中,物品特征嵌入表征序列还可以经过序列注意力层,该序列注意力层能够增强该物品特征嵌入表示的上下文关联特征。
23.在一些实施例中,该最大化信息增益层配置有最大信息增益系数,即需学习的最大化增益参数。
24.具体地,最大信息增益属于决策树策略。决策树的每一层都需要根据最大信息增益来进行分类特征的选取,信息增益最大找的是样本之间差异最大的特征。信息增益是指分类前根据原始类别计算的熵值和分类后计算的熵值两者的差值,因此,信息增益最大是指差值最大。一般地,当样本固定后,原始信息熵值是常量,那么最大信息熵值实际上也就说是分类后的熵值要越小越好。由于信息熵值是用来度量信息容量的,即信息量越大,信息越多样,其熵值越大,相反,如果信息很一致,其熵值是很小的。此外,最大信息增益的特征即为最显著特征。也就是说,最大信息熵的所选的特征是分类后熵值最小的特征。分类后熵值最小的特征恰恰是分类结果一致的特征,而分类结果一致的特征必须是两类样本差异最大的特征。对于最大化信息增益的原理,此处不再赘述。
25.图3是本技术实施例提供的点击率预估模型训练方法流程示意图。图3的点击率预估模型训练方法可以由服务器执行,需要说明的是,服务器可以是硬件,也可以是软件。如图3所示,该点击率预估模型训练方法具体可以包括:s301:获取训练集,其中上述训练集至少包括物品特征和物品属性特征。
26.s302:将上述物品特征和上述物品属性特征输入至点击率预估模型,以获得第一增强特征;以及依据第一损失函数迭代更新上述点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经预训练的上述点击率预估模型。
27.s303:将上述第一增强特征和上述物品特征输入至经预训练的上述点击率预估模型,以获得点击率预估结果;以及依据第二损失函数迭代更新上述点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经微调的上述点击率预估模型。
28.在一些实施例中,该点击率预估模型包括特征增强子模型;其中,上述特征增强子模型包括物品特征嵌入层、物品属性特征嵌入层和最大化信息增益层;上述最大化信息增
益层能够基于最大化信息增益融合上述物品特征和上述物品属性,以输出上述第一增强特征。
29.在一些实施例中,如图4所示,将上述物品特征和上述物品属性特征输入至点击率预估模型,以获得第一增强特征的过程,包括:s411:将上述物品特征输入至上述物品特征嵌入层,获得物品特征嵌入表示。
30.s412:将上述物品特征属性输入至上述物品属性特征嵌入层,获得物品属性特征嵌入表示。
31.s413:将上述物品特征嵌入表示和上述物品属性特征嵌入表示输入至上述最大化信息增益层,获得上述第一增强特征。
32.在一些实施例中,上述最大化信息增益层配置有最大信息增益系数,以及,基于上述最大信息增益系数,确定上述物品特征与上述物品属性特征之间的相似性函数,定义为:,其中,表示上述物品特征嵌入表示,上述物品属性特征嵌入表示,为可调系数。
33.需要说明的是,相似性函数在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。在本技术的一个实施例中,可以是基于双向线性网络进行构建来度量物品特征与物品属性特征之间的相似性。
34.在一些实施例中,基于上述相似性函数,确定上述第一损失函数,定义为:。
35.在一些实施例中,基于上述相似性函数,构建的第一损失函数用于训练上述特征增强子模型的参数,上述参数包括最大信息增益系数。
36.需要说明的是,受bert模型的掩码语言模型的启发,本技术实施例的点击率预估模型还可以通过完形填空任务对物品序列中进行双向神经网络建模。在每个训练步骤中,随机掩盖输入序列中的一部分物品,即将它们替换为特殊标记[mask]。然后,基于两个方向上的上下文从原始序列中预测被标记为[mask]的物品。
[0037]
在一些实施例中,如图5所示,上述特征增强子模型还包括与上述物品特征嵌入层的输出相连的序列注意力层,上述序列注意力层能够增强上述物品特征嵌入表示的上下文关联特征。
[0038]
在一些实施例中,上述训练集还包括用户特征和/或交叉特征。上述点击率预估模型还包括排序子模型。
[0039]
在一些实施例中,将上述第一增强特征、上述物品特征、上述用户特征和/或上述交叉特征输入至上述排序子模型,获得上述点击率预估结果。
[0040]
需要说明的是,模型训练包括预训练和微调两个阶段,属于两阶段模型。预训练过程中利用引入信息增益最大化的完形填空任务通过无掩码的自注意力机制进行训练,得到高质量的物品表征和属性表征。微调阶段,则利用单向transformer来构建表征,通过pairwise loss来训练模型。
[0041]
因此,在一些实施例中,在对上述点击率预估模型的微调阶段,基于pair-wise loss确定上述第二损失函数,定义为:。
[0042]
综上所述,本技术实施例的点击率预估模型,其模型输入为由用户真实发生的点
击构成的物品+用户特征序列;模型输出为物品预测概率。
[0043]
进一步地,基于信息增益最大化的自监督学习任务可以引入更多的上下文信息,辅助构建高质量的房源/属性嵌入特征,从而可以学习到更加丰富的特征表示,使得模型更好的捕捉输入序列中的语义信息,提升模型的泛化能力,从而更好的适应新环境,提升预测准确度。
[0044]
进一步地,可以通过与其他自监督学习任务进行结合,如基于掩码的自监督学习、自编码器等,从而可以更好地提高模型的性能和表现。
[0045]
在一些实施例中,序列推荐的主模型除了cnn-based模型还可以使用 rnn-based模型,包括rcnn、din等序列推荐模型。
[0046]
通过获取包括物品特征和物品属性特征的训练集,并将物品特征和物品属性特征输入至点击率预估模型并获得第一增强特征,依据第一损失函数迭代更新点击率预估模型的参数并获得经预训练的点击率预估模型;将第一增强特征和物品特征输入至经预训练的点击率预估模型并获得点击率预估结果,依据第二损失函数迭代更新点击率预估模型的参数,最终获得经微调的点击率预估模型。本技术实施例可有效融合序列上下文和物品属性信息,提高点击率预估模型精排结果准确性。
[0047]
上述所有可选技术方案,可以采用任意结合形成本技术的可选实施例,在此不再一一赘述。
[0048]
下述为本技术装置实施例,可以用于执行本技术方法实施例。对于本技术装置实施例中未披露的细节,请参照本技术方法实施例。
[0049]
图6是本技术实施例提供的一种点击率预估模型训练装置的示意图。如图6所示,该点击率预估模型训练装置包括:训练集获取模块601,能够获取训练集,其中上述训练集至少包括物品特征和物品属性特征。
[0050]
模型预训练模块602,能够将上述物品特征和上述物品属性特征输入至点击率预估模型,以获得第一增强特征;以及依据第一损失函数迭代更新上述点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经预训练的上述点击率预估模型。
[0051]
模型微调模块603,能够将上述第一增强特征和上述物品特征输入至经预训练的上述点击率预估模型,以获得点击率预估结果;以及依据第二损失函数迭代更新上述点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经微调的上述点击率预估模型。
[0052]
应理解,本说明书实施例的一种点击率预估模型训练装置还可执行图1至图5中点击率预估模型训练装置执行的方法,并实现点击率预估模型训练装置在图1至图5所示实例的功能,在此不再赘述。同时,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
[0053]
图7是本技术实施例提供的电子设备7的示意图。如图7所示,该实施例的电子设备7包括:处理器701、存储器702以及存储在该存储器702中并且可在处理器701上运行的计算机程序703。处理器701执行计算机程序703时实现上述各个方法实施例中的步骤。或者,处理器701执行计算机程序703时实现上述各装置实施例中各模块/单元的功能。
[0054]
电子设备7可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电
子设备7可以包括但不仅限于处理器701和存储器702。本领域技术人员可以理解,图7仅仅是电子设备7的示例,并不构成对电子设备7的限定,可以包括比图示更多或更少的部件,或者不同的部件。
[0055]
存储器702可以是电子设备7的内部存储单元,例如,电子设备7的硬盘或内存。存储器702也可以是电子设备7的外部存储设备,例如,电子设备7上配备的插接式硬盘,智能存储卡(smart mediacard,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。存储器702还可以既包括电子设备7的内部存储单元也包括外部存储设备。存储器702用于存储计算机程序以及电子设备所需的其它程序和数据。
[0056]
处理器701可以是中央处理单元(centralprocessing unit,cpu),也可以是其它通用处理器、数字信号处理器(digital signalprocessor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmablegate array,fpga)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器701从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成共享资源访问控制装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:获取训练集,其中上述训练集至少包括物品特征和物品属性特征;将上述物品特征和上述物品属性特征输入至点击率预估模型,以获得第一增强特征;以及依据第一损失函数迭代更新上述点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经预训练的上述点击率预估模型;将上述第一增强特征和上述物品特征输入至经预训练的上述点击率预估模型,以获得点击率预估结果;以及依据第二损失函数迭代更新上述点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经微调的上述点击率预估模型。
[0057]
上述如本说明书图1至图5所示实施例揭示的点击率预估模型训练方法可以应用于处理器701中,或者由处理器701实现。处理器701可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以实现或者执行本说明书实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
[0058]
当然,除了软件实现方式之外,本说明书实施例的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
[0059]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是
各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0060]
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-onlymemory,rom)、随机存取存储器(random access memory,ram)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0061]
本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1至图5所示实施例的点击率预估模型训练方法,并具体用于执行以下方法:获取训练集,其中上述训练集至少包括物品特征和物品属性特征;将上述物品特征和上述物品属性特征输入至点击率预估模型,以获得第一增强特征;以及依据第一损失函数迭代更新上述点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经预训练的上述点击率预估模型;将上述第一增强特征和上述物品特征输入至经预训练的上述点击率预估模型,以获得点击率预估结果;以及依据第二损失函数迭代更新上述点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经微调的上述点击率预估模型。
[0062]
总之,以上该仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书的保护范围之内。
[0063]
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
[0064]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算
机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
[0065]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0066]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0067]
以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。
技术特征:
1.一种点击率预估模型训练方法,其特征在于,包括:获取训练集,其中所述训练集至少包括物品特征和物品属性特征;将所述物品特征和所述物品属性特征输入至点击率预估模型,以获得第一增强特征;以及依据第一损失函数迭代更新所述点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经预训练的所述点击率预估模型;将所述第一增强特征和所述物品特征输入至经预训练的所述点击率预估模型,以获得点击率预估结果;以及依据第二损失函数迭代更新所述点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经微调的所述点击率预估模型。2.根据权利要求1所述的方法,其特征在于,所述点击率预估模型包括特征增强子模型;其中,所述特征增强子模型包括物品特征嵌入层、物品属性特征嵌入层和最大化信息增益层;所述最大化信息增益层能够基于最大化信息增益融合所述物品特征和所述物品属性,以输出所述第一增强特征。3.根据权利要求2所述的方法,其特征在于,将所述物品特征和所述物品属性特征输入至点击率预估模型,以获得第一增强特征的过程,包括:将所述物品特征输入至所述物品特征嵌入层,获得物品特征嵌入表示;将所述物品特征属性输入至所述物品属性特征嵌入层,获得物品属性特征嵌入表示;将所述物品特征嵌入表示和所述物品属性特征嵌入表示输入至所述最大化信息增益层,获得所述第一增强特征。4.根据权利要求2所述的方法,其特征在于,所述最大化信息增益层配置有最大信息增益系数,以及,基于所述最大信息增益系数,确定所述物品特征与所述物品属性特征之间的相似性函数,定义为:,其中,表示所述物品特征嵌入表示,所述物品属性特征嵌入表示,为可调系数。5.根据权利要求4所述的方法,其特征在于,所述第一损失函数用于训练所述特征增强子模型的参数;和/或,基于所述相似性函数,确定所述第一损失函数,定义为:;和/或,所述特征增强子模型还包括与所述物品特征嵌入层的输出相连的序列注意力层,所述序列注意力层能够增强所述物品特征嵌入表示的上下文关联特征。6.根据权利要求1所述的方法,其特征在于,所述训练集还包括用户特征和/或交叉特征;和/或,所述点击率预估模型还包括排序子模型;和/或,将所述第一增强特征、所述物品特征、所述用户特征和/或所述交叉特征输入至所述排序子模型,获得所述点击率预估结果。7.根据权利要求1所述的方法,其特征在于,在对所述点击率预估模型的微调阶段,基于pair-wise loss确定所述第二损失函数,定义为:。8.一种点击率预估模型训练装置,其特征在于,适用于权利要求1至7任一项所述的点
击率预估模型训练方法,包括:训练集获取模块,能够获取训练集,其中所述训练集至少包括物品特征和物品属性特征;模型预训练模块,能够将所述物品特征和所述物品属性特征输入至点击率预估模型,以获得第一增强特征;以及依据第一损失函数迭代更新所述点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经预训练的所述点击率预估模型;模型微调模块,能够将所述第一增强特征和所述物品特征输入至经预训练的所述点击率预估模型,以获得点击率预估结果;以及依据第二损失函数迭代更新所述点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经微调的所述点击率预估模型。9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器在执行所述计算机程序时,实现如权利要求1至7中任一项所述方法的步骤。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。
技术总结
本申请涉及序列推荐技术领域,提供了一种点击率预估模型训练方法和装置。该方法包括:获取训练集,训练集至少包括物品特征和物品属性特征;将物品特征和物品属性特征输入至点击率预估模型,以获得第一增强特征;以及依据第一损失函数迭代更新点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经预训练的点击率预估模型;将第一增强特征和物品特征输入至经预训练的点击率预估模型,以获得点击率预估结果;以及依据第二损失函数迭代更新点击率预估模型的参数,直至达到预设的迭代终止条件,以获得经微调的点击率预估模型。本申请可有效融合序列上下文和物品属性信息,提高点击率预估模型精排结果准确性。率预估模型精排结果准确性。率预估模型精排结果准确性。
技术研发人员:王芳 姜佳
受保护的技术使用者:深圳须弥云图空间科技有限公司
技术研发日:2023.07.20
技术公布日:2023/8/21
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
