面向广告增效建模场景的去偏差因果推断方法及其系统
未命名
09-22
阅读:58
评论:0

1.本发明涉及因果推理与增效建模领域,尤其涉及一种面向广告增效建模场景的去偏差因果推断方法及其系统。
背景技术:
2.随着互联网人口和流量红利的消减,广告主规模和预算的增长遭遇挑战。在预算有限情况下,从传统绝对价值视角转换为增量价值视角,帮助店铺和平台挖掘增量价值,意义更加凸显。增效建模旨在基于观测数据,对广告投放后对比广告未投放带来的成交额增量价值进行建模估计,能够对广告的针对性投放进行指导,节约广告投放成本。传统的广告增效建模方法简单地利用深度学习等技术,基于观测数据建立消费者、店铺特征和广告是否投放对成交额的预测模型,忽略了观测数据中存在的复杂偏差,导致在实际应用过程中,模型估计得到的广告增效与真实的广告增效大相径庭,严重影响了广告资源的合理分配,增大了广告投放的成本。因此,如何去除观测数据中的复杂偏差,建立一个稳定、可解释的广告增效模型,是目前增效建模领域的重点和难点。
3.在观测数据中,关联主要有三种来源:因果关系、混淆偏差以及样本选择偏差。其中只有因果关系才是稳定的、可解释的真实关联,而后两者都属于不稳定、不可解释的虚假关联。因果推断旨在消除观测数据中的虚假关联,挖掘数据中可靠的因果关系,是用于可解释性分析与稳定学习的强大统计建模工具。具体而言,从观测数据中进行因果推断的一大难题是只有事实数据的结果是可观测的,而反事实数据的结果是无法观测的,而如果数据中存在由混淆变量引起的混淆偏差,会使得不可观测的反事实数据分布与可观测的事实数据分布不一致,导致采用观测数据进行建模估计的结果有偏;从观测数据中进行因果推断的另一大难题是样本数据是从研究目标的全体数据中的抽样获取的,而如果由于人为因素甚至某些不可抗因素,导致样本选择的过程不是完全随机的,就会引发样本选择偏差,使得样本数据分布和全体数据分布不一致,进而导致采用样本数据进行建模估计的结果有偏。在广告增效建模这样一种海量高维数据的复杂场景中,这两种偏差往往同时存在。
技术实现要素:
4.本发明的目的是克服现有技术的不足,提供一种面向广告增效建模场景的协同解决混淆偏差和样本选择偏差的因果推断技术。相比一般的因果推断算法,本发明充分考虑了广告增效建模场景中混淆偏差和样本选择偏差同时存在,并且许多现有方法的假设在该场景中难以满足的客观事实,并在不引入强假设、保证在广告业务场景中的实用性的前提下,有效地消除了混淆偏差和样本选择偏差。
5.为实现上述发明目的,本发明具体采用的技术方案如下:
6.第一方面,本发明提供了一种面向广告增效建模场景的去偏差因果推断方法,其包括如下步骤:
7.s1:提取目标平台上的当期广告增效日志,并根据消费者和店铺信息是否在当期
广告增效日志记录中,将店铺和消费者特征数据区分为被选入样本数据和未被选入样本数据两部分,并对两部分数据分别进行样本选择标记,其中被选入样本数据进一步区分广告的投放组和屏蔽组,从而构建形成数据集;
8.s2:构建深度神经网络模型对店铺和消费者特征进行信息抽取,并利用所述数据集训练该深度神经网络模型,训练过程中通过一个积分概率度量模块对抽取信息的分布相似度进行限制,以得到在未被选入样本数据与被选入样本数据之间,以及在被选入样本数据的广告投放组和广告屏蔽组之间都达到平衡的特征表示;训练完毕后得到平衡特征提取模型;
9.s3:构建基于深度神经网络的投放后成交额预测模型和屏蔽后结果预测网络模型,分别利用平衡后的被选入样本数据投放组特征表示和被选入样本数据屏蔽组特征表示进行训练,得到去除混淆偏差和样本选择偏差的投放后结果预测网络模型和屏蔽后结果预测网络模型;
10.s4:基于训练后的平衡特征提取模型、投放后结果预测网络模型和屏蔽后结果预测网络模型,分别对目标店铺和目标消费者的广告投放后成交额和广告屏蔽后成交额进行预测,估计得到目标店铺和目标消费者对应的广告增效。
11.作为上述第一方面的优选,所述的s1的具体实现步骤为:
12.s101:根据消费者和店铺信息是否在当期广告增效日志记录中,将店铺、消费者特征数据区分为被选入样本的数据和未被选入样本的数据两部分;其中,所述当期广告增效日志记录提取自目标平台,其中记载着店铺的广告是否投放给消费者,以及当期结束前消费者在相应店铺的成交额;其中消费者是否接受了广告投放被定义为处理变量且表示为t,t=1表示消费者接受了广告投放即属于投放组,t=0表示消费者未接受广告投放即属于屏蔽组;当期结束前消费者在相应店铺的成交额被定义为结果变量且表示为y;店铺和消费者特征变量集表示为其中xj表示特征变量集中第j个变量,d表示特征变量集中的变量总数;
13.以s为样本选择标记,将目标平台上全部店铺和全部消费者数据中,被记录在当期广告增效日志记录中的店铺和消费者数据标记为被选入样本的数据,记作s=1;将将全部店铺和消费者数据中未被记录在当期广告增效日志记录中的店铺和消费者数据标记为未被选入样本的数据,记作s=0;
14.s102:根据当期广告增效日志记录数据和店铺、消费者特征数据,将每个数据表示为四元组(x,t,y,s),并构建成数据集;其中s=1的数据的x,t,y,s都是可以观测的,而s=0的数据中t,y是不可观测的,在数据集中其取值设定为nan。
15.作为上述第一方面的优选,所述的s2的具体实现步骤为:
16.s201:构建一个用于特征学习的深度神经网络模型f1,将数据集中的店铺、消费者特征变量集x输入该深度神经网络模型f1,得到其向量化特征表示
17.s202:按照数据的处理变量t和样本选择标记s将区分为未被选入样本数据特征表示、被选入样本数据的特征表示、被选入样本数据的投放组特征表示和被选入样本数据的屏蔽组特征表示;其中,未被选入样本数据特征表示由所有s=0的数据的特征表示构成,记为被选入样本数据的特征表示由所有s=1数据的构成,记为被选入样
本数据的投放组特征表示由所有s=1且t=1数据的构成,记为被选入样本数据的屏蔽组特征表示由所有s=1且t=0数据的构成,记为
18.s203:用一个积分概率度量模块来计算和之间的分布距离以及和之间的分布距离并用所述数据集对深度神经网络模型f1进行训练,并在训练过程中对该距离大小进行约束以达到如下训练目标:
[0019][0020]
其中minf(
·
表示使函数f(
·
)取最小值,d(
·
,
·
表示训练时选用的积分概率度量函数,α和β都是训练过程中的可调超参数;
[0021]
深度神经网络模型f1训练完毕后得到平衡特征提取模型f'1。
[0022]
作为上述第一方面的优选,所述的s3的具体实现步骤为:
[0023]
s301:构建一对深度神经网络模型f2和f3,两个网络模型的结构相同,分别用于预测投放后结果和屏蔽后结果;
[0024]
s302:将输入用于预测投放结果的网络模型f2中,得到预测的广告投放后成交额结果值将输入用于预测屏蔽后结果的网络模型f3中,得到预测的广告屏蔽后成交额结果值
[0025]
s303:通过均方误差函数分别计算与被选入样本数据投放组(t=1)中的真实结果变量值y
t=1
的差异,以及与被选入样本数据屏蔽组(t=0)中的真实结果变量值y
t=0
的差异,并用所述数据集对深度神经网络模型f2和f3进行训练,在训练过程中对误差进行约束以达到如下训练目标:
[0026][0027]
其中,mse(
·
,
·
表示均方误差函数,γ是训练过程中的可调超参数,用于平衡被选入样本数据中投放组和屏蔽组数据条数的差异;
[0028]
深度神经网络模型f2和f3训练完毕后,分别作为投放后结果预测网络模型f'2和屏蔽后结果预测网络模型f'3。
[0029]
作为上述第一方面的优选,所述的s4的具体实现步骤为:
[0030]
s401:将目标店铺以及目标消费者的特征变量集x输入训练好的用于特征学习的平衡特征提取模型f'1中,得到其平衡特征表示;
[0031]
s402:将s401中得到的平衡特征表示分别输入到用于预测投放后结果的投放后结果预测网络模型f'2和用于预测屏蔽后结果的屏蔽后结果预测网络模型f'3中,分别得到投放后成交额结果和屏蔽后成交额结果的预测值,并以两者的差值作为广告增效估计值。
[0032]
作为上述第一方面的优选,所述的s203中,在训练过程中使用如下损失函数来达到训练目标:
[0033][0034]
所述s303中,在训练过程中使用如下损失函数来达到训练目标:
[0035][0036]
所述深度神经网络模型f1、f2和f3整体共同训练,整个网络模型在训练过程中使用的总损失函数如下:
[0037][0038]
作为上述第一方面的优选,α和β取值均为0.1;且采用的积分概率度量函数d(
·
,
·
为平方根线性最大化均值度量,计算公式为:
[0039][0040]
其中a和b表示任意两个变量个数相同的变量集,md表示变量个数,ma和mb分别表示a的数据条数和b的数据条数,表示a中第ia条数据的第j个变量的值,表示b中第ib条数据的第j个变量的值。
[0041]
作为上述第一方面的优选,γ取值为被选入样本数据中投放组数据条数和屏蔽组数据条数的比值;采用的均方误差函数mse(
·
,
·
的计算公式为
[0042][0043]
其中a表示某一变量的观测值,表示该变量的预测值,m表示数据条数,ai表示第i条数据中a的观测值,表示第i条数据中a的预测值。
[0044]
第二方面,本发明提供了一种面向线上购物平台的广告增效目标用户筛选方法,具体做法为:针对目标店铺,将其按照上述第一方面任一方案所述的去偏差因果推断方法,获得目标店铺和平台上每个消费者之间的广告增效估计值,然后基于广告增效估计值对平台上的消费者进行筛选,并将筛选结果作为该目标店铺进行广告增效的目标用户。
[0045]
第三方面,本发明提供了一种面向线上购物平台的广告增效目标用户筛选系统,其包括:
[0046]
广告增效估计模块,用于针对目标店铺,将其按照上述第一方面任一方案所述的去偏差因果推断方法,获得目标店铺和平台上每个消费者之间的广告增效估计值;
[0047]
用户筛选模块,用于根据预设的筛选策略,基于广告增效估计值对平台上的消费者进行筛选,并将筛选结果作为该目标店铺进行广告增效的目标用户。
[0048]
本发明与背景技术相比,具有的有益的效果是:
[0049]
本发明针对混淆偏差和样本选择偏差同时存在的广告增效建模问题,并指出了混淆偏差和样本选择偏差分别来源于可以观测到广告是否投放和投放或屏蔽后成交额的部分店铺和消费者特征的分布与全体店铺和消费者特征的分布不一致,以及观测到的广告投放组和广告屏蔽组的店铺和消费者特征的分布也不一致。由此,本发明提出了一种新颖的方法,同时优化了一个约束投放组和屏蔽组的店铺和消费者特征分布、被选入样本的店铺和消费者特征和未被选入样本的店铺和消费者特征分布相近的平衡特征表示学习模型,以及一对广告投放后和广告屏蔽后结果预测网络模型,进而对广告增效进行准确估计。基于本发明,可以进一步应用于线上购物平台中进行广告增效目标用户筛选,基于广告增效的估计结果有选择性地针对店铺筛选具有较高消费潜力的目标用户。实践结果表明了本发明所提出方法的优越性能。本发明也可以被直接用在其他存在混淆偏差和(或)样本选择偏差的观测数据的其他因果推断任务中。
附图说明
[0050]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0051]
图1是本发明实施例提供的面向广告增效建模场景的协同解决混淆偏差和样本选择偏差的因果推断技术流程示意图。
[0052]
图2是本发明实施例平衡表征与成交额预测协同学习模型逻辑图。
具体实施方式
[0053]
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0054]
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0055]
为了解决现有技术中存在的问题,本发明将重点放在,在不引入强假设、保证在广告业务场景中的实用性的前提下,同时解决观测数据中混淆偏差和样本选择偏差上。混淆偏差来源于观测数据中的处理组的数据分布和控制组的数据分布不同,而样本选择偏差来源于全体数据的分布和样本数据的分布不同。最近,有人研究了解决混淆偏差的因果推断方法,通过重加权、特征提取等方式使样本数据的处理组分布和控制组分布相近,但他们忽略了样本选择偏差,仅仅使用可以观测到结果的子样本数据进行处理效应估计,使得估计结果仍然受样本选择偏差影响。还有人研究了解决样本选择偏差的因果推断方法,但他们往往对数据和噪声的分布、结果变量生成过程的函数形式、样本选择过程的函数形式以及因果图结构等做出了很强的假设,这些假设在现实中往往难以满足,因此无法在广告业务场景中得到广泛应用。综上所述,目前还没有一套成熟的方法,能够在不引入强假设的前提下,同时解决混淆偏差和样本选择偏差。
[0056]
如图1所示,本发明的一个较佳实施例中,提供了一种面向广告增效建模场景的去偏差因果推断方法,包括如下步骤:
[0057]
s1:提取目标平台上的当期广告增效日志,并根据消费者和店铺信息是否在当期广告增效日志记录中,将店铺和消费者特征数据区分为被选入样本数据和未被选入样本数据两部分,并对两部分数据分别进行样本选择标记,其中被选入样本数据进一步区分广告的投放组和屏蔽组,从而构建形成数据集。
[0058]
在本实施例中,s1的具体实现步骤为:
[0059]
s101:根据消费者和店铺信息是否在当期广告增效日志记录中,将店铺、消费者特征数据区分为被选入样本的数据和未被选入样本的数据两部分;其中,所述当期广告增效日志记录提取自目标平台,其中记载着店铺的广告是否投放给消费者,以及当期结束前消费者在相应店铺的成交额;其中消费者是否接受了广告投放被定义为处理变量且表示为t,t=1表示消费者接受了广告投放(即属于投放广告组),t=0表示消费者未接受广告投放(即属于屏蔽广告组);当期结束前消费者在相应店铺的成交额被定义为结果变量且表示为y;店铺和消费者特征变量集表示为其中xj表示特征变量集中第j个变量,d表示特征变量集中的变量总数。
[0060]
本实施例中,在当期广告增效日志记录中,由于时间与成本限制,只监测记录了全部店铺和消费者中的一个子样本,因此当期广告增效记录日志中记载着当期内部分店铺的广告是否投放给部分消费者,以及当期结束前消费者在相应店铺的成交额。本实施例以s为样本选择标记,将目标平台上全部店铺和全部消费者数据中,被记录在当期广告增效日志记录中的店铺和消费者数据标记为被选入样本的数据,记作s=1;将将全部店铺和消费者数据中未被记录在当期广告增效日志记录中的店铺和消费者数据标记为未被选入样本的数据,记作s=0;
[0061]
s102:根据当期广告增效日志记录数据和店铺、消费者特征数据,将每个用来训练与测试的数据表示为四元组(x,t,y,s),并构建成数据集;其中s=1的数据的x,t,y,s都是可以观测的,而s=0的数据中t,y是不可观测的,在数据集中其取值设定为nan。
[0062]
下面表1展示了本发明实施例中的部分数据的样本选择标记与数据集构建结果。
[0063]
表1示例中的部分样本选择标记与数据集构建结果
[0064][0065]
s2:构建深度神经网络模型对店铺和消费者特征进行信息抽取,并利用所述数据集训练该深度神经网络模型,训练过程中通过一个积分概率度量模块对抽取信息的分布相似度进行限制,以得到在未被选入样本数据与被选入样本数据之间,以及在被选入样本数据的广告投放组和广告屏蔽组之间都达到平衡的特征表示;训练完毕后得到平衡特征提取模型。
[0066]
在本实施例中,s2的具体实现步骤为:
[0067]
s201:构建一个用于特征学习的深度神经网络模型f1,将数据集中的店铺、消费者特征变量集x输入该深度神经网络模型f1,得到其向量化特征表示
[0068]
s202:按照数据的处理变量t和样本选择标记s将区分为未被选入样本数据特征表示、被选入样本数据的特征表示、被选入样本数据的投放组特征表示和被选入样本数据的屏蔽组特征表示;其中,未被选入样本数据特征表示由所有s=0的数据的特征表示构成,记为被选入样本数据的特征表示由所有s=1数据的构成,记为被选入样本数据的投放组特征表示由所有s=1且t=1数据的构成,记为被选入样本数据的屏蔽组特征表示由所有s=1且t=0数据的构成,记为
[0069]
s203:用一个积分概率度量模块来计算和之间的分布距离以及和之间的分布距离并用所述数据集对深度神经网络模型f1进行训练,并在训练过程中对该距离大小进行约束以达到如下训练目标:
[0070][0071]
其中minf(
·
表示使函数f(
·
)取最小值,d(
·
,
·
表示训练时选用的积分概率度量函数,α和β都是训练过程中的可调超参数;
[0072]
深度神经网络模型f1训练完毕后得到平衡特征提取模型f'1。
[0073]
s3:构建基于深度神经网络的投放后成交额预测模型和屏蔽后结果预测网络模型,分别利用平衡后的被选入样本数据投放组特征表示和被选入样本数据屏蔽组特征表示进行训练,得到去除混淆偏差和样本选择偏差的投放后结果预测网络模型和屏蔽后结果预测网络模型。
[0074]
在本实施例中,s3的具体实现步骤为:
[0075]
s301:构建一对深度神经网络模型f2和f3,两个网络模型的结构相同,分别用于预测投放后结果和屏蔽后结果。
[0076]
需要注意的是,两个模型f2和f3的内部网络结构和处理流程相同,但其训练数据不同,因此可以给出不同处理变量取值下的结果变量预测值,具体参见后续的s302~s303。
[0077]
s302:将输入用于预测投放结果的网络模型f2中,得到预测的广告投放后成交额结果值将输入用于预测屏蔽后结果的网络模型f3中,得到预测的广告屏蔽后成交额结果值
[0078]
上述步骤中仅用投放组的被选入样本数据去训练投放后结果预测模型,仅用屏蔽组被选入样本数据去训练屏蔽后结果预测模型,因为本发明采用平衡后的向量化特征表示来代替原生的特征变量,因此消除了混淆偏差和样本选择偏差带来的分布不一致的影响,训练后的模型是无偏的。
[0079]
s303:通过均方误差函数分别计算与被选入样本数据投放组(t=1)中的真实结果变量值y
t=1
的差异,以及与被选入样本数据屏蔽组(t=0)中的真实结果变量值y
t=0
的差异,并用所述数据集对深度神经网络模型f2和f3进行训练,在训练过程中对误差进行约束以达到如下训练目标:
[0080][0081]
其中,mse(
·
,
·
表示均方误差函数,γ是训练过程中的可调超参数,用于平衡被选入样本数据中投放组和屏蔽组数据条数的差异;
[0082]
深度神经网络模型f2和f3训练完毕后,分别作为投放后结果预测网络模型f'2和屏
蔽后结果预测网络模型f'3。
[0083]
需要说明的是,本发明中一共需要训练三个深度神经网络模型,即前述的f1、f2和f3。在本实施例中,三个深度神经网络模型f1、f2和f3可整体共同训练,因此需要构建一个总的损失函数来实现三个模型的共同训练。在本实施例中,上述s203中,在训练过程中使用如下损失函数来达到训练目标:
[0084][0085]
上述s303中,在训练过程中使用如下损失函数来达到训练目标:
[0086][0087]
因此整个网络模型在训练过程中使用的总损失函数如下:
[0088][0089]
在本实施例中,计算上述损失项时,α和β取值均为0.1;且采用的积分概率度量函数d(
·
,
·
为平方根线性最大化均值度量,计算公式的通式形式为:
[0090][0091]
其中a和b表示任意两个变量个数相同的变量集,md表示变量个数,ma和mb分别表示a的数据条数和b的数据条数,表示a中第ia条数据的第j个变量的值,表示b中第ib条数据的第j个变量的值。
[0092]
在本实施例中,计算上述损失项时,γ取值为被选入样本数据中投放组数据条数和屏蔽组数据条数的比值;采用的均方误差函数mse(
·
,
·
的计算公式的通式形式为
[0093][0094]
其中a表示某一变量的观测值,表示该变量的预测值,m表示数据条数,ai表示第i条数据中a的观测值,表示第i条数据中a的预测值。
[0095]
上述三个深度神经网络模型f1、f2和f3训练完毕后,即可对应于平衡特征提取模型f'1、投放后结果预测网络模型f'2和屏蔽后结果预测网络模型f'3,因此对于任一店铺以及消费者,都可以用着三个训练后的模型来进行广告投放前后的成交额预测,下面将进行详细描述。
[0096]
s4:基于训练后的平衡特征提取模型、投放后结果预测网络模型和屏蔽后结果预测网络模型,分别对目标店铺和目标消费者的广告投放后成交额和广告屏蔽后成交额进行预测,估计得到目标店铺和目标消费者对应的广告增效。
[0097]
在本实施例中,s4的具体实现步骤为:
[0098]
s401:将目标店铺以及目标消费者的特征变量集x输入训练好的用于特征学习的平衡特征提取模型f'1中,得到其平衡特征表示;
[0099]
s402:将s401中得到的平衡特征表示分别输入到用于预测投放后结果的投放后结果预测网络模型f'2和用于预测屏蔽后结果的屏蔽后结果预测网络模型f'3中,分别得到投放后成交额结果和屏蔽后成交额结果的预测值,并以两者的差值作为广告增效估计值。
[0100]
由此,对于每一个店铺和消费者的配对组合,都可以通过上述s401和s402估计其广告增效。此时,数据中原本缺失的反事实结果(原本t=1的数据在t=0时的结果,原本t=0的数据在t=1时的结果),以及未被选入样本数据的无法观测的事实与反事实结果(s=0的数据在t=0时和t=1时的结果)都可以被无偏地预测出来。
[0101]
而且本发明也可以进一步用来估计全体数据的平均处理效应,即如果需要估计所有店铺和所有消费者之间广告增效,则对全体店铺和消费者的广告投放后成交额和广告屏蔽后成交额进行预测,估计得到全体店铺和消费者的广告增效,并按照下式计算相应的平均值:
[0102][0103]
其中n表示全体数据的数据条数,表示第i条数据的投放后广告增效结果的估计值,表示第i条数据的屏蔽后广告增效结果的估计值。
[0104]
上述s1~s4对应的整体框架如图2所示,其中用于特征表示学习的深度神经网络模型和用于预测投放后与屏蔽后结果的深度神经网络模型结合成整体共同训练,即特征表示学习深度神经网络模型、投放后结果预测深度神经网络模型和屏蔽后结果预测深度神经网络模型均需要一起进行训练优化,得到前述的平衡特征提取模型f'1、投放后结果预测网络模型f'2和屏蔽后结果预测网络模型f'3。
[0105]
本发明中,用于特征表示学习的深度神经网络模型对全体店铺和消费者的特征变量集进行了信息提取,并约束投放组和屏蔽组的店铺和消费者特征分布、被选入样本的店铺和消费者特征和未被选入样本的店铺和消费者特征分布相近,得到平衡后的特征表示,有效消除了混淆偏差和样本选择偏差带来的上述分布差异,进而可以仅利用被选入样本数据的观测成交额和平衡向量化特征,预测全体店铺和消费者的广告投放后成交额和广告屏蔽后成交额。通过上述过程,本发明可以无偏地估计全体店铺和消费者的广告增效。
[0106]
基于本发明中上述s1~s4所示的面向广告增效建模场景的去偏差因果推断方法,来估计广告增效的性能可通过相关指标进行客观评估,评估指标包括:
[0107]
1)偏差bias。该指标将每次实验中平均增效的估计值与真实值直接进行作差比较,计算其平均值的绝对值,衡量估计结果的正确性:
[0108][0109]
其中k表示实验次数,取值为50;表示第i次实验的平均增效估计值,atei表示第i次实验的平均增效真实值。
[0110]
2)标准差sd。该指标计算实验中平均增效的估计值的标准差,衡量估计结果的稳定性:
[0111][0112]
3)平均绝对误差mae。该指标计算平均增效的估计值与真实值的差值绝对值的平
均值,衡量估计结果的正确性:
[0113][0114]
4)均方根误差rmse。该指标计算平均增效的估计值与真实值的差值的均方根,同时衡量估计结果的正确性和稳定性:
[0115][0116]
结果表明,本发明的估计结果与真实的广告增效基本一致,能够符合应用要求,且本发明的估计方法具有较高的增效估计的稳定性和正确率。另外,在本发明的另一实施例中,还可以进一步提供一种面向线上购物平台的广告增效目标用户筛选方法,其具体做法是:
[0117]
针对目标店铺,将其按照前述s1~s4所示的面向广告增效建模场景的去偏差因果推断方法,获得目标店铺和平台上每个消费者之间的广告增效估计值,然后基于广告增效估计值对平台上的消费者进行筛选,并将筛选结果作为该目标店铺进行广告增效的目标用户。
[0118]
需要说明的是,对于平台上的每一个目标店铺和每个消费者,将其配对后进行广告增效估计的方式即前述的s4步骤,将目标店铺以及对应消费者的特征变量集x输入训练好的用于特征学习的平衡特征提取模型f'1中,得到其平衡特征表示;再将得到的平衡特征表示分别输入到用于预测投放后结果的投放后结果预测网络模型f'2和用于预测屏蔽后结果的屏蔽后结果预测网络模型f'3中,分别得到投放后成交额结果和屏蔽后成交额结果的预测值,并以两者的差值作为广告增效估计值。
[0119]
另外,在本发明的另一实施例中,还可以进一步提供一种面向线上购物平台的广告增效目标用户筛选系统,其包括:
[0120]
广告增效估计模块,用于针对目标店铺,将其按照前述s1~s4所示的面向广告增效建模场景的去偏差因果推断方法,获得目标店铺和平台上每个消费者之间的广告增效估计值;
[0121]
用户筛选模块,用于根据预设的筛选策略,基于广告增效估计值对平台上的消费者进行筛选,并将筛选结果作为该目标店铺进行广告增效的目标用户。
[0122]
需要说明的是,本发明中具体的筛选策略可根据实际需要进行调整,例如可以设置一个广告增效的最低阈值,然后将平台上广告增效估计值超过该最低阈值的所有消费者作为目标用户。另外,也可以根据目标店铺的拟投放广告的用户数量,按照广告增效估计值从高到低的顺序进行目标用户的筛选,从而筛选得到广告增效估计值最高的指定数量的目标用户,实现成交额提升的最大化。
[0123]
以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
技术特征:
1.一种面向广告增效建模场景的去偏差因果推断方法,其特征在于,包括如下步骤:s1:提取目标平台上的当期广告增效日志,并根据消费者和店铺信息是否在当期广告增效日志记录中,将店铺和消费者特征数据区分为被选入样本数据和未被选入样本数据两部分,并对两部分数据分别进行样本选择标记,其中被选入样本数据进一步区分广告的投放组和屏蔽组,从而构建形成数据集;s2:构建深度神经网络模型对店铺和消费者特征进行信息抽取,并利用所述数据集训练该深度神经网络模型,训练过程中通过一个积分概率度量模块对抽取信息的分布相似度进行限制,以得到在未被选入样本数据与被选入样本数据之间,以及在被选入样本数据的广告投放组和广告屏蔽组之间都达到平衡的特征表示;训练完毕后得到平衡特征提取模型;s3:构建基于深度神经网络的投放后成交额预测模型和屏蔽后结果预测网络模型,分别利用平衡后的被选入样本数据投放组特征表示和被选入样本数据屏蔽组特征表示进行训练,得到去除混淆偏差和样本选择偏差的投放后结果预测网络模型和屏蔽后结果预测网络模型;s4:基于训练后的平衡特征提取模型、投放后结果预测网络模型和屏蔽后结果预测网络模型,分别对目标店铺和目标消费者的广告投放后成交额和广告屏蔽后成交额进行预测,估计得到目标店铺和目标消费者对应的广告增效。2.如权利要求1所述的面向广告增效建模场景的去偏差因果推断方法,其特征在于,所述的s1的具体实现步骤为:s101:根据消费者和店铺信息是否在当期广告增效日志记录中,将店铺、消费者特征数据区分为被选入样本的数据和未被选入样本的数据两部分;其中,所述当期广告增效日志记录提取自目标平台,其中记载着店铺的广告是否投放给消费者,以及当期结束前消费者在相应店铺的成交额;其中消费者是否接受了广告投放被定义为处理变量且表示为t,t=1表示消费者接受了广告投放即属于投放组,t=0表示消费者未接受广告投放即属于屏蔽组;当期结束前消费者在相应店铺的成交额被定义为结果变量且表示为y;店铺和消费者特征变量集表示为其中x
j
表示特征变量集中第j个变量,d表示特征变量集中的变量总数;以s为样本选择标记,将目标平台上全部店铺和全部消费者数据中,被记录在当期广告增效日志记录中的店铺和消费者数据标记为被选入样本的数据,记作s=1;将将全部店铺和消费者数据中未被记录在当期广告增效日志记录中的店铺和消费者数据标记为未被选入样本的数据,记作s=0;s102:根据当期广告增效日志记录数据和店铺、消费者特征数据,将每个数据表示为四元组(x,t,y,s),并构建成数据集;其中s=1的数据的x,t,y,s都是可以观测的,而s=0的数据中t,y是不可观测的,在数据集中其取值设定为nan。3.如权利要求1所述的面向广告增效建模场景的去偏差因果推断方法,其特征在于,所述的s2的具体实现步骤为:s201:构建一个用于特征学习的深度神经网络模型f1,将数据集中的店铺、消费者特征变量集x输入该深度神经网络模型f1,得到其向量化特征表示
s202:按照数据的处理变量t和样本选择标记s将区分为未被选入样本数据特征表示、被选入样本数据的特征表示、被选入样本数据的投放组特征表示和被选入样本数据的屏蔽组特征表示;其中,未被选入样本数据特征表示由所有s=0的数据的特征表示构成,记为被选入样本数据的特征表示由所有s=1数据的构成,记为被选入样本数据的投放组特征表示由所有s=1且t=1数据的构成,记为被选入样本数据的屏蔽组特征表示由所有s=1且t=0数据的构成,记为s203:用一个积分概率度量模块来计算和之间的分布距离以及和之间的分布距离并用所述数据集对深度神经网络模型f1进行训练,并在训练过程中对该距离大小进行约束以达到如下训练目标:其中minf(
·
表示使函数f(
·
)取最小值,d(
·
,
·
表示训练时选用的积分概率度量函数,α和β都是训练过程中的可调超参数;深度神经网络模型f1训练完毕后得到平衡特征提取模型f'1。4.如权利要求3所述的面向广告增效建模场景的去偏差因果推断方法,其特征在于,所述的s3的具体实现步骤为:s301:构建一对深度神经网络模型f2和f3,两个网络模型的结构相同,分别用于预测投放后结果和屏蔽后结果;s302:将输入用于预测投放结果的网络模型f2中,得到预测的广告投放后成交额结果值将输入用于预测屏蔽后结果的网络模型f3中,得到预测的广告屏蔽后成交额结果值s303:通过均方误差函数分别计算与被选入样本数据投放组中的真实结果变量值y
t=1
的差异,以及与被选入样本数据屏蔽组中的真实结果变量值y
t=0
的差异,并用所述数据集对深度神经网络模型f2和f3进行训练,在训练过程中对误差进行约束以达到如下训练目标:其中,mse(
·
,
·
表示均方误差函数,γ是训练过程中的可调超参数,用于平衡被选入样本数据中投放组和屏蔽组数据条数的差异;深度神经网络模型f2和f3训练完毕后,分别作为投放后结果预测网络模型f'2和屏蔽后结果预测网络模型f'3。5.如权利要求1所述的面向广告增效建模场景的去偏差因果推断方法,其特征在于,所述的s4的具体实现步骤为:s401:将目标店铺以及目标消费者的特征变量集x输入训练好的用于特征学习的平衡特征提取模型f'1中,得到其平衡特征表示;s402:将s401中得到的平衡特征表示分别输入到用于预测投放后结果的投放后结果预测网络模型f'2和用于预测屏蔽后结果的屏蔽后结果预测网络模型f'3中,分别得到投放后成交额结果和屏蔽后成交额结果的预测值,并以两者的差值作为广告增效估计值。6.如权利要求4所述的面向广告增效建模场景的去偏差因果推断方法,其特征在于,所
述的s203中,在训练过程中使用如下损失函数来达到训练目标:所述s303中,在训练过程中使用如下损失函数来达到训练目标:所述深度神经网络模型f1、f2和f3整体共同训练,整个网络模型在训练过程中使用的总损失函数如下:7.如权利要求3所述的面向广告增效建模场景的去偏差因果推断方法,其特征在于,α和β取值均为0.1;且采用的积分概率度量函数d(
·
,
·
为平方根线性最大化均值度量,计算公式为:其中a和b表示任意两个变量个数相同的变量集,m
d
表示变量个数,m
a
和m
b
分别表示a的数据条数和b的数据条数,表示a中第i
a
条数据的第j个变量的值,表示b中第i
b
条数据的第j个变量的值。8.如权利要求4所述的面向广告增效建模场景的去偏差因果推断方法,其特征在于,γ取值为被选入样本数据中投放组数据条数和屏蔽组数据条数的比值;采用的均方误差函数mse(
·
,
·
的计算公式为其中a表示某一变量的观测值,表示该变量的预测值,m表示数据条数,a
i
表示第i条数据中a的观测值,表示第i条数据中a的预测值。9.一种面向线上购物平台的广告增效目标用户筛选方法,其特征在于,针对目标店铺,将其按照权利要求1~8任一所述的去偏差因果推断方法,获得目标店铺和平台上每个消费者之间的广告增效估计值,然后基于广告增效估计值对平台上的消费者进行筛选,并将筛选结果作为该目标店铺进行广告增效的目标用户。10.一种面向线上购物平台的广告增效目标用户筛选系统,其特征在于,包括:广告增效估计模块,用于针对目标店铺,将其按照权利要求1~8任一所述的去偏差因果推断方法,获得目标店铺和平台上每个消费者之间的广告增效估计值;用户筛选模块,用于根据预设的筛选策略,基于广告增效估计值对平台上的消费者进行筛选,并将筛选结果作为该目标店铺进行广告增效的目标用户。
技术总结
本发明公开了一种面向广告增效建模场景的去偏差因果推断方法及其系统。本发明包括如下步骤:1)首先基于当期广告增效日志记录对店铺、消费者特征数据进行划分并构建数据集;2)构建深度神经网络模型,对店铺和消费者特征进行信息抽取,再通过一个积分概率度量模块对抽取信息的分布相似度进行限制,以得到平衡的特征表示;3)构建基于深度神经网络的投放后成交额预测模型和屏蔽后结果预测网络模型,并基于平衡后的特征表示进行训练;4)基于训练后的去偏模型广告投放后成交额和广告屏蔽后成交额进行预测,估计广告增效。本发明实现了对广告增效的准确建模,能够面向线上购物平台进行广告增效目标用户筛选。告增效目标用户筛选。告增效目标用户筛选。
技术研发人员:况琨 李保宏 吴飞
受保护的技术使用者:浙江大学
技术研发日:2023.06.16
技术公布日:2023/9/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/