媒体信息的处理方法、装置和存储介质及电子设备与流程

未命名 07-22 阅读:69 评论:0


1.本发明涉及计算机领域,具体而言,涉及一种媒体信息的处理方法、装置和存储介质及电子设备。


背景技术:

2.近年来,随着商业竞争的加剧,商家越来越重视媒体信息(如广告)投放,广告商也希望为商家提供最佳的广告版位,进而实现双赢的局面,如广告版位的受众标签为a,进而将受众标签同为a的广告发布至该广告版位。但如果广告版位或广告的受众标签的准确性无法保证,上述双赢的局面自然也就无法实现,对此相关技术通常利用广告转化数等数据对该受众标签是否准确进行辅助判断。
3.而在实际应用中,很多行业的广告转化数本身就很小,进而导致各个行业对上述受众标签是否准确的判断标准也存在不同,而相对应的在现有技术中,并未针对不同行业下的广告提供针对性更强的处理方式,以得到准确性更高的媒体信息,进而自然无法实现上述双赢的局面。因此,存在媒体信息的准确性较低的问题。
4.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

5.本发明实施例提供了一种媒体信息的处理方法、装置和存储介质及电子设备,以至少解决媒体信息的准确性较低的技术问题。
6.根据本发明实施例的一个方面,提供了一种媒体信息的处理方法,包括:获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值;确定上述目标媒体信息统计维度下的媒体信息,得到第一媒体信息集合,其中,上述第一媒体信息集合中的媒体信息对应的行业为上述目标行业标识所表示的行业,上述第一媒体信息集合中的媒体信息的标签包括目标标签;获取第一时长内上述第一媒体信息集合在上述目标标签下的第一发布结果;确定上述第一发布结果与上述目标发布数据阈值的匹配结果;根据上述匹配结果,对上述第一媒体信息集合在上述目标标签下的发布概率进行调整。
7.根据本发明实施例的另一方面,还提供了一种媒体信息的处理装置,包括:第一获取单元,用于获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值;第一确定单元,用于确定上述目标媒体信息统计维度下的媒体信息,得到第一媒体信息集合,其中,上述第一媒体信息集合中的媒体信息对应的行业为上述目标行业标识所表示的行业,上述第一媒体信息集合中的媒体信息的标签包括目标标签;第二获取单元,用于获取第一时长内上述第一媒体信息集合在上述目标标签下的第一发布结果;第二确定单元,用于确定上述第一发布结果与上述目标发布数据阈值的匹配结果;处理单元,用于根据上述匹配结果,对上述第一媒体信息集合在上述目标标签下的发布概率进行调整。
8.作为一种可选的方案,上述第一获取单元,包括:第一获取模块,用于在目标映射表中,获取上述目标行业标识当前对应的上述目标媒体信息统计维度和上述目标发布数据
阈值,其中,上述目标映射表中记录有多组具有对应关系的行业标识、媒体信息统计维度和发布数据阈值,上述目标映射表中不同的行业标识表示不同的行业。
9.作为一种可选的方案,上述装置还包括:第二获取模块,用于获取行业标识集合和第二媒体信息集合,其中,上述行业标识集合包括不同的n个行业标识,上述第二媒体信息集合包括与上述n个行业标识对应的n个媒体信息子集,每个媒体信息子集对应一个行业标识,上述第二媒体信息集合中的每个媒体信息对应的标签包括一个或多个标签,n为大于或等于2的正整数;第三获取模块,用于获取第二时长内上述第二媒体信息集合中的媒体信息在对应的各个标签下的第二发布结果;第一确定模块,用于根据上述第二发布结果,确定与上述n个行业标识对应的n组媒体信息统计维度和发布数据阈值,其中,上述目标映射表包括上述n个行业标识以及与上述n个行业标识对应的n组媒体信息统计维度和发布数据阈值。
10.作为一种可选的方案,上述第三获取模块,包括:第一执行子模块,用于对于上述第二媒体信息集合中的每个媒体信息和每个媒体信息对应的各个标签执行以下步骤,其中,在执行以下步骤时,上述每个媒体信息为当前媒体信息,上述每个媒体信息对应的各个标签为当前标签:第一获取子模块,用于获取上述第二时长内上述当前媒体信息在上述当前标签下的第二发布结果,其中,上述第二发布结果包括:上述第二时长内上述当前媒体信息在上述当前标签下的当前转化数量、当前资源转移数量偏差值、当前转化率,其中,上述当前转化数量表示上述第二时长内上述当前媒体信息在上述当前标签下被发布给对应的帐号之后,上述对应的帐号针对上述当前媒体信息执行目标操作的次数,上述当前资源转移数量偏差值表示当前实际资源转移数量与当前预估资源转移数量的偏差,上述当前实际资源转移数量表示上述当前转化数量对应的实际产生的资源转移数量,上述预估资源转移数量表示上述当前转化数量对应的预计产生的资源转移数量,上述当前转化率表示上述当前转化数量与当前发布数量之间的比值,上述当前发布数量表示上述第二时长内上述当前媒体信息在上述当前标签下被发布给对应的帐号的次数。
11.作为一种可选的方案,上述第一确定模块,包括:第二执行子模块,用于对于上述n个行业标识中的每个行业标识,执行以下步骤,其中,在执行以下步骤时,上述每个行业标识为当前行业标识,上述当前行业标识对应上述n个媒体信息子集中的当前媒体信息子集,上述当前行业标识对应待确定的当前媒体信息统计维度和当前发布数据阈值,上述当前媒体信息统计维度的取值范围是m个统计维度、且上述当前发布数据阈值包括当前转化数阈值、与劣质标签对应的当前第一偏差阈值以及与优质标签对应的当前第二偏差阈值,上述当前转化数阈值的取值范围包括与上述m个统计维度对应的m个转化数量取值范围、上述当前第一偏差阈值的取值范围为第一偏差阈值取值范围、上述当前第二偏差阈值的取值范围为第二偏差阈值取值范围,m为大于或等于2的正整数:第一确定子模块,用于根据上述当前媒体信息子集中的每个媒体信息在对应的各个标签下的上述第二发布结果,确定与上述m个统计维度中的不同统计维度、上述不同统计维度对应的转化数量取值范围中的不同转化数量、上述第一偏差阈值取值范围中的不同第一偏差阈值、上述第二偏差阈值取值范围中的不同第二偏差阈值对应的组合转化率,得到s个组合转化率,其中,s为大于或等于2的正整数;第二确定子模块,用于在上述s个组合转化率中确定取值最大的目标组合转化率,并将上述当前媒体信息统计维度确定为等于上述目标组合转化率对应的统计维度,将上述当
前发布数据阈值中的当前转化数阈值、当前第一偏差阈值以及当前第二偏差阈值分别确定为等于上述目标组合转化率对应的转化数量、对应的上述第一偏差阈值、对应的上述第二偏差阈值。
12.作为一种可选的方案,上述第一确定子模块,包括:第一获取子单元,用于在上述m个统计维度中的不同统计维度为第i个统计维度、上述不同统计维度对应的转化数量取值范围中的不同转化数量为j、上述第一偏差阈值取值范围中的不同第一偏差阈值为t1,上述第二偏差阈值取值范围中的不同第二偏差阈值为t2时,获取上述当前媒体信息子集中上述第i个统计维度下的媒体信息,得到第i个媒体信息子集,1≤i≤m,j、t1、t2均为正数,t2《t1;第二获取子单元,用于获取上述第二时长内上述第i个媒体信息子集中的每个媒体信息在对应的各个标签下的转化数量、资源转移数量偏差值、转化率;第一确定子单元,用于在上述第i个媒体信息子集中的每个媒体信息在对应的各个标签下的转化数量大于或等于j时,根据上述第i个媒体信息子集中的每个媒体信息在对应的各个标签下的资源转移数量偏差值与t1和t2之间的关系,确定上述第i个媒体信息子集中的每个媒体信息对应的各个标签的类型,其中,在上述第i个媒体信息子集中的每个媒体信息在对应的标签下的资源转移数量偏差值大于或等于t1时,将上述对应的标签的类型确定为上述劣质标签,在上述第i个媒体信息子集中的每个媒体信息在对应的标签下的资源转移数量偏差值小于t2时,将上述对应的标签的类型确定为上述优质标签,在上述第i个媒体信息子集中的每个媒体信息在对应的标签下的资源转移数量偏差值大于或等于t2、且小于t1时,将上述对应的标签的类型确定为中性标签;第三获取子单元,用于获取上述第i个媒体信息子集中的每个媒体信息在类型为上述优质标签的各个标签下的转化率的第一均值、上述第i个媒体信息子集中的每个媒体信息在类型为上述中性标签的各个标签下的转化率的第二均值、以及上述第i个媒体信息子集中的每个媒体信息在类型为上述劣质标签的各个标签下的转化率的第三均值;第二确定子单元,用于根据上述第一均值、上述第二均值和上述第三均值,确定与上述第i个统计维度、j、t1以及t2对应的组合转化率。
13.作为一种可选的方案,上述第三获取模块,包括:第二获取子模块,用于每隔预设周期获取上述第二时长内上述第二媒体信息集合中的媒体信息在对应的各个标签下的第二发布结果,其中,上述目标映射表每隔上述预设周期被更新一次。
14.作为一种可选的方案,上述第一确定单元,包括以下至少之一:第二确定模块,用于在上述目标媒体信息统计维度表示按照单个媒体信息的维度进行统计时,确定目标媒体信息,其中,上述第一媒体信息集合包括上述目标媒体信息;第三确定模块,用于在上述目标媒体信息统计维度表示按照单个提供帐号和单个委托帐号的维度进行统计时,确定目标提供帐号通过目标委托帐号提供的媒体信息,得到上述第一媒体信息集合;第四确定模块,用于在上述目标媒体信息统计维度表示按照单个提供帐号和多个委托帐号的维度进行统计时,确定目标提供帐号通过多个目标委托帐号提供的媒体信息,得到上述第一媒体信息集合。
15.作为一种可选的方案,上述第二获取单元,包括:第四获取模块,用于获取上述第一时长内上述第一媒体信息集合在上述目标标签下的转化数量和资源转移数量偏差值,其中,上述转化数量表示上述第一时长内上述第一媒体信息集合中的媒体信息在上述目标标签下被发布给对应的帐号之后,上述对应的帐号针对上述第一媒体信息集合中的媒体信息
执行目标操作的次数,上述资源转移数量偏差值表示实际资源转移数量与预估资源转移数量的偏差,上述实际资源转移数量表示上述转化数量对应的实际产生的资源转移数量,上述预估资源转移数量表示上述转化数量对应的预计产生的资源转移数量。
16.作为一种可选的方案,上述第二确定单元,包括:第五确定模块,用于在上述目标发布数据阈值包括目标转化数阈值、以及与大于或等于上述目标转化数阈值所对应的多个偏差范围时,确定上述转化数量是否大于或等于上述目标转化数阈值,其中,上述多个偏差范围包括与劣质标签对应的第一偏差范围以及与优质标签对应的第二偏差范围,上述第一偏差范围中的偏差值大于上述第二偏差范围中的偏差值;第六确定模块,用于在上述转化数量大于或等于上述目标转化数阈值时,确定上述资源转移数量偏差值是否位于上述第一偏差范围或位于上述第二偏差范围内;第七确定模块,用于在上述资源转移数量偏差值位于上述第一偏差范围内时,将上述匹配结果确定为用于表示上述目标标签的类型为上述劣质标签;第八确定模块,用于在上述资源转移数量偏差值位于上述第二偏差范围内时,将上述匹配结果确定为用于表示上述目标标签的类型为上述优质标签。
17.作为一种可选的方案,上述处理单元,包括:第一调整模块,用于在上述匹配结果用于表示上述目标标签的类型为上述劣质标签时,对上述第一媒体信息集合在上述目标标签下的发布概率进行下降调整;第二调整模块,用于在上述匹配结果用于表示上述目标标签的类型为上述优质标签时,对上述第一媒体信息集合在上述目标标签下的发布概率进行增加调整。
18.根据本技术实施例的又一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以上媒体信息的处理方法。
19.根据本发明实施例的又一方面,还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的媒体信息的处理方法。
20.在本发明实施例中,获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值;确定上述目标媒体信息统计维度下的媒体信息,得到第一媒体信息集合,其中,上述第一媒体信息集合中的媒体信息对应的行业为上述目标行业标识所表示的行业,上述第一媒体信息集合中的媒体信息的标签包括目标标签;获取第一时长内上述第一媒体信息集合在上述目标标签下的第一发布结果;确定上述第一发布结果与上述目标发布数据阈值的匹配结果;根据上述匹配结果,对上述第一媒体信息集合在上述目标标签下的发布概率进行调整,通过对不同行业下的媒体信息提供针对性更强的处理方式,对用于媒体信息的发布方向的目标标签进行优劣判断,进而达到了对各个行业的媒体信息在目标标签下的发布概率进行优化调整的目的,从而实现了提高媒体信息的准确性的技术效果,进而解决了媒体信息的准确性较低的技术问题。
附图说明
21.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
22.图1是根据本发明实施例的一种可选的媒体信息的处理方法的应用环境的示意图;
23.图2是根据本发明实施例的一种可选的媒体信息的处理方法的流程的示意图;
24.图3是根据本发明实施例的一种可选的媒体信息的处理方法的示意图;
25.图4是根据本发明实施例的另一种可选的媒体信息的处理方法的示意图;
26.图5是根据本发明实施例的另一种可选的媒体信息的处理方法的示意图;
27.图6是根据本发明实施例的另一种可选的媒体信息的处理方法的示意图;
28.图7是根据本发明实施例的另一种可选的媒体信息的处理方法的示意图;
29.图8是根据本发明实施例的另一种可选的媒体信息的处理方法的示意图;
30.图9是根据本发明实施例的另一种可选的媒体信息的处理方法的示意图;
31.图10是根据本发明实施例的另一种可选的媒体信息的处理方法的示意图;
32.图11是根据本发明实施例的另一种可选的媒体信息的处理方法的示意图;
33.图12是根据本发明实施例的一种可选的媒体信息的处理装置的示意图;
34.图13是根据本发明实施例的一种可选的电子设备的结构示意图。
具体实施方式
35.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
36.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
37.为了方便理解,对一些关键术语与技术名词作以下解释:
38.竞价广告:由用户自主投放、自主管理,通过广告价格来进行排名,按照广告效果付费的在线广告。
39.达成成本:|广告实际成本-广告出价|/广告出价≤指定阈值α(α<1)。
40.达成率(按消耗算):达成成本的广告消耗/所有广告消耗*100%。
41.达成率(按广告数算):达成成本的广告数/所有广告数*100%。
42.空耗广告:消耗≥n个转化出价,且转化数<m1的广告(n,m1为正整数)。
43.起量:首日曝光在计算周期内,转化回流时间为计算周期+后延t天,累积转化数达到m2个(t为非负整数,m2为正整数)。
44.起量率(按消耗算):起量广告的消耗/所有广告消耗*100%。
45.起量率(按广告数算):起量广告数/所有广告数*100%。
46.预估偏差:|预估值-真实值|/真实值*100%。
47.消耗:实际扣费。
48.转化数:如激活数、下载数、有效线索数。
49.广告实际成本(cpa):消耗/转化数。
50.广告出价(target cpa):目标cpa用户在广告平台投放的目标。
51.点击率:可以但不限于为网站页面上某一内容被点击的次数与被显示次数纸币,可以但不限于反映了网页上某一内容的受关注程度,用来衡量广告的吸引程度。
52.转化率:可以但不限于为某一反应物转化的百分率或分率,在广告场景下,可选的,商户先设定一个转化目标,例如访客在网站上完成目标任务(注册、下订单、付款等),则访客完成目标任务的数量,即为转化目标完成的次数,而转化率可以但不限于在一个统计周期内,完成转化目标的次数占通光信息总点击次数的比率,计算公式可以但不限于为:转化率=(转化次数/点击次数)*100%。可选的,转化率可以但不限为网站最终是否能盈利的核心,提升网站转化率是网站综合运营实力的结果。
53.原始定向:广告主在使用智能定向功能(含自动扩量、系统优选)之外,自主设定的定向组合条件。
54.通投宽定向与精准窄定向:宽定向,和窄定向对应。如何具体定义呢?直接的想法,应该按照定向条件来判断,但是,不同定向条件又有较多细分标签,甚至是复杂的逻辑表达式,所以还要看实际覆盖用户数,但是,不同用户活跃度不同,不同流量也会有很大差异,所以想要精确计算并不可行。
55.不可突破定向:又称不可忽略定向,是广告主自主设定无论如何必须满足的定向条件。
56.自动扩量:在广告主手动选择精准窄定向基础上,系统做智能扩量。
57.系统优选:在广告主手动选择通投宽定向基础上,系统做智能调量。
58.lookalike:在广告主给定少量高质量用户包(老客)基础上,系统自动拓展更大规模的相似用户(潜在新客)。
59.广告集中度问题:又称头部广告问题,主要体现在不同用户都倾向于检索召回同一批少量的广告集合,导致其他广告没有曝光机会。
60.根据本发明实施例的一个方面,提供了一种媒体信息的处理方法,可选地,作为一种可选的实施方式,上述媒体信息的处理方法可以但不限于应用于如图1所示的环境中。其中,可以但不限于包括用户设备102、网络110及服务器112,其中,该用户设备102上可以但不限于包括显示器108、处理器106及存储器104。
61.具体过程可如下步骤:
62.步骤s102,用户设备102获取目标行业标识1002,如虚拟游戏行业标识;
63.步骤s104-s106,用户设备102通过网络110将目标行业标识1002发送给服务器112;
64.步骤s108,服务器112通过数据库114查找目标行业标识1002当前对应的目标媒体信息统计维度下的媒体信息(第一媒体信息集合)和目标发布数据阈值,以及第一时长内第一媒体信息集合在目标标签下的第一发布结果;并通过处理引擎116确定第一发布结果与目标发布数据阈值的匹配结果,以及根据匹配结果进一步对第一媒体信息集合在目标标签
下的发布概率进行调整,从而生成调整后的发布概率;
65.步骤s110-s112,服务器112通过网络110将调整后的发布概率发送给用户设备102,用户设备102中的处理器106根据调整后的发布概率将目标标签的优劣等级显示在显示器108中,并将调整后的发布概率存储在存储器104中。
66.除图1示出的示例之外,上述步骤可以由用户设备102独立完成,即由用户设备102执行第一媒体信息集合的获取、目标发布数据阈值的获取、第一发布结果的获取、匹配结果的确定、发布概率的调整等步骤,从而减轻服务器的处理压力。该用户设备102包括但不限于手持设备(如手机)、笔记本电脑、台式电脑、车载设备等,本发明并不限制用户设备102的具体实现方式。
67.可选地,作为一种可选的实施方式,如图2所示,媒体信息的处理方法包括:
68.s202,获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值;
69.s204,确定目标媒体信息统计维度下的媒体信息,得到第一媒体信息集合,其中,第一媒体信息集合中的媒体信息对应的行业为目标行业标识所表示的行业,第一媒体信息集合中的媒体信息的标签包括目标标签;
70.s206,获取第一时长内第一媒体信息集合在目标标签下的第一发布结果;
71.s208,确定第一发布结果与目标发布数据阈值的匹配结果;
72.s210,根据匹配结果,对第一媒体信息集合在目标标签下的发布概率进行调整。
73.可选地,在本实施例中,上述媒体信息的处理方法可以但不限于应用在根据标签进行广告投放的场景中,例如针对不同行业对广告标签的判断标准提供最佳的优化方式,在一定程度上解决了各行业所存在的对标签的质量判断偏差的问题。具体的,获取一个行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值;进一步确定目标媒体信息统计维度下的媒体信息,并获取该媒体信息在待判断优劣的目标标签下的发布结果;再者,利用获取到的上述目标发布数据阈值对该发布结果进行校验,判断二者是否匹配,若不匹配则根据匹配结果对该媒体信息在目标标签下的发布概率进行调整,以完成对单个行业对广告标签的优化。同理,还可利用上述媒体信息的处理方法对其他行业对广告标签的判断标准提供类似的优化方式。
74.可选地,在本实施例中,行业标识可以但不限用于区分以及标识各个行业,如目标行业标识可以但不限用于标识平台电商行业、直营电商行业、品牌电商行业、教育行业、金融行业或游戏行业等。而各个行业所对应的目标发布数据阈值可以但不限于存在不同,或者说各个行业对目标发布数据阈值标准可以但不限于存在不同,因此就需要更加灵活地方式针对不同行业的不同目标发布数据阈值标准对媒体信息进行处理。
75.可选地,在本实施例中,目标媒体信息统计维度可以但不限于包括一个或多个媒体信息统计维度,且在目标媒体信息统计维度包括多个媒体信息统计维度的情况下,多个媒体信息统计维度可以但不限于被分为不同统计等级的维度,如第一统计等级的维度为范围较小的维度、第二统计等级的维度为范围较大的维度,其中,范围较小即表示可获得的媒体信息的信息数量较少、但准确性较高,反之范围较大即表示可获得的媒体信息的信息数量较大、但准确性较低;基于此,确定目标媒体信息统计维度下的媒体信息包括:在第一统计等级的维度下对应的媒体信息不充分,或者说未达到统计条件的情况下,将进一步获取
第二统计等级的维度下对应的媒体信息,并将第一统计等级的维度下对应的媒体信息以及第二统计等级的维度下对应的媒体信息确定为目标媒体信息统计维度下的媒体信息;反之,在第一统计等级的维度下对应的媒体信息充分,或者说达到统计条件的情况下,直接将第一统计等级的维度下对应的媒体信息确定为目标媒体信息统计维度下的媒体信息。其中,第一统计等级、第二统计等级只是为了说明统计等级可以为多个,不应理解为对数量的限定。
76.可选地,在本实施例中,目标标签可以但不限用于表示媒体资源在某个侧面所存在的某个特点的概要描述,如恐怖标签(感观较为恐怖的特点)、健康标签(利于健康的特点);或适用于某个受众群体的某个特定的匹配标识,如90后标签(90后群体较为感兴趣)、男性标签(男性群体较为感兴趣)等。进一步举例说明,在某个请求与某一标签实现匹配的情况下,将对该标签所对应的媒体资源进行召回。此外,目标标签可以但不限于被分为优质标签和劣质标签,其中,优质标签可以但不限于能很好的描述出媒体信息的特点,从效果上来讲,媒体信息被打上这个标签之后,能够在合适的场合下被召回,召回之后的曝光效果好;反观劣质标签,可以但不限于不能很好的描述媒体信息的特点,在突出媒体信息特性的功用上欠缺,从效果上来讲,媒体信息在拥有这个标签之后召回效果一般;
77.但如果目标标签只以非黑即白的方式被分优质标签和劣质标签,并进一步淘汰劣质标签的话,就会存在处理方式较为武断的缺陷,容易导致被误判为劣势标签的优质标签也被淘汰。进一步为克服上述缺陷,利用上述媒体信息的处理方法细化对目标标签的处理方式,调整媒体信息在不同目标标签下的发布概率,降低了误判概率,提高了目标标签的处理准确性。
78.可选地,在本实施例中,发布概率可以但不限于理解为目标行业的媒体信息在目标标签下的置信度,或可理解为利用该目标标签对目标行业的媒体信息进行投放时可投放准确的概率。可选地,对第一媒体信息集合在目标标签下的发布概率进行调整可以但不限于上调或下调发布概率;
79.进一步举例说明,可选的例如图3所示,具体步骤如下:步骤s302,获取多个初始标签,其中,多个初始标签包括目标标签302;步骤s304,获取每个初始标签当前的发布概率,如目标标签302当前的发布概率为0.4;步骤s306,执行上述媒体信息的处理方法,并根据得到匹配结果对目标标签302当前的发布概率进行调整,如目标标签302调整后的发布概率为0.1。
80.此外,可选的在目标标签的发布概率低于目标阈值的情况下,可以但不限于直接删除对应的目标标签,例如基于图3所示场景,继续例如图4所示,具体步骤如下:步骤402,按照发布概率对初始标签进行处理,如删除低于或等于0.1的发布概率对应的初始标签;步骤404,补充新的初始标签,并将该新的初始标签作为上述多个初始标签中的初始标签,继续执行上述步骤s302。
81.可选地,在本实施例中,发布结果可以但不限于为媒体信息的投放结果,或可理解为媒体信息在被投放后所采集到的反馈信息,如投放媒体信息后的一段时间内媒体信息的点击率、曝光转化率、点击转化率、转化数、成本偏差(cost/gmv,转化数*媒体信息关联的实际竞价)、被查看的累计时长、媒体信息所关联的资源收益等。
82.可选地,在本实施例中,目标发布数据阈值可以但不限于表示第一发布结果所对
应的数据类型下的数据阈值;基于此,确定第一发布结果与目标发布数据阈值的匹配结果包括:确定第一发布结果所对应的数据是否达到目标发布数据阈值,或在目标发布数据阈值包括多个阈值范围的情况下,确定第一发布结果所对应的数据位于目标发布数据阈值中的哪一阈值范围。
83.可选地,在本实施例中,在根据匹配结果,对第一媒体信息集合在目标标签下的发布概率进行调整之后,可以但不限于包括执行tag触发支路方式,其中,tag触发支路方式可以但不限于为给用户帐号(受众群体)打标签,然后再给媒体资源打标签,最后将受众群体的标签和媒体资源的标签进行匹配,并根据匹配结果对媒体资源进行召回;
84.进一步举例说明,如图5所示分别获取用户帐号502的用户标签504(如大方向上的行为定向、兴趣定向、意向定向、安装定向、自定义用户等,以及小方向上的类目、关键词、已安装列表、用户包列表等)以及媒体资源508的资源标签506(如烈目、关键词、已安装列表等);再利用匹配器510对用户标签504与资源标签506进行匹配,进而得到匹配结果。
85.可选地,在本实施例中,在第一媒体信息集合中的媒体信息未达到调整目标标签下的发布概率的条件的情况下,可以但不限于采用另一方式确定媒体信息的发布对象,如ann(人工神经网络)触发支路方式,其中,ann触发支路方式可以但不限于理解为建立一个人工神经网络模型,利用此模型从历史数据中观察哪些对象可能是高转化用户,具有着比较高的投放效益;
86.进一步举例说明,如图6所示,获取历史数据602(如已消费过特定帐号的一方数据、已转化过的用户帐号所对应的媒体资源的投放数据、用户帐号以及媒体资源的特征数据,少量定向性别、年龄、地理属性等数据);再将该历史信息602输入模型结构604,其中,模型结构604可以但不限于机器学习算法自动构建的定向模型;进一步获取到模型结构604的输出结果,并基于该输出结果得到各个用户帐号的置信度606,如用户帐号608-1的执行度为0.56、用户帐号608-2的执行度为0.81、用户帐号608-3的执行度为0.79。此外,还可以但不限于将置信度606高于置信度阈值的用户帐号(如用户帐号608-2、用户帐号608-3)作为媒体资源的投放对象。
87.可选地,在本实施例中,上述人工神经网络模型可以抽象为p(1|user,context,ad)这种概率估计问题,即在一种事先定义好的目标下,某个用户帐号在在某个上下文环境下看到某个媒体资源时,这个目标发生的概率是有多大。当然越大越好,这个很好理解。那么如何定义这个目标,这个预先定义好的目标是什么?此目标应该具有衡量用户帐号与媒体资源匹配程度的功能。通常情况下可以是媒体资源的点击率,点击转化率,曝光转化率,也可以是多种不同的预定义目标分别建模,构建成不同的ann触发支路,然后多条支路联合作用。由此可以看出ann触发支路策略,本质上就是构建点击率模型、点击转化率模型、曝光转化率模型等经典模型,然后利用这些模型去判断用户帐号与媒体资源是否匹配。很容易理解,可以认为用户点击这个广告的概率越大,可能用户帐号与此媒体资源越匹配;用户帐号转化这个媒体资源的概率越大,可能用户帐号与此媒体资源越匹配。
88.进一步举例说明搜集各类特征(如帐号特征、上下文特征、广告特征等),并利用上述各类特征,构建相应的目标预估模型的过程,如图7所示,通常情况下目标预估模型的结构是双塔结构,即帐号特征、上下文特征得到一塔(目标预估模型702)、资源特征再得到一塔,双塔结构即为整合后得到的目标预估模型704;或者说,上下文信息只在用户这一侧出
现,并没有出现在资源侧。也就是意味着默认用户这一侧的信息跟上下文有关,可能是随着上下文变动而变动的动态特征。而媒体资源这一侧的信息是跟上下文无关,也就是静态的特征;上下文特征具体怎么细化,并没有一个确定的做法,从优化效果的目的出发,能有很多种不同的做法;离线截断通过训练,获取到用户侧这一塔的模型结构和参数;以及资源这一侧的每个媒体资源的嵌入(embedding)向量。再者,在线预测的时候,针对某次请求的用户帐号和上下文得到基于上下文的用户嵌入(embedding)向量,利用此向量,从资源embedding向量中寻找与此向量相似的若干个向量对应的媒体资源作为召回的媒体资源。
89.可选地,在本实施例中,可以但不限于采用结合上述tag触发支路以及ann触发支路的方式,共同确定媒体信息的发布对象,具体的如图8所示,具体步骤如下:
90.步骤s802,获取用户输入,其中,用户输入可以但不限于包括多个维度的数据,如帐号特征数据、资源特征数据、上下文信息等;
91.步骤s804-1、s804-2,对于各种高纬稀疏的特征,工作将单个特征映射为一个低纬稠密向量,将;高纬稀疏的特征由“精准匹配”变成一个在embedding向量上的“模糊匹配”,从而提高算法性能,将高纬稀疏的特征的可用性大大提供;具体的,可以但不限于利用矩阵的乘法来实现嵌入向量的查找(embedding lookup);
92.其中,在模型结构中还可以但不限于设置有se block(sequeze and excitaion),对步骤s804-1、s804-2得到的每个特征的embedding向量进行数据压缩与信息汇总等操作,并将每个特征都以一个bit来表征,通过mlp来进行交互,通过交互,得出结果;对于当前所有输入的特征,通过相互发生关联,来动态地判断哪些特征重要,哪些特征不重要,即通过构建一种运算方式,来动态的强化重要特征,弱化噪声或不重要的特征;
93.再者,上述模型结构可以但不限于为c3mm模型(complete conversion chain multi-task model),其中,c3mm模型的构建过程可以但不限于理解为训练点击率预估(clik-through-rate,简称ctr)双塔模型、浅层转化率预估(conversion rate,简称cvr)双塔模型、深层cvr双塔模型之间多任务学习的过程,c3mm模型的构建目标是ctr双塔模型、浅层cvr双塔模型、深层cvr双塔模型的损失加权和降到最低,即步骤s806。
94.此外,在上述实施例中,ctr双塔模型、浅层cvr双塔模型、深层cvr双塔模型所具有的双塔结构,可以但不限于参考图9所示,双塔结构902分为两个相对独立的子网络结构,如用户塔904-1、以及资源塔904-2,其中,用户塔904-1可以但不限于采用帐号特征数据906-1作为输入数据(如标识数据、属性数据、历史操作数据等),而资源塔904-2可以但不限于采用媒体资源的资源特征数据906-2(如媒体资源的发布数据、媒体资源的反馈数据等)作为输入数据;
95.进一步,在分别得到用户塔904-1、以及资源塔904-2的处理结果后,可以但不限于计算两个处理结果之间的余弦距离,并利用计算结果更新双塔结构902的模型参数;在实际使用中,则可以但不限于整合用户塔904-1、以及资源塔904-2的处理结果,得到最终双塔结构902输出的召回结果908(如召回哪一媒体资源以及召回的媒体资源的发布对象)。
96.需要说明的是,获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值;确定目标媒体信息统计维度下的媒体信息,得到第一媒体信息集合,其中,第一媒体信息集合中的媒体信息对应的行业为目标行业标识所表示的行业,第一媒体信息集合中的媒体信息的标签包括目标标签;获取第一时长内第一媒体信息集合在目标标签下的第
一发布结果;确定第一发布结果与目标发布数据阈值的匹配结果;根据匹配结果,对第一媒体信息集合在目标标签下的发布概率进行调整。
97.进一步举例说明,可选的例如图10所示,获取目标行业标识1002当前对应的目标媒体信息统计维度1004和目标发布数据阈值1006;确定目标媒体信息统计维度1004下的媒体信息(如媒体信息1、媒体信息2
……
),得到第一媒体信息集合1008,其中,第一媒体信息集合1008中的媒体信息对应的行业为目标行业标识1002所表示的行业,第一媒体信息集合1008中的媒体信息的标签包括目标标签1010;获取第一时长内第一媒体信息集合1008在目标标签1010下的第一发布结果1012;确定第一发布结果1012与目标发布数据阈值1006的匹配结果1014;根据匹配结果1014,对第一媒体信息集合1008在目标标签1010下的发布概率进行调整。
98.通过本技术提供的实施例,获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值;确定目标媒体信息统计维度下的媒体信息,得到第一媒体信息集合,其中,第一媒体信息集合中的媒体信息对应的行业为目标行业标识所表示的行业,第一媒体信息集合中的媒体信息的标签包括目标标签;获取第一时长内第一媒体信息集合在目标标签下的第一发布结果;确定第一发布结果与目标发布数据阈值的匹配结果;根据匹配结果,对第一媒体信息集合在目标标签下的发布概率进行调整,通过对不同行业下的媒体信息提供针对性更强的处理方式,对用于媒体信息的发布方向的目标标签进行优劣判断,进而达到了对各个行业的媒体信息在目标标签下的发布概率进行优化调整的目的,从而实现了提高媒体信息的准确性的技术效果。
99.作为一种可选的方案,获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值,包括:
100.在目标映射表中,获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值,其中,目标映射表中记录有多组具有对应关系的行业标识、媒体信息统计维度和发布数据阈值,目标映射表中不同的行业标识表示不同的行业。
101.可选地,在本实施例中,目标映射表中记录有各个行业标识对应的媒体信息统计维度和发布数据阈值等参数,且目标映射表中记录的媒体信息统计维度和发布数据阈值都是被允许更新修正的。
102.需要说明的是,在目标映射表中,获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值,其中,目标映射表中记录有多组具有对应关系的行业标识、媒体信息统计维度和发布数据阈值,目标映射表中不同的行业标识表示不同的行业。
103.进一步举例说明,可选的例如下述表(1)所示,不同行业标识所对应的参数(媒体信息统计维度/发布数据阈值)也不尽相同;具体的,以平台电商这一行业标识为例说明,在其对应的参数中,xp1,xp2,xp3用于表示媒体信息统计维度,例如可以是资源主、可以是资源品牌等维度。他们的顺序也可以但不限于是回退的顺序,即如果资源维度的统计数据不充分,则回退到xp1这个维度;xp1这个维度的统计数据不充分,则回退到xp2这个维度,依次类推;
104.再者,np0,np1,np2,np3这4个参数可以但不限于是判断各个媒体信息统计维度下的数据是否充分的阈值,如资源维度下的统计数据《np0,则视为不充分;xp1维度的统计数据《np1,则视为不充分,依次类推。
105.而tp1,tp2这两个参数可以但不限于是判断媒体资源的推广效果的阈值,如媒体资源对应的成本偏差》=tp1,则将当前媒体资源对应的目标标签视为劣质标签;成本偏差》=tp2且成本偏差《tp1,则将当前媒体资源对应的目标标签视为中性标签;成本偏差《tp2,则将当前媒体资源对应的目标标签视为优质标签。
[0106][0107]
表(1)
[0108][0109]
续表(1)
[0110]
作为一种可选的方案,方法还包括:
[0111]
s1,获取行业标识集合和第二媒体信息集合,其中,行业标识集合包括不同的n个行业标识,第二媒体信息集合包括与n个行业标识对应的n个媒体信息子集,每个媒体信息子集对应一个行业标识,第二媒体信息集合中的每个媒体信息对应的标签包括一个或多个标签,n为大于或等于2的正整数;
[0112]
s2,获取第二时长内第二媒体信息集合中的媒体信息在对应的各个标签下的第二发布结果;
[0113]
s3,根据第二发布结果,确定与n个行业标识对应的n组媒体信息统计维度和发布数据阈值,其中,目标映射表包括n个行业标识以及与n个行业标识对应的n组媒体信息统计维度和发布数据阈值。
[0114]
可选地,在本实施例中,根据第二发布结果,确定的发布数据阈值可以但不限于是
判断媒体资源的推广效果的阈值,如媒体资源对应的成本偏差大于等于该发布数据阈值,则将当前媒体资源对应的目标标签视为劣质标签;成本偏差小于发布数据阈值,则将当前媒体资源对应的目标标签视为优质标签。
[0115]
可选地,在本实施例中,发布数据阈值可以但不限于包括多个阈值,进而在判断媒体资源的推广效果的过程中,可利用该多个阈值获取媒体资源的推广效果的多个判断结果。
[0116]
作为一种可选的方案,获取第二时长内第二媒体信息集合中的媒体信息在对应的各个标签下的第二发布结果,包括:
[0117]
s1,对于第二媒体信息集合中的每个媒体信息和每个媒体信息对应的各个标签执行以下步骤,其中,在执行以下步骤时,每个媒体信息为当前媒体信息,每个媒体信息对应的各个标签为当前标签:
[0118]
s2,获取第二时长内当前媒体信息在当前标签下的第二发布结果,其中,第二发布结果包括:第二时长内当前媒体信息在当前标签下的当前转化数量、当前资源转移数量偏差值、当前转化率,其中,当前转化数量表示第二时长内当前媒体信息在当前标签下被发布给对应的帐号之后,对应的帐号针对当前媒体信息执行目标操作的次数,当前资源转移数量偏差值表示当前实际资源转移数量与当前预估资源转移数量的偏差,当前实际资源转移数量表示当前转化数量对应的实际产生的资源转移数量,预估资源转移数量表示当前转化数量对应的预计产生的资源转移数量,当前转化率表示当前转化数量与当前发布数量之间的比值,当前发布数量表示第二时长内当前媒体信息在当前标签下被发布给对应的帐号的次数。
[0119]
作为一种可选的方案,根据第二发布结果,确定与n个行业标识对应的n组媒体信息统计维度和发布数据阈值,包括:
[0120]
s1,对于n个行业标识中的每个行业标识,执行以下步骤,其中,在执行以下步骤时,每个行业标识为当前行业标识,当前行业标识对应n个媒体信息子集中的当前媒体信息子集,当前行业标识对应待确定的当前媒体信息统计维度和当前发布数据阈值,当前媒体信息统计维度的取值范围是m个统计维度、且当前发布数据阈值包括当前转化数阈值、与劣质标签对应的当前第一偏差阈值以及与优质标签对应的当前第二偏差阈值,当前转化数阈值的取值范围包括与m个统计维度对应的m个转化数量取值范围、当前第一偏差阈值的取值范围为第一偏差阈值取值范围、当前第二偏差阈值的取值范围为第二偏差阈值取值范围,m为大于或等于2的正整数:
[0121]
s2,根据当前媒体信息子集中的每个媒体信息在对应的各个标签下的第二发布结果,确定与m个统计维度中的不同统计维度、不同统计维度对应的转化数量取值范围中的不同转化数量、第一偏差阈值取值范围中的不同第一偏差阈值、第二偏差阈值取值范围中的不同第二偏差阈值对应的组合转化率,得到s个组合转化率,其中,s为大于或等于2的正整数;
[0122]
s3,在s个组合转化率中确定取值最大的目标组合转化率,并将当前媒体信息统计维度确定为等于目标组合转化率对应的统计维度,将当前发布数据阈值中的当前转化数阈值、当前第一偏差阈值以及当前第二偏差阈值分别确定为等于目标组合转化率对应的转化数量、对应的第一偏差阈值、对应的第二偏差阈值。
[0123]
作为一种可选的方案,根据当前媒体信息子集中的每个媒体信息在对应的各个标签下的第二发布结果,确定与m个统计维度中的不同统计维度、不同统计维度对应的转化数量取值范围中的不同转化数量、第一偏差阈值取值范围中的不同第一偏差阈值、第二偏差阈值取值范围中的不同第二偏差阈值对应的组合转化率,包括:
[0124]
s1,在m个统计维度中的不同统计维度为第i个统计维度、不同统计维度对应的转化数量取值范围中的不同转化数量为j、第一偏差阈值取值范围中的不同第一偏差阈值为t1,第二偏差阈值取值范围中的不同第二偏差阈值为t2时,获取当前媒体信息子集中第i个统计维度下的媒体信息,得到第i个媒体信息子集,1≤i≤m,j、t1、t2均为正数,t2《t1;
[0125]
s2,获取第二时长内第i个媒体信息子集中的每个媒体信息在对应的各个标签下的转化数量、资源转移数量偏差值、转化率;
[0126]
s3,在第i个媒体信息子集中的每个媒体信息在对应的各个标签下的转化数量大于或等于j时,根据第i个媒体信息子集中的每个媒体信息在对应的各个标签下的资源转移数量偏差值与t1和t2之间的关系,确定第i个媒体信息子集中的每个媒体信息对应的各个标签的类型,其中,在第i个媒体信息子集中的每个媒体信息在对应的标签下的资源转移数量偏差值大于或等于t1时,将对应的标签的类型确定为劣质标签,在第i个媒体信息子集中的每个媒体信息在对应的标签下的资源转移数量偏差值小于t2时,将对应的标签的类型确定为优质标签,在第i个媒体信息子集中的每个媒体信息在对应的标签下的资源转移数量偏差值大于或等于t2、且小于t1时,将对应的标签的类型确定为中性标签;
[0127]
s4,获取第i个媒体信息子集中的每个媒体信息在类型为优质标签的各个标签下的转化率的第一均值、第i个媒体信息子集中的每个媒体信息在类型为中性标签的各个标签下的转化率的第二均值、以及第i个媒体信息子集中的每个媒体信息在类型为劣质标签的各个标签下的转化率的第三均值;
[0128]
s5,根据第一均值、第二均值和第三均值,确定与第i个统计维度、j、t1以及t2对应的组合转化率。
[0129]
可选地,在本实施例中,为获取到针对某个媒体资源而言的优质标签是/劣质标签,可以但不限于采用下述公式(1)得到《媒体资源(广告),标签》对在历史上的曝光转化率。
[0130]
y=g(ad,f(x1,x2,x3,n0,n1,n2,n3,t1,t2))
ꢀꢀ
(1)
[0131]
其中,x1、x2、x3表示的是回退的维度和优先级,x1可以但不限于理解为上述表(1)xp1,xz1,xe1,xf1,xg1,xo1中的任一参数;x2可以但不限于理解为上述表(1)xp2,xz2,xe2,xf2,xg2,xo2中的任一参数;x3可以但不限于理解为上述表(1)xp3,xz3,xe3,xf3,xg3,xo3中的任一参数;n0表示np0,nz0,ne0,nf0,ng0,no0中的任一参数;n1可以但不限于理解为上述表(1)np1,nz1,ne1,nf1,ng1,no1中的任一参数;n2可以但不限于理解为上述表(1)np2,nz2,ne2,nf2,ng2,no2中的任一参数;n3可以但不限于理解为上述表(1)np3,nz3,ne3,nf3,ng3,no3中的任一参数;t1可以但不限于理解为上述表(1)tp1,tz1,te1,tf1,tg1,to1中的任一参数;t2可以但不限于理解为上述表(1)tp2,tz2,te2,tf2,tg2,to2中的任一参数;上述函数f是计算在上述给定的参数下,标签各自对应的曝光转化率;
[0132]
进一步具体计算步骤如图11所示,内容如下:
[0133]
步骤s1102,统计某个标签下广告的已转化量;
[0134]
步骤s1104,判断已转化量是否大于等于n0,若是,则执行步骤s1120,若否,则执行步骤s1106;
[0135]
步骤s1106,统计目标标签下第一维度下所有广告的已转化量;
[0136]
步骤s1108,判断已转化量是否大于等于n1,若是,则执行步骤s1120,若否,则执行步骤s1110;
[0137]
步骤s1110,统计目标标签下第二维度下所有广告的已转化量;
[0138]
步骤s1112,判断已转化量是否大于等于n2,若是,则执行步骤s1120,若否,则执行步骤s1114;
[0139]
步骤s1114,统计目标标签下第三维度下所有广告的已转化量;
[0140]
步骤s1116,判断已转化量是否大于等于n3,若是,则执行步骤s1120,若否,则执行步骤s1118;
[0141]
步骤s1118,确定目标标签为中性标签;
[0142]
步骤s1120,判断目标标签下广告的平均成本偏差(cost/gmv)是否小于t1且大于等于t2,若是,则执行步骤s1118;判断目标标签下广告的平均成本偏差是否大于等于t1,若是,则执行步骤s1122;判断目标标签下广告的平均成本偏差是否小于t1,若是,则执行步骤s1124;
[0143]
步骤s1122,确定目标标签为优质标签;
[0144]
步骤s1124,确定目标标签为劣质标签。
[0145]
进一步,统计所有的《ad,优质标签》平均曝光转化率为r1,所有的《ad,中性标签》平均曝光转化率为r2,所有的《ad,劣质标签》平均曝光转化率为r3。
[0146]
此外,上述公式(1)中的函数g可以但不限于理解为是计算《广告,标签》组合的曝光转化率,具体的可参考下述公式(2):
[0147]
g=r1+0.5*r2-r3
ꢀꢀ
(2)
[0148]
其中,g可以但不限于理解为上述实施例中的组合转化率,r1可以但不限于理解为上述实施例中的第一均值、r2可以但不限于理解为上述实施例中的第二均值、r3可以但不限于理解为上述实施例中的第三均值。
[0149]
作为一种可选的方案,获取第二时长内第二媒体信息集合中的媒体信息在对应的各个标签下的第二发布结果,包括:
[0150]
每隔预设周期获取第二时长内第二媒体信息集合中的媒体信息在对应的各个标签下的第二发布结果,其中,目标映射表每隔预设周期被更新一次。
[0151]
可选地,在本实施例中,利用实时数据计算出实时解,对目标映射表中的、线上起作用的各类参数进行动态更新,如每小时更新一次。
[0152]
作为一种可选的方案,确定目标媒体信息统计维度下的媒体信息,得到第一媒体信息集合,包括以下至少之一:
[0153]
s1,在目标媒体信息统计维度表示按照单个媒体信息的维度进行统计时,确定目标媒体信息,其中,第一媒体信息集合包括目标媒体信息;
[0154]
s2,在目标媒体信息统计维度表示按照单个提供帐号和单个委托帐号的维度进行统计时,确定目标提供帐号通过目标委托帐号提供的媒体信息,得到第一媒体信息集合;
[0155]
s3,在目标媒体信息统计维度表示按照单个提供帐号和多个委托帐号的维度进行
统计时,确定目标提供帐号通过多个目标委托帐号提供的媒体信息,得到第一媒体信息集合。
[0156]
可选地,在本实施例中,目标媒体信息统计维度可以但不限包括至少一个统计维度,且在至少一个统计维度为多个统计维度的情况下,多个统计维度中的每个统计维度可各自对应的维度优先级。
[0157]
可选地,在本实施例中,在媒体资源为广告资源的场景中,单个提供帐号可以但不限于为广告主,其中,广告主可以通过一个或多个广告代理商在同一个广告平台上投放多个广告;可选地,在本实施例中,单个委托帐号可以但不限于理解为广告代理商。
[0158]
进一步举例说明多个统计维度的获取,可选的首先是广告归属的这一统计维度,广告归属即是广告的所属对象。这个对象可以是广告主、广告主集团、广告主所属公司、广告所属的子行业、广告所属的第一类目、广告所属的第二类目、广告所属的第三类目、广告所属地域、广告所属运营项目组、广告所属运营团队、广告主的规模等级、广告主集团规模等级、广告主所属公司的规模等级等。
[0159]
再者是广告受众的这一统计维度,广告受众指的是一系列的广告定向。这个定向可以是广告的基础定向:例如性别、年龄、地域、资源的获取方式、教育水平、资源获取水平等;广告的行为兴趣定向:例如用户安装过哪些app、广告互动行为、电商浏览行为、搜索点击行为、资讯浏览行为、兴趣爱好行业类目;广告主的自定义用户:例如公众号粉丝、app安装用户、商品购买客户、相似用户扩展、关系链拓展等;广告受众引申出来的因素:例如品牌等。
[0160]
最后是广告内容的统计维度,指的是广告本身的内容和商品。这个包括广告的标题信息、广告图片信息、广告视频信息、商品库id、商品行业类型、广告创意规格、dpa模版id、后台商品id、客户商品id、客户商品名称、商品类型、商品核心产品词、创意id、商品自定义标签、商品外部id等。
[0161]
这些从3个维度进一步细分的属性,都从一定的角度去代表广告的特点,可以针对这些细分的属性去统计广告聚合信息。这么多信息,不同的选择,不同的组合都会带来不同的优化效果。
[0162]
进一步参考上述公式(1),上述公式(1)中的x1,x2,x3 x1,x2,x3的选择范围就是来源于上述三个维度,具体的,x1对应广告归属的统计维度、x2对应广告受众的统计维度、x1对应广告内容的统计维度。此外,上述公式(1)中的n0,n1,n2,n3则可对应理解为判断转化量是否充分的阈值,例如这些n的取值范围是:3《=n0《=7、8《=n1《=20、15《=n2《=40、30《=n3《=60。再者,上述公式(1)中的t1 t2是判断标签效果的阈值,例如取值范围如下:1.18《=t1《=1.22、1.05《=t2《=1.15。进一步参考上述阈值与取值范围,判断上述多个统计维度下的数据所对应的转化量是否充分,若否,则依次回退的上一优先级的统计维度。
[0163]
作为一种可选的方案,获取第一时长内第一媒体信息集合在目标标签下的第一发布结果,包括:
[0164]
获取第一时长内第一媒体信息集合在目标标签下的转化数量和资源转移数量偏差值,其中,转化数量表示第一时长内第一媒体信息集合中的媒体信息在目标标签下被发布给对应的帐号之后,对应的帐号针对第一媒体信息集合中的媒体信息执行目标操作的次数,资源转移数量偏差值表示实际资源转移数量与预估资源转移数量的偏差,实际资源转
移数量表示转化数量对应的实际产生的资源转移数量,预估资源转移数量表示转化数量对应的预计产生的资源转移数量。
[0165]
作为一种可选的方案,确定第一发布结果与目标发布数据阈值的匹配结果,包括:
[0166]
s1,在目标发布数据阈值包括目标转化数阈值、以及与大于或等于目标转化数阈值所对应的多个偏差范围时,确定转化数量是否大于或等于目标转化数阈值,其中,多个偏差范围包括与劣质标签对应的第一偏差范围以及与优质标签对应的第二偏差范围,第一偏差范围中的偏差值大于第二偏差范围中的偏差值;
[0167]
s2,在转化数量大于或等于目标转化数阈值时,确定资源转移数量偏差值是否位于第一偏差范围或位于第二偏差范围内;
[0168]
s3,在资源转移数量偏差值位于第一偏差范围内时,将匹配结果确定为用于表示目标标签的类型为劣质标签;
[0169]
s4,在资源转移数量偏差值位于第二偏差范围内时,将匹配结果确定为用于表示目标标签的类型为优质标签。
[0170]
需要说明的是,在目标发布数据阈值包括目标转化数阈值、以及与大于或等于目标转化数阈值所对应的多个偏差范围时,确定转化数量是否大于或等于目标转化数阈值,其中,多个偏差范围包括与劣质标签对应的第一偏差范围以及与优质标签对应的第二偏差范围,第一偏差范围中的偏差值大于第二偏差范围中的偏差值;在转化数量大于或等于目标转化数阈值时,确定资源转移数量偏差值是否位于第一偏差范围或位于第二偏差范围内;在资源转移数量偏差值位于第一偏差范围内时,将匹配结果确定为用于表示目标标签的类型为劣质标签;在资源转移数量偏差值位于第二偏差范围内时,将匹配结果确定为用于表示目标标签的类型为优质标签。
[0171]
进一步举例说明,可选的例如下述表(2)所示,利用转化数量和资源转移数量偏差值对目标标签为劣质标签还是优质标签进行判断,其中,利用转化数量先确定作为标签判断依据的数据是否充分(即是否大于或等于6),若否,则不进行判断(即不再进一步考虑资源转移数量偏差值);进一步,在转化数量指示数据充分的情况下,再利用资源转移数量偏差值对目标标签为劣质标签还是优质标签进行判断,如资源转移数量偏差值大于或等于1.2为劣质标签,资源转移数量偏差值小于1.2为优质标签。
[0172]
转化数量资源转移数量偏差值劣质标签还是优质标签》=6》=1.2劣质标签》=6《1.2优质标签《6》=1不进行判断《6《1不进行判断
[0173]
表(2)
[0174]
作为一种可选的方案,根据匹配结果,对第一媒体信息集合在目标标签下的发布概率进行调整,包括:
[0175]
s1,在匹配结果用于表示目标标签的类型为劣质标签时,对第一媒体信息集合在目标标签下的发布概率进行下降调整;
[0176]
s2,在匹配结果用于表示目标标签的类型为优质标签时,对第一媒体信息集合在目标标签下的发布概率进行增加调整。
[0177]
可选地,在本实施例中,优质标签/劣质标签的判断结果可以但不限于直接影响媒体资源的处理结果,而是利用优质标签/劣质标签对目标标签当前的发布概率进行增加/下降的调整;同时,为增加上述媒体信息的处理方法的容错率,在下一次对目标标签进行优质标签/劣质标签的判断过程中,如果获取到与上一次对目标标签进行优质标签/劣质标签的判断结果相反的判断结果,则优先以下一次的判断结果对目标标签的发布概率进行调整,以保证对媒体资源的处理实时性。
[0178]
可以理解的是,在本技术的具体实施方式中,涉及到用户信息等相关的数据,当本技术以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
[0179]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
[0180]
根据本发明实施例的另一个方面,还提供了一种用于实施上述媒体信息的处理方法的媒体信息的处理装置。如图12所示,该装置包括:
[0181]
第一获取单元1202,用于获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值;
[0182]
第一确定单元1204,用于确定目标媒体信息统计维度下的媒体信息,得到第一媒体信息集合,其中,第一媒体信息集合中的媒体信息对应的行业为目标行业标识所表示的行业,第一媒体信息集合中的媒体信息的标签包括目标标签;
[0183]
第二获取单元1206,用于获取第一时长内第一媒体信息集合在目标标签下的第一发布结果;
[0184]
第二确定单元1208,用于确定第一发布结果与目标发布数据阈值的匹配结果;
[0185]
处理单元1210,用于根据匹配结果,对第一媒体信息集合在目标标签下的发布概率进行调整。
[0186]
可选地,在本实施例中,上述媒体信息的处理方法可以但不限于应用在根据标签进行广告投放的场景中,例如针对不同行业对广告标签的判断标准提供最佳的优化方式,在一定程度上解决了各行业所存在的对标签的质量判断偏差的问题。具体的,获取一个行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值;进一步确定目标媒体信息统计维度下的媒体信息,并获取该媒体信息在待判断优劣的目标标签下的发布结果;再者,利用获取到的上述目标发布数据阈值对该发布结果进行校验,判断二者是否匹配,若不匹配则根据匹配结果对该媒体信息在目标标签下的发布概率进行调整,以完成对单个行业对广告标签的优化。同理,还可利用上述媒体信息的处理方法对其他行业对广告标签的判断标准提供类似的优化方式。
[0187]
可选地,在本实施例中,行业标识可以但不限用于区分以及标识各个行业,如目标行业标识可以但不限用于标识平台电商行业、直营电商行业、品牌电商行业、教育行业、金融行业或游戏行业等。而各个行业所对应的目标发布数据阈值可以但不限于存在不同,或者说各个行业对目标发布数据阈值标准可以但不限于存在不同,因此就需要更加灵活地方
式针对不同行业的不同目标发布数据阈值标准对媒体信息进行处理。
[0188]
可选地,在本实施例中,目标媒体信息统计维度可以但不限于包括一个或多个媒体信息统计维度,且在目标媒体信息统计维度包括多个媒体信息统计维度的情况下,多个媒体信息统计维度可以但不限于被分为不同统计等级的维度,如第一统计等级的维度为范围较小的维度、第二统计等级的维度为范围较大的维度,其中,范围较小即表示可获得的媒体信息的信息数量较少、但准确性较高,反之范围较大即表示可获得的媒体信息的信息数量较大、但准确性较低;基于此,确定目标媒体信息统计维度下的媒体信息包括:在第一统计等级的维度下对应的媒体信息不充分,或者说未达到统计条件的情况下,将进一步获取第二统计等级的维度下对应的媒体信息,并将第一统计等级的维度下对应的媒体信息以及第二统计等级的维度下对应的媒体信息确定为目标媒体信息统计维度下的媒体信息;反之,在第一统计等级的维度下对应的媒体信息充分,或者说达到统计条件的情况下,直接将第一统计等级的维度下对应的媒体信息确定为目标媒体信息统计维度下的媒体信息。其中,第一统计等级、第二统计等级只是为了说明统计等级可以为多个,不应理解为对数量的限定。
[0189]
可选地,在本实施例中,目标标签可以但不限用于表示媒体资源在某个侧面所存在的某个特点的概要描述,如恐怖标签(感观较为恐怖的特点)、健康标签(利于健康的特点);或适用于某个受众群体的某个特定的匹配标识,如90后标签(90后群体较为感兴趣)、男性标签(男性群体较为感兴趣)等。进一步举例说明,在某个请求与某一标签实现匹配的情况下,将对该标签所对应的媒体资源进行召回。此外,目标标签可以但不限于被分为优质标签和劣质标签,其中,优质标签可以但不限于能很好的描述出媒体信息的特点,从效果上来讲,媒体信息被打上这个标签之后,能够在合适的场合下被召回,召回之后的曝光效果好;反观劣质标签,可以但不限于不能很好的描述媒体信息的特点,在突出媒体信息特性的功用上欠缺,从效果上来讲,媒体信息在拥有这个标签之后召回效果一般;
[0190]
但如果目标标签只以非黑即白的方式被分优质标签和劣质标签,并进一步淘汰劣质标签的话,就会存在处理方式较为武断的缺陷,容易导致被误判为劣势标签的优质标签也被淘汰。进一步为克服上述缺陷,利用上述媒体信息的处理方法细化对目标标签的处理方式,调整媒体信息在不同目标标签下的发布概率,降低了误判概率,提高了目标标签的处理准确性。
[0191]
可选地,在本实施例中,发布概率可以但不限于理解为目标行业的媒体信息在目标标签下的置信度,或可理解为利用该目标标签对目标行业的媒体信息进行投放时可投放准确的概率。可选地,对第一媒体信息集合在目标标签下的发布概率进行调整可以但不限于上调或下调发布概率;
[0192]
可选地,在本实施例中,发布结果可以但不限于为媒体信息的投放结果,或可理解为媒体信息在被投放后所采集到的反馈信息,如投放媒体信息后的一段时间内媒体信息的点击率、曝光转化率、点击转化率、转化数、成本偏差(cost/gmv,转化数*媒体信息关联的实际竞价)、被查看的累计时长、媒体信息所关联的资源收益等。
[0193]
可选地,在本实施例中,目标发布数据阈值可以但不限于表示第一发布结果所对应的数据类型下的数据阈值;基于此,确定第一发布结果与目标发布数据阈值的匹配结果包括:确定第一发布结果所对应的数据是否达到目标发布数据阈值,或在目标发布数据阈
值包括多个阈值范围的情况下,确定第一发布结果所对应的数据位于目标发布数据阈值中的哪一阈值范围。
[0194]
可选地,在本实施例中,在根据匹配结果,对第一媒体信息集合在目标标签下的发布概率进行调整之后,可以但不限于包括执行tag触发支路方式,其中,tag触发支路方式可以但不限于为给用户帐号(受众群体)打标签,然后再给媒体资源打标签,最后将受众群体的标签和媒体资源的标签进行匹配,并根据匹配结果对媒体资源进行召回;
[0195]
可选地,在本实施例中,上述人工神经网络模型可以抽象为p(1|user,context,ad)这种概率估计问题,即在一种事先定义好的目标下,某个用户帐号在在某个上下文环境下看到某个媒体资源时,这个目标发生的概率是有多大。当然越大越好,这个很好理解。那么如何定义这个目标,这个预先定义好的目标是什么?此目标应该具有衡量用户帐号与媒体资源匹配程度的功能。通常情况下可以是媒体资源的点击率,点击转化率,曝光转化率,也可以是多种不同的预定义目标分别建模,构建成不同的ann触发支路,然后多条支路联合作用。由此可以看出ann触发支路策略,本质上就是构建点击率模型、点击转化率模型、曝光转化率模型等经典模型,然后利用这些模型去判断用户帐号与媒体资源是否匹配。很容易理解,可以认为用户点击这个广告的概率越大,可能用户帐号与此媒体资源越匹配;用户帐号转化这个媒体资源的概率越大,可能用户帐号与此媒体资源越匹配。
[0196]
需要说明的是,获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值;确定目标媒体信息统计维度下的媒体信息,得到第一媒体信息集合,其中,第一媒体信息集合中的媒体信息对应的行业为目标行业标识所表示的行业,第一媒体信息集合中的媒体信息的标签包括目标标签;获取第一时长内第一媒体信息集合在目标标签下的第一发布结果;确定第一发布结果与目标发布数据阈值的匹配结果;根据匹配结果,对第一媒体信息集合在目标标签下的发布概率进行调整。
[0197]
具体实施例可以参考上述媒体信息的处理方法中所示示例,本示例中在此不再赘述。
[0198]
通过本技术提供的实施例,获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值;确定目标媒体信息统计维度下的媒体信息,得到第一媒体信息集合,其中,第一媒体信息集合中的媒体信息对应的行业为目标行业标识所表示的行业,第一媒体信息集合中的媒体信息的标签包括目标标签;获取第一时长内第一媒体信息集合在目标标签下的第一发布结果;确定第一发布结果与目标发布数据阈值的匹配结果;根据匹配结果,对第一媒体信息集合在目标标签下的发布概率进行调整,通过对不同行业下的媒体信息提供针对性更强的处理方式,对用于媒体信息的发布方向的目标标签进行优劣判断,进而达到了对各个行业的媒体信息在目标标签下的发布概率进行优化调整的目的,从而实现了提高媒体信息的准确性的技术效果。
[0199]
作为一种可选的方案,第一获取单元1202,包括:
[0200]
第一获取模块,用于在目标映射表中,获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值,其中,目标映射表中记录有多组具有对应关系的行业标识、媒体信息统计维度和发布数据阈值,目标映射表中不同的行业标识表示不同的行业。
[0201]
具体实施例可以参考上述媒体信息的处理方法中所示示例,本示例中在此不再赘述。
[0202]
作为一种可选的方案,装置还包括:
[0203]
第二获取模块,用于获取行业标识集合和第二媒体信息集合,其中,行业标识集合包括不同的n个行业标识,第二媒体信息集合包括与n个行业标识对应的n个媒体信息子集,每个媒体信息子集对应一个行业标识,第二媒体信息集合中的每个媒体信息对应的标签包括一个或多个标签,n为大于或等于2的正整数;
[0204]
第三获取模块,用于获取第二时长内第二媒体信息集合中的媒体信息在对应的各个标签下的第二发布结果;
[0205]
第一确定模块,用于根据第二发布结果,确定与n个行业标识对应的n组媒体信息统计维度和发布数据阈值,其中,目标映射表包括n个行业标识以及与n个行业标识对应的n组媒体信息统计维度和发布数据阈值。
[0206]
具体实施例可以参考上述媒体信息的处理方法中所示示例,本示例中在此不再赘述。
[0207]
作为一种可选的方案,第三获取模块,包括:
[0208]
第一执行子模块,用于对于第二媒体信息集合中的每个媒体信息和每个媒体信息对应的各个标签执行以下步骤,其中,在执行以下步骤时,每个媒体信息为当前媒体信息,每个媒体信息对应的各个标签为当前标签:
[0209]
第一获取子模块,用于获取第二时长内当前媒体信息在当前标签下的第二发布结果,其中,第二发布结果包括:第二时长内当前媒体信息在当前标签下的当前转化数量、当前资源转移数量偏差值、当前转化率,其中,当前转化数量表示第二时长内当前媒体信息在当前标签下被发布给对应的帐号之后,对应的帐号针对当前媒体信息执行目标操作的次数,当前资源转移数量偏差值表示当前实际资源转移数量与当前预估资源转移数量的偏差,当前实际资源转移数量表示当前转化数量对应的实际产生的资源转移数量,预估资源转移数量表示当前转化数量对应的预计产生的资源转移数量,当前转化率表示当前转化数量与当前发布数量之间的比值,当前发布数量表示第二时长内当前媒体信息在当前标签下被发布给对应的帐号的次数。
[0210]
具体实施例可以参考上述媒体信息的处理方法中所示示例,本示例中在此不再赘述。
[0211]
作为一种可选的方案,第一确定模块,包括:
[0212]
第二执行子模块,用于对于n个行业标识中的每个行业标识,执行以下步骤,其中,在执行以下步骤时,每个行业标识为当前行业标识,当前行业标识对应n个媒体信息子集中的当前媒体信息子集,当前行业标识对应待确定的当前媒体信息统计维度和当前发布数据阈值,当前媒体信息统计维度的取值范围是m个统计维度、且当前发布数据阈值包括当前转化数阈值、与劣质标签对应的当前第一偏差阈值以及与优质标签对应的当前第二偏差阈值,当前转化数阈值的取值范围包括与m个统计维度对应的m个转化数量取值范围、当前第一偏差阈值的取值范围为第一偏差阈值取值范围、当前第二偏差阈值的取值范围为第二偏差阈值取值范围,m为大于或等于2的正整数:
[0213]
第一确定子模块,用于根据当前媒体信息子集中的每个媒体信息在对应的各个标签下的第二发布结果,确定与m个统计维度中的不同统计维度、不同统计维度对应的转化数量取值范围中的不同转化数量、第一偏差阈值取值范围中的不同第一偏差阈值、第二偏差
阈值取值范围中的不同第二偏差阈值对应的组合转化率,得到s个组合转化率,其中,s为大于或等于2的正整数;
[0214]
第二确定子模块,用于在s个组合转化率中确定取值最大的目标组合转化率,并将当前媒体信息统计维度确定为等于目标组合转化率对应的统计维度,将当前发布数据阈值中的当前转化数阈值、当前第一偏差阈值以及当前第二偏差阈值分别确定为等于目标组合转化率对应的转化数量、对应的第一偏差阈值、对应的第二偏差阈值。
[0215]
具体实施例可以参考上述媒体信息的处理方法中所示示例,本示例中在此不再赘述。
[0216]
作为一种可选的方案,第一确定子模块,包括:
[0217]
第一获取子单元,用于在m个统计维度中的不同统计维度为第i个统计维度、不同统计维度对应的转化数量取值范围中的不同转化数量为j、第一偏差阈值取值范围中的不同第一偏差阈值为t1,第二偏差阈值取值范围中的不同第二偏差阈值为t2时,获取当前媒体信息子集中第i个统计维度下的媒体信息,得到第i个媒体信息子集,1≤i≤m,j、t1、t2均为正数,t2《t1;
[0218]
第二获取子单元,用于获取第二时长内第i个媒体信息子集中的每个媒体信息在对应的各个标签下的转化数量、资源转移数量偏差值、转化率;
[0219]
第一确定子单元,用于在第i个媒体信息子集中的每个媒体信息在对应的各个标签下的转化数量大于或等于j时,根据第i个媒体信息子集中的每个媒体信息在对应的各个标签下的资源转移数量偏差值与t1和t2之间的关系,确定第i个媒体信息子集中的每个媒体信息对应的各个标签的类型,其中,在第i个媒体信息子集中的每个媒体信息在对应的标签下的资源转移数量偏差值大于或等于t1时,将对应的标签的类型确定为劣质标签,在第i个媒体信息子集中的每个媒体信息在对应的标签下的资源转移数量偏差值小于t2时,将对应的标签的类型确定为优质标签,在第i个媒体信息子集中的每个媒体信息在对应的标签下的资源转移数量偏差值大于或等于t2、且小于t1时,将对应的标签的类型确定为中性标签;
[0220]
第三获取子单元,用于获取第i个媒体信息子集中的每个媒体信息在类型为优质标签的各个标签下的转化率的第一均值、第i个媒体信息子集中的每个媒体信息在类型为中性标签的各个标签下的转化率的第二均值、以及第i个媒体信息子集中的每个媒体信息在类型为劣质标签的各个标签下的转化率的第三均值;
[0221]
第二确定子单元,用于根据第一均值、第二均值和第三均值,确定与第i个统计维度、j、t1以及t2对应的组合转化率。
[0222]
具体实施例可以参考上述媒体信息的处理方法中所示示例,本示例中在此不再赘述。
[0223]
作为一种可选的方案,第三获取模块,包括:
[0224]
第二获取子模块,用于每隔预设周期获取第二时长内第二媒体信息集合中的媒体信息在对应的各个标签下的第二发布结果,其中,目标映射表每隔预设周期被更新一次。
[0225]
具体实施例可以参考上述媒体信息的处理方法中所示示例,本示例中在此不再赘述。
[0226]
作为一种可选的方案,第一确定单元1204,包括以下至少之一:
[0227]
第二确定模块,用于在目标媒体信息统计维度表示按照单个媒体信息的维度进行统计时,确定目标媒体信息,其中,第一媒体信息集合包括目标媒体信息;
[0228]
第三确定模块,用于在目标媒体信息统计维度表示按照单个提供帐号和单个委托帐号的维度进行统计时,确定目标提供帐号通过目标委托帐号提供的媒体信息,得到第一媒体信息集合;
[0229]
第四确定模块,用于在目标媒体信息统计维度表示按照单个提供帐号和多个委托帐号的维度进行统计时,确定目标提供帐号通过多个目标委托帐号提供的媒体信息,得到第一媒体信息集合。
[0230]
具体实施例可以参考上述媒体信息的处理方法中所示示例,本示例中在此不再赘述。
[0231]
作为一种可选的方案,第二获取单元1206,包括:
[0232]
第四获取模块,用于获取第一时长内第一媒体信息集合在目标标签下的转化数量和资源转移数量偏差值,其中,转化数量表示第一时长内第一媒体信息集合中的媒体信息在目标标签下被发布给对应的帐号之后,对应的帐号针对第一媒体信息集合中的媒体信息执行目标操作的次数,资源转移数量偏差值表示实际资源转移数量与预估资源转移数量的偏差,实际资源转移数量表示转化数量对应的实际产生的资源转移数量,预估资源转移数量表示转化数量对应的预计产生的资源转移数量。
[0233]
具体实施例可以参考上述媒体信息的处理方法中所示示例,本示例中在此不再赘述。
[0234]
作为一种可选的方案,第二确定单元1208,包括:
[0235]
第五确定模块,用于在目标发布数据阈值包括目标转化数阈值、以及与大于或等于目标转化数阈值所对应的多个偏差范围时,确定转化数量是否大于或等于目标转化数阈值,其中,多个偏差范围包括与劣质标签对应的第一偏差范围以及与优质标签对应的第二偏差范围,第一偏差范围中的偏差值大于第二偏差范围中的偏差值;
[0236]
第六确定模块,用于在转化数量大于或等于目标转化数阈值时,确定资源转移数量偏差值是否位于第一偏差范围或位于第二偏差范围内;
[0237]
第七确定模块,用于在资源转移数量偏差值位于第一偏差范围内时,将匹配结果确定为用于表示目标标签的类型为劣质标签;
[0238]
第八确定模块,用于在资源转移数量偏差值位于第二偏差范围内时,将匹配结果确定为用于表示目标标签的类型为优质标签。
[0239]
具体实施例可以参考上述媒体信息的处理方法中所示示例,本示例中在此不再赘述。
[0240]
作为一种可选的方案,处理单元1210,包括:
[0241]
第一调整模块,用于在匹配结果用于表示目标标签的类型为劣质标签时,对第一媒体信息集合在目标标签下的发布概率进行下降调整;
[0242]
第二调整模块,用于在匹配结果用于表示目标标签的类型为优质标签时,对第一媒体信息集合在目标标签下的发布概率进行增加调整。
[0243]
具体实施例可以参考上述媒体信息的处理方法中所示示例,本示例中在此不再赘述。
[0244]
根据本发明实施例的又一个方面,还提供了一种用于实施上述媒体信息的处理方法的电子设备,如图13所示,该电子设备包括存储器1302和处理器1304,该存储器1302中存储有计算机程序,该处理器1304被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
[0245]
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
[0246]
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
[0247]
s1,获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值;
[0248]
s2,确定目标媒体信息统计维度下的媒体信息,得到第一媒体信息集合,其中,第一媒体信息集合中的媒体信息对应的行业为目标行业标识所表示的行业,第一媒体信息集合中的媒体信息的标签包括目标标签;
[0249]
s3,获取第一时长内第一媒体信息集合在目标标签下的第一发布结果;
[0250]
s4,确定第一发布结果与目标发布数据阈值的匹配结果;
[0251]
s5,根据匹配结果,对第一媒体信息集合在目标标签下的发布概率进行调整。
[0252]
可选地,本领域普通技术人员可以理解,图13所示的结构仅为示意,电子设备也可以是智能手机(如android手机、ios手机等)、平板电脑、掌上电脑以及移动互联网设备(mobile internet devices,mid)、pad等终端设备。图13其并不对上述电子设备的结构造成限定。例如,电子设备还可包括比图13中所示更多或者更少的组件(如网络接口等),或者具有与图13所示不同的配置。
[0253]
其中,存储器1302可用于存储软件程序以及模块,如本发明实施例中的媒体信息的处理方法和装置对应的程序指令/模块,处理器1304通过运行存储在存储器1302内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的媒体信息的处理方法。存储器1302可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1302可进一步包括相对于处理器1304远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器1302具体可以但不限于用于存储目标媒体信息统计维度、目标发布数据阈值、目标标签以及发布概率等信息。作为一种示例,如图13所示,上述存储器1302中可以但不限于包括上述媒体信息的处理装置中的第一获取单元1202、第一确定单元1204、第二获取单元1206、第二确定单元1208及处理单元1210。此外,还可以包括但不限于上述媒体信息的处理装置中的其他模块单元,本示例中不再赘述。
[0254]
可选地,上述的传输装置1306用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1306包括一个网络适配器(network interface controller,nic),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1306为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
[0255]
此外,上述电子设备还包括:显示器1308,用于显示上述目标媒体信息统计维度、目标发布数据阈值、目标标签以及发布概率等信息;和连接总线1310,用于连接上述电子设备中的各个模块部件。
[0256]
在其他实施例中,上述终端设备或者服务器可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成点对点(peer to peer,简称p2p)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。
[0257]
根据本技术的一个方面,提供了一种计算机程序产品,该计算机程序产品包括计算机程序/指令,该计算机程序/指令包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理器执行时,执行本技术实施例提供的各种功能。
[0258]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0259]
需要说明的是,电子设备的计算机系统仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
[0260]
计算机系统包括中央处理器(central processing unit,cpu),其可以根据存储在只读存储器(read-only memory,rom)中的程序或者从存储部分加载到随机访问存储器(random access memory,ram)中的程序而执行各种适当的动作和处理。在随机访问存储器中,还存储有系统操作所需的各种程序和数据。中央处理器、在只读存储器以及随机访问存储器通过总线彼此相连。输入/输出接口(input/output接口,即i/o接口)也连接至总线。
[0261]
以下部件连接至输入/输出接口:包括键盘、鼠标等的输入部分;包括诸如阴极射线管(cathode ray tube,crt)、液晶显示器(liquid crystal display,lcd)等以及扬声器等的输出部分;包括硬盘等的存储部分;以及包括诸如局域网卡、调制解调器等的网络接口卡的通信部分。通信部分经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至输入/输出接口。可拆卸介质,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器上,以便于从其上读出的计算机程序根据需要被安装入存储部分。
[0262]
特别地,根据本技术的实施例,各个方法流程图中所描述的过程可以被实现为计算机软件程序。例如,本技术的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理器执行时,执行本技术的系统中限定的各种功能。
[0263]
根据本技术的一个方面,提供了一种计算机可读存储介质,计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的方法。
[0264]
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
[0265]
s1,获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值;
[0266]
s2,确定目标媒体信息统计维度下的媒体信息,得到第一媒体信息集合,其中,第一媒体信息集合中的媒体信息对应的行业为目标行业标识所表示的行业,第一媒体信息集合中的媒体信息的标签包括目标标签;
[0267]
s3,获取第一时长内第一媒体信息集合在目标标签下的第一发布结果;
[0268]
s4,确定第一发布结果与目标发布数据阈值的匹配结果;
[0269]
s5,根据匹配结果,对第一媒体信息集合在目标标签下的发布概率进行调整。
[0270]
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(read-only memory,rom)、随机存取器(random access memory,ram)、磁盘或光盘等。
[0271]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0272]
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
[0273]
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0274]
在本技术所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0275]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0276]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0277]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

技术特征:
1.一种媒体信息的处理方法,其特征在于,包括:获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值;确定所述目标媒体信息统计维度下的媒体信息,得到第一媒体信息集合,其中,所述第一媒体信息集合中的媒体信息对应的行业为所述目标行业标识所表示的行业,所述第一媒体信息集合中的媒体信息的标签包括目标标签;获取第一时长内所述第一媒体信息集合在所述目标标签下的第一发布结果;确定所述第一发布结果与所述目标发布数据阈值的匹配结果;根据所述匹配结果,对所述第一媒体信息集合在所述目标标签下的发布概率进行调整。2.根据权利要求1所述的方法,其特征在于,所述获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值,包括:在目标映射表中,获取所述目标行业标识当前对应的所述目标媒体信息统计维度和所述目标发布数据阈值,其中,所述目标映射表中记录有多组具有对应关系的行业标识、媒体信息统计维度和发布数据阈值,所述目标映射表中不同的行业标识表示不同的行业。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取行业标识集合和第二媒体信息集合,其中,所述行业标识集合包括不同的n个行业标识,所述第二媒体信息集合包括与所述n个行业标识对应的n个媒体信息子集,每个媒体信息子集对应一个行业标识,所述第二媒体信息集合中的每个媒体信息对应的标签包括一个或多个标签,n为大于或等于2的正整数;获取第二时长内所述第二媒体信息集合中的媒体信息在对应的各个标签下的第二发布结果;根据所述第二发布结果,确定与所述n个行业标识对应的n组媒体信息统计维度和发布数据阈值,其中,所述目标映射表包括所述n个行业标识以及与所述n个行业标识对应的n组媒体信息统计维度和发布数据阈值。4.根据权利要求3所述的方法,其特征在于,所述获取第二时长内所述第二媒体信息集合中的媒体信息在对应的各个标签下的第二发布结果,包括:对于所述第二媒体信息集合中的每个媒体信息和每个媒体信息对应的各个标签执行以下步骤,其中,在执行以下步骤时,所述每个媒体信息为当前媒体信息,所述每个媒体信息对应的各个标签为当前标签:获取所述第二时长内所述当前媒体信息在所述当前标签下的第二发布结果,其中,所述第二发布结果包括:所述第二时长内所述当前媒体信息在所述当前标签下的当前转化数量、当前资源转移数量偏差值、当前转化率,其中,所述当前转化数量表示所述第二时长内所述当前媒体信息在所述当前标签下被发布给对应的帐号之后,所述对应的帐号针对所述当前媒体信息执行目标操作的次数,所述当前资源转移数量偏差值表示当前实际资源转移数量与当前预估资源转移数量的偏差,所述当前实际资源转移数量表示所述当前转化数量对应的实际产生的资源转移数量,所述预估资源转移数量表示所述当前转化数量对应的预计产生的资源转移数量,所述当前转化率表示所述当前转化数量与当前发布数量之间的比值,所述当前发布数量表示所述第二时长内所述当前媒体信息在所述当前标签下被发布给对应的帐号的次数。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第二发布结果,确定与所述n个行业标识对应的n组媒体信息统计维度和发布数据阈值,包括:对于所述n个行业标识中的每个行业标识,执行以下步骤,其中,在执行以下步骤时,所述每个行业标识为当前行业标识,所述当前行业标识对应所述n个媒体信息子集中的当前媒体信息子集,所述当前行业标识对应待确定的当前媒体信息统计维度和当前发布数据阈值,所述当前媒体信息统计维度的取值范围是m个统计维度、且所述当前发布数据阈值包括当前转化数阈值、与劣质标签对应的当前第一偏差阈值以及与优质标签对应的当前第二偏差阈值,所述当前转化数阈值的取值范围包括与所述m个统计维度对应的m个转化数量取值范围、所述当前第一偏差阈值的取值范围为第一偏差阈值取值范围、所述当前第二偏差阈值的取值范围为第二偏差阈值取值范围,m为大于或等于2的正整数:根据所述当前媒体信息子集中的每个媒体信息在对应的各个标签下的所述第二发布结果,确定与所述m个统计维度中的不同统计维度、所述不同统计维度对应的转化数量取值范围中的不同转化数量、所述第一偏差阈值取值范围中的不同第一偏差阈值、所述第二偏差阈值取值范围中的不同第二偏差阈值对应的组合转化率,得到s个组合转化率,其中,s为大于或等于2的正整数;在所述s个组合转化率中确定取值最大的目标组合转化率,并将所述当前媒体信息统计维度确定为等于所述目标组合转化率对应的统计维度,将所述当前发布数据阈值中的当前转化数阈值、当前第一偏差阈值以及当前第二偏差阈值分别确定为等于所述目标组合转化率对应的转化数量、对应的所述第一偏差阈值、对应的所述第二偏差阈值。6.根据权利要求5所述的方法,其特征在于,所述根据所述当前媒体信息子集中的每个媒体信息在对应的各个标签下的所述第二发布结果,确定与所述m个统计维度中的不同统计维度、所述不同统计维度对应的转化数量取值范围中的不同转化数量、所述第一偏差阈值取值范围中的不同第一偏差阈值、所述第二偏差阈值取值范围中的不同第二偏差阈值对应的组合转化率,包括:在所述m个统计维度中的不同统计维度为第i个统计维度、所述不同统计维度对应的转化数量取值范围中的不同转化数量为j、所述第一偏差阈值取值范围中的不同第一偏差阈值为t1,所述第二偏差阈值取值范围中的不同第二偏差阈值为t2时,获取所述当前媒体信息子集中所述第i个统计维度下的媒体信息,得到第i个媒体信息子集,1≤i≤m,j、t1、t2均为正数,t2<t1;获取所述第二时长内所述第i个媒体信息子集中的每个媒体信息在对应的各个标签下的转化数量、资源转移数量偏差值、转化率;在所述第i个媒体信息子集中的每个媒体信息在对应的各个标签下的转化数量大于或等于j时,根据所述第i个媒体信息子集中的每个媒体信息在对应的各个标签下的资源转移数量偏差值与t1和t2之间的关系,确定所述第i个媒体信息子集中的每个媒体信息对应的各个标签的类型,其中,在所述第i个媒体信息子集中的每个媒体信息在对应的标签下的资源转移数量偏差值大于或等于t1时,将所述对应的标签的类型确定为所述劣质标签,在所述第i个媒体信息子集中的每个媒体信息在对应的标签下的资源转移数量偏差值小于t2时,将所述对应的标签的类型确定为所述优质标签,在所述第i个媒体信息子集中的每个媒体信息在对应的标签下的资源转移数量偏差值大于或等于t2、且小于t1时,将所述对应的
标签的类型确定为中性标签;获取所述第i个媒体信息子集中的每个媒体信息在类型为所述优质标签的各个标签下的转化率的第一均值、所述第i个媒体信息子集中的每个媒体信息在类型为所述中性标签的各个标签下的转化率的第二均值、以及所述第i个媒体信息子集中的每个媒体信息在类型为所述劣质标签的各个标签下的转化率的第三均值;根据所述第一均值、所述第二均值和所述第三均值,确定与所述第i个统计维度、j、t1以及t2对应的组合转化率。7.根据权利要求3所述的方法,其特征在于,所述获取第二时长内所述第二媒体信息集合中的媒体信息在对应的各个标签下的第二发布结果,包括:每隔预设周期获取所述第二时长内所述第二媒体信息集合中的媒体信息在对应的各个标签下的第二发布结果,其中,所述目标映射表每隔所述预设周期被更新一次。8.根据权利要求1至7中任一项所述的方法,其特征在于,所述确定所述目标媒体信息统计维度下的媒体信息,得到第一媒体信息集合,包括以下至少之一:在所述目标媒体信息统计维度表示按照单个媒体信息的维度进行统计时,确定目标媒体信息,其中,所述第一媒体信息集合包括所述目标媒体信息;在所述目标媒体信息统计维度表示按照单个提供帐号和单个委托帐号的维度进行统计时,确定目标提供帐号通过目标委托帐号提供的媒体信息,得到所述第一媒体信息集合;在所述目标媒体信息统计维度表示按照单个提供帐号和多个委托帐号的维度进行统计时,确定目标提供帐号通过多个目标委托帐号提供的媒体信息,得到所述第一媒体信息集合。9.根据权利要求1至7中任一项所述的方法,其特征在于,所述获取第一时长内所述第一媒体信息集合在所述目标标签下的第一发布结果,包括:获取所述第一时长内所述第一媒体信息集合在所述目标标签下的转化数量和资源转移数量偏差值,其中,所述转化数量表示所述第一时长内所述第一媒体信息集合中的媒体信息在所述目标标签下被发布给对应的帐号之后,所述对应的帐号针对所述第一媒体信息集合中的媒体信息执行目标操作的次数,所述资源转移数量偏差值表示实际资源转移数量与预估资源转移数量的偏差,所述实际资源转移数量表示所述转化数量对应的实际产生的资源转移数量,所述预估资源转移数量表示所述转化数量对应的预计产生的资源转移数量。10.根据权利要求9所述的方法,其特征在于,所述确定所述第一发布结果与所述目标发布数据阈值的匹配结果,包括:在所述目标发布数据阈值包括目标转化数阈值、以及与大于或等于所述目标转化数阈值所对应的多个偏差范围时,确定所述转化数量是否大于或等于所述目标转化数阈值,其中,所述多个偏差范围包括与劣质标签对应的第一偏差范围以及与优质标签对应的第二偏差范围,所述第一偏差范围中的偏差值大于所述第二偏差范围中的偏差值;在所述转化数量大于或等于所述目标转化数阈值时,确定所述资源转移数量偏差值是否位于所述第一偏差范围或位于所述第二偏差范围内;在所述资源转移数量偏差值位于所述第一偏差范围内时,将所述匹配结果确定为用于表示所述目标标签的类型为所述劣质标签;
在所述资源转移数量偏差值位于所述第二偏差范围内时,将所述匹配结果确定为用于表示所述目标标签的类型为所述优质标签。11.根据权利要求10所述的方法,其特征在于,所述根据所述匹配结果,对所述第一媒体信息集合在所述目标标签下的发布概率进行调整,包括:在所述匹配结果用于表示所述目标标签的类型为所述劣质标签时,对所述第一媒体信息集合在所述目标标签下的发布概率进行下降调整;在所述匹配结果用于表示所述目标标签的类型为所述优质标签时,对所述第一媒体信息集合在所述目标标签下的发布概率进行增加调整。12.一种媒体信息的处理装置,其特征在于,包括:第一获取单元,用于获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值;第一确定单元,用于确定所述目标媒体信息统计维度下的媒体信息,得到第一媒体信息集合,其中,所述第一媒体信息集合中的媒体信息对应的行业为所述目标行业标识所表示的行业,所述第一媒体信息集合中的媒体信息的标签包括目标标签;第二获取单元,用于获取第一时长内所述第一媒体信息集合在所述目标标签下的第一发布结果;第二确定单元,用于确定所述第一发布结果与所述目标发布数据阈值的匹配结果;处理单元,用于根据所述匹配结果,对所述第一媒体信息集合在所述目标标签下的发布概率进行调整。13.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行所述权利要求1至11任一项中所述的方法。14.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至11任一项中所述方法的步骤。15.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至11任一项中所述的方法。

技术总结
本发明公开了一种媒体信息的处理方法、装置和存储介质及电子设备。其中,该方法包括:获取目标行业标识当前对应的目标媒体信息统计维度和目标发布数据阈值;确定目标媒体信息统计维度下的媒体信息,得到第一媒体信息集合,其中,第一媒体信息集合中的媒体信息对应的行业为目标行业标识所表示的行业,第一媒体信息集合中的媒体信息的标签包括目标标签;获取第一时长内第一媒体信息集合在目标标签下的第一发布结果;确定第一发布结果与目标发布数据阈值的匹配结果;根据匹配结果,对第一媒体信息集合在目标标签下的发布概率进行调整。本发明解决了媒体信息的准确性较低的技术问题。明解决了媒体信息的准确性较低的技术问题。明解决了媒体信息的准确性较低的技术问题。


技术研发人员:李少波
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2022.01.05
技术公布日:2023/7/20
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐