一种对象标签生成方法、装置和计算机可读存储介质与流程
未命名
08-25
阅读:98
评论:0

1.本发明涉及通信技术领域,具体涉及一种对象标签生成方法、装置和计算机可读存储介质。
背景技术:
2.近年来,随着互联网技术的飞速发展,互联网中的内容也越来越丰富。通过对象对网络中内容的浏览,就可以确定该对象对内容的兴趣信息,进而生成对象标签。通过该对象标签,就可以使得对象的形象具体化。现有的对象标签生成方法往往是通过人工编辑或者基于历史操作信息进行挖掘而来的。
3.在对现有技术的研究和实践过程中,本发明的发明人发现对于人工编辑的方式,导致对象的覆盖率较低,而采用历史操作信息进行挖掘,挖掘出的对象标签语义不齐,信息不丰富,另外,对象标签的来源较为单一,因此,导致对象标签生成的准确率较低。
技术实现要素:
4.本发明实施例提供一种对象标签生成方法、装置和计算机可读存储介质,可以提高对象标签生成的准确率。
5.一种对象标签生成方法,包括:
6.获取至少一个目标对象在预设时间段的历史操作信息;
7.在所述历史操作信息中筛选出针对预设内容知识图谱对应的目标内容的目标历史操作信息;
8.基于所述目标历史操作信息和预设内容知识图谱,统计出所述目标对象的历史对象标签;
9.根据所述目标内容和目标历史操作信息,在所述预设内容知识图谱对应的对象标签集合中确定出所述目标对象的至少一个预测对象标签;
10.将所述历史对象标签和预测对象标签进行融合,得到所述目标对象的对象标签。
11.相应的,本发明实施例提供一种对象标签生成装置,包括:
12.获取单元,用于获取至少一个目标对象在预设时间段的历史操作信息;
13.筛选单元,用于在所述历史操作信息中筛选出针对预设内容知识图谱对应的目标内容的目标历史操作信息;
14.统计单元,用于基于所述目标历史操作信息和预设内容知识图谱,统计出所述目标对象的历史对象标签;
15.确定单元,用于根据所述目标内容和目标历史操作信息,在所述预设内容知识图谱对应的对象标签集合中确定出所述目标对象的至少一个预测对象标签;
16.融合单元,用于将所述历史对象标签和预测对象标签进行融合,得到所述目标对象的对象标签。
17.可选的,在一些实施例中,所述确定单元,具体可以用于对所述目标内容的文本信
息进行特征提取,得到所述目标内容的内容特征;基于所述目标历史操作信息,将所述内容特征转换为所述目标对象的对象特征;在所述预设内容知识图谱对应的对象标签集合中筛选出所述对象特征对应的至少一个对象标签,得到所述目标对象的预测对象标签。
18.可选的,在一些实施例中,所述确定单元,具体可以用于基于所述目标历史操作信息,在所述内容特征中筛选出预设时间区间内所述目标对象进行操作的至少一个目标内容的内容特征,得到基础内容特征;采用训练后对象特征生成模型对所述基础内容特征进行最大池化处理,以得到目标池化后内容特征;对所述目标池化后内容特征进行非线性转换,得到所述目标对象的对象特征。
19.可选的,在一些实施例中,所述确定单元,具体可以用于获取所述目标对象操作过的历史内容样本集合对应的样本内容特征集合,所述样本内容特征集合包括至少一个标注分类结果的样本内容特征;在所述样本内容特征集合中确定出至少一个目标样本内容特征,并将所述样本内容特征集合中除所述目标样本内容特征以外的样本内容特征作为待分类样本内容的待分类样本内容特征;基于所述标注分类结果、目标样本内容特征和待分类样本内容特征,对预设对象特征生成模型进行收敛,得到训练后对象特征生成模型。
20.可选的,在一些实施例中,所述确定单元,具体可以用于采用所述预设对象特征生成模型对所述目标样本内容特征进行特征转换,得到所述目标对象的样本对象特征;采用所述预设对象特征生成模型对所述待分类样本内容特征进行特征转换,得到所述待分类内容的分类样本内容特征;基于所述样本对象特征和分类样本内容特征,预测所述目标对象针对所述待分类内容的分类结果,得到预测分类结果;根据所述预测分类结果和标注分类结果,对预设对象特征生成模型进行收敛,得到训练后对象特征生成模型。
21.可选的,在一些实施例中,所述确定单元,具体可以用于获取所述预设内容知识图谱对应的对象标签集合,并在所述预设内容知识图谱中提取出三元组信息;根据所述三元组信息,采用训练后对象标签预测模型对所述对象标签集合中的对象标签进行特征提取,以得到所述对象特征对应的至少一个候选对象标签的对象标签特征;计算所述对象特征和对象标签特征之间的特征相似度,以得到所述目标对象的预测对象标签。
22.可选的,在一些实施例中,所述确定单元,具体可以用于采用训练后对象标签预测模型在所述对象标签集合中筛选出所述对象特征对应的至少一个候选对象标签,并对所述候选对象标签进行特征提取,得到所述候选对象标签的基础对象标签特征;采用所述训练后对象标签预测模型对所述三元组信息进行特征提取,得到基础实体特征和实体关系特征,并将基础实体特征和实体关系特征进行融合,得到实体特征;将所述实体特征和所述基础对象标签特征进行融合,得到所述候选对象标签的对象标签特征。
23.可选的,在一些实施例中,所述确定单元,具体可以用于获取目标对象对应的目标对象标签样本,并基于所述目标对象标签样本,在所述对象标签集合中随机负采样出对象标签负样本,得到对象标签样本集合;在预设内容知识图谱中提取出三元组信息样本,并基于该三元组信息样本构建三元组信息负样本,得到三元组信息样本集合;基于所述对象标签样本集合和三元组信息样本集合对预设对象标签预测模型进行收敛,得到训练后对象标签预测模型。
24.可选的,在一些实施例中,所述确定单元,具体可以用于基于所述对象标签样本集合,确定所述目标对象的对象标签损失信息;根据所述三元组信息样本集合,确定所述目标
对象的三元组损失信息;基于所述对象标签损失信息和三元组损失信息,对所述预设对象标签预测模型的网络参数进行更新,并对更新后网络参数进行正则化处理,得到所述训练后对象标签预测模型。
25.可选的,在一些实施例中,所述确定单元,具体可以用于计算所述对象特征和对象标签特征之间的特征相似度,并将所述特征相似度作为所述目标对象对所述对象标签特征对应的对象标签的预测兴趣度;基于所述预测兴趣度,对所述候选对象标签进行排序;根据所述候选对象标签的排序信息,在所述候选对象标签中筛选出所述目标对象的预测对象标签。
26.可选的,在一些实施例中,所述统计单元,具体可以用于在所述预设内容知识图谱提取出图谱关系,所述图谱关系用于指示所述目标内容与候选历史对象标签之间的关系;在所述目标历史操作信息中统计出所述目标对象针对每一所述目标内容的操作频次;基于所述操作频次和图谱关系,确定所述目标对象的历史对象标签。
27.可选的,在一些实施例中,所述统计单元,具体可以用于在所述图谱关系中识别出每一所述目标内容对应的候选历史对象标签;基于所述操作频次,对所述候选历史对象标签进行排序;根据所述候选历史对象标签的排序信息,在所述候选历史对象标签中筛选出所述目标对象的历史对象标签,并确定每一历史对象标签的历史兴趣度。
28.可选的,在一些实施例中,所述融合单元,具体可以用于获取每一对象标签类型对应的加权系数,并基于所述加权系数和操作频次,对所述历史兴趣度进行加权,得到所述历史对象标签的加权后历史兴趣度;根据所述加权系数,对所述预测兴趣度进行加权,得到加权后预测兴趣度;将所述加权后历史兴趣度和加权后预测兴趣度进行融合,以得到所述目标对象的对象标签。
29.可选的,在一些实施例中,所述融合单元,具体可以用于将所述加权后历史兴趣度和加权后预测兴趣度进行融合,得到融合后兴趣度;对所述融合后兴趣度进行归一化处理,得到所述历史对象标签的目标历史兴趣度和所述预测对象标签的目标预测兴趣度;基于所述目标历史兴趣度和目标预测兴趣度,在所述历史对象标签和预测对象标签中筛选出所述目标对象的对象标签。
30.可选的,在一些实施例中,所述融合单元,具体可以用于根据所述历史兴趣度,在所述历史对象标签中筛选出目标历史对象标签;在所述操作频次中筛选出所述目标历史对象标签对应的目标操作频次,并基于所述目标操作频次,确定所述目标历史对象的操作参数;将所述操作参数与所述目标历史对象标签的历史兴趣度进行融合,得到融合后历史兴趣度,并基于所述加权系数,对所述融合后历史兴趣度进行加权,得到所述历史对象标签的加权后历史兴趣度。
31.可选的,在一些实施例中,所述筛选单元,具体可以用于在所述预设内容知识图谱中提取出至少一个内容标识,并在所述历史操作信息中识别出所述内容标识对应的目标内容;在所述历史操作信息中筛选出所述目标内容对应的初始历史操作信息;对所述初始历史操作信息进行清洗,得到所述目标内容对应的目标历史操作信息。
32.此外,本发明实施例还提供一种电子设备,包括处理器和存储器,所述存储器存储有应用程序,所述处理器用于运行所述存储器内的应用程序实现本发明实施例提供的对象标签生成方法。
33.此外,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行本发明实施例所提供的任一种对象标签生成方法中的步骤。
34.本发明实施例在获取至少一个目标对象在预设时间段的历史操作信息后,在历史操作信息中筛选出针对预设内容知识图谱对应的目标内容的目标历史操作信息,然后,基于目标历史操作信息和预设内容知识图谱,统计出目标对象的历史对象标签,然后,根据目标内容和目标历史操作信息,在预设内容知识图谱对应的对象标签集合中确定出目标对象的至少一个预测对象标签,将历史对象标签和预测对象标签进行融合,得到目标对象的对象标签;由于该方案在挖掘目标对象的历史操作信息的前提下,还借助了预设内容知识图谱的关联信息,可以改善对象标签的语义不齐等问题,而且在挖掘出历史对象标签的同时还可以预测对象的潜在对象标签,因此,可以提升对象标签生成的准确性。
附图说明
35.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
36.图1是本发明实施例提供的对象标签生成方法的场景示意图;
37.图2是本发明实施例提供的对象标签生成方法的流程示意图;
38.图3是本发明实施例提供的视频知识图谱中的子图的示意图;
39.图4是本发明实施例提供的统计出历史对象标签的流程示意图;
40.图5是本发明实施例提供的对预设对象特征生成模型进行训练的示意图;
41.图6是本发明实施例提供的预测目标对象的预测对象标签的流程示意图;
42.图7是本发明实施例提供的生成目标对象的对象标签的流程示意图;
43.图8是本发明实施例提供的对象标签生成方法的另一流程示意图;
44.图9是本发明实施例提供的对象标签生成装置的结构示意图;
45.图10是本发明实施例提供的电子设备的结构示意图。
具体实施方式
46.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
47.本发明实施例提供一种对象标签生成方法、装置和计算机可读存储介质。其中,该对象标签生成装置可以集成在电子设备中,该电子设备可以是服务器,也可以是终端等设备。
48.其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、网络加速服务(content delivery network,
cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本技术在此不做限制。本发明实施例可应用于各种场景,包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。本发明实施例中生成的对象标签可以应用在广告投放、视频个性化推荐、产品运营等应用场景,在生成对象标签过程中产生的对象及对象标签的隐式信息(特征)也可以用于对象学习、内容推荐、内容召回等模型学习过程的应用场景。
49.例如,参见图1,以对象标签生成装置集成在电子设备中为例,电子设备在获取至少一个目标对象在预设时间段的历史操作信息后,在历史操作信息中筛选出针对预设内容知识图谱对应的目标内容的目标历史操作信息,然后,基于目标历史操作信息和预设内容知识图谱,统计出目标对象的历史对象标签,然后,根据目标内容和目标历史操作信息,在预设内容知识图谱对应的对象标签集合中确定出目标对象的至少一个预测对象标签,将历史对象标签和预测对象标签进行融合,得到目标对象的对象标签,进而提升对象标签生成的准确性。
50.其中,对象标签可以理解为将对象的属性、行为等抽象为标签,将对象形象具体化的一种表达方式。在本方案中的对象标签重点在于将对象的兴趣等虚拟化,从而得到对象的兴趣标签,使得用户形象具体化,因此,对象标签也可以为对象的兴趣标签。
51.以下分别进行详细说明。需要说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
52.如图2所示,该对象标签生成方法由电子设备执行,具体流程如下:
53.101、获取至少一个目标对象在预设时间段的历史操作信息。
54.其中,历史操作信息可以理解为对目标对象在内容平台或业务平台对内容或者业务进行操作的信息。所谓目标对象可以为内容平台或业务平台的用户。
55.其中,获取目标对象的历史操作信息的方式可以有多种,具体可以如下:
56.例如,可以获取至少一个目标对象的历史操作日志,在该历史操作日志中读取出预设时间段的操作信息,从而得到目标对象的历史操作信息,或者,还可以获取至少一个目标对象的历史操作日志,在历史操作日志中筛选出预设时间段的目标历史操作日志,在目标历史操作日志中读取出目标对象针对内容的操作信息,得到目标对象的历史操作信息。
57.102、在历史操作信息中筛选出针对预设知识图谱对应的目标内容的目标历史操作信息。
58.其中,预设内容知识图谱可以理解为预先设置的与内容相关的知识图谱,所谓知识图谱是一种包含了实体与关系的知识库,常用(头实体,关系,尾实体)这样的三元组信息表示;知识图谱具备包含相关实体的语义关系,多样的关系组成以及良好的解释性等优势,使其近些年来在搜索、推荐、问答等领域得到了广泛的应用。以预设知识图谱为视频对应的知识图谱为例,图3为截图至视频知识图谱的一个子图,从图3中可以看出知识图谱包含多样的信息,比如,可以包含视频实体、抽象实体、人物实体、标签实体、多样的关系以及实体-关系的三元组等。
59.其中,在历史操作信息中筛选出针对预设知识图谱对应的目标内容的目标历史操作信息的方式可以有多种,具体可以如下:
60.例如,可以在预设内容知识图谱中提取出至少一个内容标识,并在历史操作信息中识别出内容标识对应的目标内容,在历史操作信息中筛选并出目标内容对应的初始历史操作信息,对初始历史操作信息进行清洗,得到目标内容对应的目标历史操作信息。
61.其中,目标内容可以为内容知识图谱中关联的内容,目标内容的形式可以有多种,比如,可以为视频、音频、文本或者其他内容。对目标内容对应的初始历史操作信息进行清洗的方式可以有多种,比如,可以在初始历史操作信息中识别出针对目标内容的操作时长,获取目标内容的内容时长,并计算操作时长和内容时长的时长比值,在初始历史操作信息中删除时长比值未超过预设比值阈值的目标内容的操作信息,得到目标内容对应的目标历史操作信息。
62.其中,预设比值阈值可以根据实际应用进行设定,比如,可以为0.5或者其他阈值。以内容为视频,初始操作信息为视频观看信息为例,通过该预设比值阈值可以在视频观看信息中去掉噪声信息,从而提取出有效的视频观看信息。
63.103、基于目标历史操作信息和预设内容知识图谱,统计出目标对象的历史对象标签。
64.其中,历史对象标签可以理解为基于目标对象的目标历史操作信息确定出的对象标签,主要指示目标对象在历史阶段的对象标签。
65.其中,基于目标历史操作信息和预设内容知识图谱,统计出目标对象的历史对象标签的方式可以有多种,具体可以如下:
66.例如,在预设内容知识图谱中提取出图谱关系,在目标历史操作信息中统计出目标对象对每一目标内容的操作频次,基于操作频次和图谱关系,确定目标对象的历史对象标签。
67.其中,图谱关系用于指示目标内容与候选历史对象标签之间的关系,基于该图谱关系就可以确定目标内容对应的候选历史对象标签。
68.其中,在目标历史操作信息中统计出目标对象对每一目标内容的操作频次的方式可以有多种,比如,在目标历史操作信息中识别出目标对象对目标内容进行操作的操作信息,统计该操作信息的次数,从而就可以得到目标对象对该目标内容的操作频次。
69.在统计出目标内容的操作频次之后,便可以基于操作频次和图谱关系,确定目标对象的历史对象标签,确定历史对象标签的方式可以有多种,比如,在图谱关系中识别出每一目标内容对应的候选历史对象标签,基于操作频次,对候选历史对象标签进行排序,根据候选历史对象标签的排序信息,在候选历史对象标签中筛选出目标对象的历史对象标签,并确定每一历史对象标签的历史兴趣度。
70.其中,历史兴趣度可以为目标对象对历史对象标签对应的目标内容的感兴趣的程度。确定每一历史对象标签的历史兴趣度的方式可以有多种,比如,可以对历史对象标签的排序信息进行特征提取,得到目标对象关于历史对象标签的兴趣特征,基于该兴趣特征,确定历史对象标签的历史兴趣度。
71.其中,以目标内容为视频为例,统计出目标对象的历史对象标签的方式可以如图4所示,可以根据预设内容知识图谱(knowledge graph,kg)提取出有效的视频id信息,在数据库中提取出目标对象的历史操作日志中抽取一段时间内有效关联知识图谱中视频id的对象观看视频信息,计算目标对象的有效观看视频信息,目前认为视频观看时长比例超过
0.5视为有效观看行为,根据有效观看行为,在图谱关系中游走,统计所有历史对象标签的频次,然后,按照频次截取出topn的候选历史画像标签作为目标对象的历史对象标签。
72.104、根据目标内容和目标历史操作信息,在预设内容知识图谱对应的对象标签集合中确定出目标对象的至少一个预测对象标签。
73.其中,预测对象标签可以理解为目标对象的潜在对象标签,表示目标对象潜在的兴趣标签。
74.其中,在预设内容知识图谱对应的对象标签集合中确定出目标对象的至少一个预测对象标签的方式可以有多种,具体可以如下:
75.例如,可以对目标内容的文本信息进行特征提取,得到目标内容的内容特征,基于目标历史操作信息,将内容特征转换为目标对象的对象特征,在预设内容知识图谱对应的对象标签集合中筛选出对象特征对应的至少一个对象标签,得到目标对象的预测对象标签,具体可以如下:
76.s1、对目标内容的文本信息进行特征提取,得到目标内容的内容特征。
77.其中,文本信息可以为目标内容中包含的文本信息,也可以为对目标内容进行简介或者属于目标内容的属性信息的文本信息,文本信息的类型可以有多种,比如,以目标内容为视频为例,目标内容的文本信息就可以包括视频标题、视频简介或者视频中字幕等文本信息。
78.其中,对目标内容的文本信息进行特征提取的方式可以有多种,具体可以如下:
79.例如,可以在目标内容中提取出文本信息,并识别文本信息的文本类型,基于文本类型,在文本信息中筛选出目标文本信息,对目标文本信息进行语义特征提取,得到目标内容的内容特征。
80.其中,文本类型用于指示文本信息的类型,文本类型可以有多种,比如,可以包括标题、摘要信息(简介信息)和字幕等等。基于文本类型,在文本信息中筛选出目标文本信息的方式可以有多种,比如,以目标文本为视频为例,基于文本类型,在文本信息中筛选出视频的视频标题和摘要信息,将视频标题和摘要信息作为目标文本信息。
81.在筛选出目标文本信息之后,便可以对目标文本信息进行语义特征提取,语义特征提取的方式可以有多种,比如,可以采用预训练语义特征提取模型对视频标题和摘要信息进行语义特征提取,得到语义特征,并将语义特征作为目标内容的内容特征,该内容特征的维度可以为768维或者其他维度。
82.s2、基于目标历史操作信息,将内容特征转换为目标对象的对象特征。
83.其中,对象特征可以为表征目标对象的特征信息。
84.其中,将内容特征转换为目标对象的对象特征的方式可以有多种,具体可以如下:
85.例如,可以基于目标历史操作信息,在内容特征中筛选出预设时间区间内目标对象进行操作的至少一个目标内容的内容特征,得到基础内容特征,采用训练后对象特征生成模型对基础内容特征进行最大池化处理,以得到目标池化后内容特征,对目标池化后内容特征进行非线性转换,得到目标对象的对象特征。
86.其中,采用训练后对象特征生成模型对基础内容特征进行最大池化处理的方式可以有多种,比如,可以采用训练后对象特征生成模型对基础内容特征进行池化处理,此时输出与基础内容特征的特征维度相同的池化后基础内容特征,并在池化后基础内容特征中筛
选出特征值最大的基础内容特征作为目标对象对应的初始池化后内容特征,对初始池化后内容特征通过训练后对象特征生成模型的激活层(relu层)进行激活处理,然后,对激活处理后的初始池化后内容特征进行压缩,压缩至128维,从而得到目标池化后内容特征。
87.其中,该训练后对象特征生成模型可以根据实际应用进行设置,另外,需要说明的是,该训练后对象特征生成模型可以由维护人员预先设置,也可以由对象标签生成装置自行进行训练,即步骤“采用训练后对象特征生成模型对基础内容特征进行最大池化处理”之前,该对象标签生成方法还可以包括:
88.获取目标对象操作过的历史内容样本集合对应的样本内容特征集合,该样本内容特征集合包括至少一个标注分类结果的样本内容特征,在样本内容特征集合中确定出至少一个目标样本内容特征,并将样本内容特征集合中除目标样本内容特征以外的样本内容特征作为待分类样本内容的待分类样本内容特征,基于标注分类结果、目标样本内容特征和待分类样本内容特征,对预设对象特征生成模型进行收敛,得到训练后对象特征生成模型。
89.其中,标注分类结果可以理解为标注的目标对象针对目标样本内容特征对应的样本内容是否感兴趣的分类结果。基于标注分类结果、目标样本内容特征和待分类样本内容特征,对预设对象特征生成模型进行收敛的方式可以有多种,比如,采用预设对象特征生成模型对目标样本内容特征进行特征转换,得到目标对象的样本对象特征,采用预设对象特征生成模型对待分类样本内容特征进行特征转换,得到待分类内容的分类样本内容特征,基于样本对象特征和分类样本内容特征,预测目标对象针对待分类内容的分类结果,得到预测分类结果,根据预测分类结果和标注分类结果,对预设特征生成模型进行收敛,得到训练后对象特征生成模型。
90.其中,以内容为视频为例,对预设对象特征生成模型进行训练的过程可以如图5所示,通过对目标对象在一段时间观看过的目标视频的样本内容特征转换为目标对象的样本对象特征,然后,对待分类的视频样本的分类样本内容特征同样进行特征转换,将特征转换后的特征为待分类视频样本的待分类样本内容特征,通过分类网络(softmax)计算目标对象是否对待分类视频是否感兴趣观看的分类计算,从而得到预测分类结果,将预测分类结果和标注分类结果进行对比,从而得到目标对象的损失信息,基于该损失信息,对对象特征生成模型进行收敛,得到训练后对象特征生成模型。
91.s3、在预设内容知识图谱对应的对象标签集合中筛选出对象特征对应的至少一个对象标签,得到目标对象的预测对象标签。
92.其中,预测对象标签可以理解为预测出的目标对象的潜在对象标签。
93.其中,在对象标签集合中筛选出对象特征对应的至少一个对象标签的方式可以有多种,具体可以如下:
94.例如,获取预设内容知识图谱对应的对象标签集合,并在预设内容知识图谱中提取出三元组信息,根据三元组信息,采用训练后对象标签预测模型对对象标签集合中的对象标签进行特征提取,以得到对象特征对应的至少一个候选对象标签的对象标签特征,计算对象特征和对象标签特征之间的特征相似度,以得到目标对象的预测对象标签。
95.其中,三元组信息可以理解为预设内容知识图谱中与内容关联的头节点、关系节点和尾节点组成的信息。头结点和尾节点可以为实体,关系节点可以为实体之间的关系。根据三元组信息,采用训练后对象标签预测模型对对象标签集合中的对象标签进行特征提取
的方式可以有多种,比如,采用训练后对象标签预测模型在对象标签集合中筛选出对象特征对应的至少一个候选对象标签,并对候选对象标签进行特征提取,得到候选对象标签的基础对象标签特征,采用训练后对象标签预测模型对三元组信息进行特征提取,得到基础实体特征和实体关系特征,并将基础实体特征和实体关系特征进行融合,得到实体特征,将实体特征和基础对象标签特征进行融合,得到候选对象标签的对象标签特征。
96.在得到候选对象标签的对象标签特征之后,便可以计算对象特征和对象标签特之间的特征相似度,计算特征相似度的方式可以有多种,比如,可以计算对象特征和对象特征标签之间的特征相似度,并将特征相似度作为目标对象对对象标签特征对应的对象标签的预测兴趣度,基于预测兴趣度,对候选对象标签进行排序,根据候选对象标签的排序信息,在候选对象标签中筛选出目标对象的预测对象标签。
97.其中,计算特征相似度可以理解为计算候选对象标签特征和对象特征之间的相关性,从而得到目标对象对对象标签特征对应的对象标签的预测兴趣度,然后,基于该预测兴趣度对候选对象标签进行排序,基于候选对象标签的排序信息,在候选对象标签中筛选出目标对象的预测对象标签的方式可以有多种,比如,可以在候选对象标签中筛选出排序位置超过预设位置阈值的至少一个候选对象标签,从而得到目标对象的预测对象标签。
98.其中,该训练后对象标签预测模型可以根据实际应用进行设置,另外,需要说明的是,该训练后对象标签预测模型可以由维护人员预先设置,也可以由对象标签生成装置自行进行训练,即步骤“采用训练后对象标签预测模型在对象标签集合中筛选出对象特征对应的至少一个候选对象标签”之前,该对象标签生成方法还可以包括:
99.获取目标对象对应的目标对象标签样本,并基于目标对象标签样本在对象标签集合中随机负采样出对象标签负样本,得到对象标签样本集合,在预设内容知识图谱中提取出三元组信息样本,并基于该三元组信息样本构建三元组信息负样本,得到三元组信息样本集合,基于对象样本标签集合和三元组信息样本集合对预设对象标签预测模型进行收敛,得到训练后对象标签预测模型。
100.其中,基于三元组信息样本构建三元组信息负样本的方式可以有多种,比如,在三元组信息样本中提取出每一三元组信息中的首节点、尾节点和关系节点,在尾节点中随机筛选出与首节点不相连的尾节点作为目标尾节点,将首节点关系节点和目标尾节点作为三元组信息负样本,将三元组信息样本和三元组信息负样本作为三元组信息样本集合。
101.在构建出三元组信息样本集合之后,便可以基于对象标签样本集合和三元组信息样本集合对预设对象标签预测模型进行收敛,收敛的方式可以有多种,比如,基于对象标签样本集合,确定目标对象的对象标签损失信息,根据三元组信息样本集合,确定目标对象的三元组损失信息,基于对象标签损失信息和三元组损失信息,对预设对象标签预测模型的网络参数进行更新,并对更新后网络参数进行正则化处理,得到训练后对象标签预测模型。
102.其中,对象标签损失信息主要用于训练预设对象标签预测模型中计算目标对象的对象标签的喜好的损失信息来学习对象标签特征,三元组损失信息主要可以采用预设对象标签预测模型中的融合网络(transr)学习知识图谱中的三元组知识,训练过程中主要用于计算预设知识图谱网络的损失信息,以学习实体特征(entity embedding)和关系特征(relation embedding)。另外,在对预设对象标签预测模型的整体优化除了上述两个部分的损失信息之外,还可以包括所有网络参数的正则化项,以防止模型过拟合,此外,为了使
预设对象标签预测模型的优化目标更快速的逼近全局最优,还可以采用根据检测指标状态,动态衰减学习率的方法。在对预设对象标签预测模型训练之后,可以基于训练后对象标签预测模型基于目标对象的对象标签预测该目标对象对应的预测对象标签的过程可以如图6所示,在预设内容知识图谱对应的对象标签集合中筛选出至少一个候选对象标签,对候选对象标签进行特征提取,得到基础对象标签特征(portrait embedding),并对预设内容知识图谱中的三元组信息进行特征提取,得到基础实体特征(entity embedding)和关系特征(relation embedding),将基础实体特征和关系特征进行融合,得到实体特征,将实体特征与基础对象标签特征进行融合,从而得到每一候选对象标签的对象标签特征,然后,计算对象特征标签与对象特征之间的相关性,并基于计算出的相关性进行排序,从而就可以得到目标对象的至少一个预测对象标签。
103.105、将历史对象标签和预测对象标签进行融合,得到目标对象的对象标签。
104.例如,可以获取每一对象标签类型对应的加权系数,并基于加权系数和操作频次,对历史兴趣度进行加权,得到历史对象标签的加权后历史兴趣度,根据加权系数,对预测兴趣度进行加权,得到加权后预测兴趣度,将加权后历史兴趣度和加权后预测兴趣度进行融合,以得到目标对象的对象标签。
105.其中,加权系数可以理解为每一对象标签类型对应的权重,基于加权系数和操作频次,对历史兴趣度进行加权的方式可以有多种,比如,可以基于历史兴趣度,在历史对象标签中筛选出目标历史对象标签,在操作频次中筛选出目标历史对象标识对应的目标操作频次,并基于目标操作频次,确定目标历史对象的操作参数,将操作参数与目标历史对象标签的历史兴趣度进行融合,得到融合后历史兴趣度,并基于加权系数,对融合后历史兴趣度进行加权,得到历史对象标签的加权后历史兴趣度。
106.其中,基于历史兴趣度,在历史历史对象标签的方式可以有多种,比如,可以在历史对象标签中筛选出历史兴趣度最大的历史对象标签,从而得到目标历史对象标签。
107.其中,基于目标操作频次,确定目标历史对象标签的操作参数的方式可以有多种,比如,获取预设基础操作参数,将预设基础操作参数与目标操作频次进行融合,从而得到历史对象标签的操作参数。
108.其中,基于加权系数,对融合后历史兴趣度进行加权的方式可以有多种,比如,可以直接将加权系数与融合后历史兴趣度相乘,从而得到历史对象标签的加权后历史兴趣度,具体可以参见公式(1):
[0109][0110]
其中,score
his,u,t
为历史对象标签的加权后兴趣度,为加权系数(权重),对象标签可以分为视频实体、ip、系列、人物、1-3级标签等类型,不同类型的对象标签具有不同的权重,r
t
为目标操作频次,α为预设基础操作参数,根据实际应用进行设定,比如,可以为0.9或者其他数值,score
base,u
为目标历史对象标签的历史兴趣度。
[0111]
其中,根据加权系数对预测兴趣度进行加权的方式可以有多种,比如,可以在加权系数中筛选出预测对象标签对应的目标加权系数,基于该目标加权系数对预测兴趣度进行
加权,从而得到预测对象标签的加权后预测兴趣度,具体可以如公式(2)所示:
[0112][0113]
其中,score
pre,u,t
为预测对象标签的加权后预测兴趣度,为目标加权系数,score
prem,u,t
为预测对象标签的预测兴趣度。
[0114]
在对历史兴趣度和预测兴趣度分别进行加权后,便可以将加权后历史兴趣度和加权后预测兴趣进行融合,融合的方式可以有多种,比如,将加权后历史兴趣度和加权后预测兴趣度进行融合,得到融合后兴趣度,对融合后兴趣度进行归一化处理,得到历史对象标签的目标历史兴趣度和预测对象标签的目标预测兴趣度,具体可以公式(3)所示:
[0115]
score
fusion,u,t
=f
norm
(score
his,u,t
+score
pre,u,t
)
ꢀꢀ
(3)
[0116]
其中,score
fusion,u,t
为历史对象标签的目标历史兴趣度和预测对象标签的目标预测兴趣度,f
norm
为归一化处理的参数,score
his,u,t
为历史对象标签的加权后历史兴趣度,score
pre,u,t
为预测对象标签的加权后预测兴趣度。
[0117]
基于目标历史兴趣度和目标预测兴趣度,在历史对象标签和预测对象标签中筛选出目标对象的对象标签的方式可以有多种,比如,可以在历史对象标签和预测对象标签中筛选出兴趣度值最大的对象标签作为目标对象的对象标签,或者,还可以基于对目标历史兴趣度和目标预测兴趣度,对历史对象标签和预测对象标签进行排序,基于排序结果,在历史对象标签和预测对象标签中筛选出目标对象的对象标签。
[0118]
其中,在本方案中对目标对象的对象标签生成流程可以如图7所示,主要包括三个部分,第一部分是基于知识图谱的历史对象标签挖掘,如图中71所示,第二部分是基于对象标签预测模型的潜在对象标签的预测,如图中72所示,第三部分是多元对象标签(历史对象标签和预测对象标签)融合。在历史对象标签挖掘过程中,主要基于目标对象的历史操作信息解析出针对预设内容知识图谱对应的目标内容的目标历史操作信息,然后,通过历史对象标签挖掘策略进行挖掘。在潜在对象标签(预测对象标签)的预测过程中主要通过三个模型预测出预测对象标签,主要包括内容特征生成模型生成目标内容的内容特征,对象特征生成模型将内容特征转换为目标对象的对象特征,对象标签预测模型基于预设知识图谱和对象特征生成目标对象的候选对象标签的对象标签特征,然后,通过预测对象标签计算策略预测出预测对象标签。最后,将预测对象标签和历史对象标签进行融合,从而确定出目标对象的对象标签。
[0119]
其中,在此需要说明的是,本方案引入知识图谱生成目标对象的对象标签的主要作用可以为,第一借助其实体间关联关系,学习对象的深层兴趣信息,同时能够学习各相似对象关系的信息,改善用户冷启等问题;第二,知识图谱中的标签图谱是经过语义切分、对齐和改写等处理的,因此在语义上更加统一,因此通过知识图谱学习到的标签兴趣画像,改善了以往兴趣标签语义不齐的问题;第三,知识图谱的实体图谱具备自生产系列、ip等抽象实体的能力,更加丰富了对象兴趣画像的对象标签集。
[0120]
其中,采用本方案针对某个线上对象计算的top 10的融合对象标签,具体可以如表1所示。
[0121]
表1
[0122][0123][0124]
其中,hs为基于历史操作信息挖掘出的对象标签,pr为预测对象标签预测出的对象标签。
[0125]
另外,对本方案的对象标签生成过程采用百分制的dcg(衡量搜索引擎质量指标)评估,线上采用历史操作信息挖掘历史对象标签的结果时p20=55分,而采用本方案生成的对象标签的结果时p20=63分,对比线上挖掘的排序结果,相对提升14.5%。
[0126]
由以上可知,本技术实施例在获取至少一个目标对象在预设时间段的历史操作信息后,在历史操作信息中筛选出针对预设内容知识图谱对应的目标内容的目标历史操作信息,然后,基于目标历史操作信息和预设内容知识图谱,统计出目标对象的历史对象标签,然后,根据目标内容和目标历史操作信息,在预设内容知识图谱对应的对象标签集合中确定出所述目标对象的至少一个预测对象标签,将历史对象标签和预测对象标签进行融合,得到目标对象的对象标签;由于该方案在挖掘目标对象的历史操作信息的前提下,还借助了预设内容知识图谱的关联信息,可以改善对象标签的语义不齐等问题,而且在挖掘出历史对象标签的同时还可以预测对象的潜在对象标签,因此,可以提升对象标签生成的准确性。
[0127]
根据上面实施例所描述的方法,以下将举例作进一步详细说明。
[0128]
在本实施例中,该方法由电子设备执行,以该电子设备为服务器,目标内容为目标
视频,历史操作信息为历史观看信息为例进行说明。
[0129]
如图8所示,一种对象标签生成方法,具体流程如下:
[0130]
201、服务器获取至少一个目标对象在预设时间段的历史观看信息。
[0131]
例如,服务器可以获取至少一个目标对象的历史操作日志,在该历史操作日志中读取出预设时间段的操作信息,从而得到目标对象的历史观看信息,或者,还可以获取至少一个目标对象的历史操作日志,在历史操作日志中筛选出预设时间段的目标历史操作日志,在目标历史操作日志中读取出目标对象针对视频的操作信息,得到目标对象的历史观看信息。
[0132]
202、服务器在历史观看信息中筛选出针对预设知识图谱对应的目标视频的目标历史观看信息。
[0133]
例如,服务器在预设视频知识图谱中提取出至少一个视频标识,并在历史观看信息中识别出视频标识对应的目标视频,在历史观看信息中筛选并出目标视频对应的初始历史观看信息。在初始历史观看信息中识别出针对目标视频的操作时长,获取目标视频的视频时长,并计算操作时长和视频时长的时长比值,在初始历史观看信息中删除时长比值未超过0.5的目标视频的操作信息,得到目标视频对应的目标历史观看信息。
[0134]
203、服务器基于目标历史观看信息和预设视频知识图谱,统计出目标对象的历史对象标签。
[0135]
例如,服务器在预设视频知识图谱中提取出图谱关系,并在目标历史观看信息中识别出目标对象对目标视频进行操作的操作信息,统计该操作信息的次数,从而就可以得到目标对象对该目标视频的操作频次。在图谱关系中识别出每一目标视频对应的候选历史对象标签,基于操作频次,对候选历史对象标签进行排序,根据候选历史对象标签的排序信息,在候选历史对象标签中筛选出目标对象的历史对象标签,对历史对象标签的排序信息进行特征提取,得到目标对象关于历史对象标签的兴趣特征,基于该兴趣特征,确定历史对象标签的历史兴趣度。
[0136]
204、服务器对目标视频的文本信息进行特征提取,得到目标视频的视频特征。
[0137]
例如,服务器可以在目标视频中提取出文本信息,并识别文本信息的文本类型,基于文本类型,在文本信息中筛选出视频的视频标题和摘要信息,将视频标题和摘要信息作为目标文本信息。采用预训练语义特征提取模型对视频标题和摘要信息进行语义特征提取,得到语义特征,并将语义特征作为目标视频的视频特征,该视频特征的维度可以为768维。
[0138]
205、服务器基于目标历史观看信息,将视频特征转换为目标对象的对象特征。
[0139]
例如,服务器可以基于目标历史观看信息,在视频特征中筛选出预设时间区间内目标对象进行操作的至少一个目标视频的视频特征,得到基础视频特征。采用训练后对象特征生成模型对基础视频特征进行池化处理,此时输出与基础视频特征的特征维度相同的池化后基础视频特征,并在池化后基础视频特征中筛选出特征值最大的基础视频特征作为目标对象对应的初始池化后视频特征,对初始池化后视频特征通过训练后对象特征生成模型的激活层(relu层)进行激活处理,然后,对激活处理后的初始池化后视频特征进行压缩,压缩至128维,从而得到目标池化后视频特征。对目标池化后视频特征进行非线性转换,得到目标对象的对象特征。
[0140]
可选的,在采用训练后对象特征生成模型对基础视频特征进行最大池化处理之前,还可以对预设对象特征生成模型进行训练,从而得到训练后对象特征生成模型,训练的过程可以有多种,比如,服务器通过对目标对象在一段时间观看过的目标视频的样本视频特征转换为目标对象的样本对象特征,然后,对待分类的视频样本的分类样本视频特征同样进行特征转换,将特征转换后的特征为待分类视频样本的待分类样本视频特征,通过分类网络(softmax)计算目标对象是否对待分类视频是否感兴趣观看的分类计算,从而得到预测分类结果,将预测分类结果和标注分类结果进行对比,从而得到目标对象的损失信息,基于该损失信息,对对象特征生成模型进行收敛,得到训练后对象特征生成模型。
[0141]
206、服务器在预设视频知识图谱对应的对象标签集合中筛选出对象特征对应的至少一个对象标签,得到目标对象的预测对象标签。
[0142]
例如,服务器可以获取预设视频知识图谱对应的对象标签集合,并在预设视频知识图谱中提取出三元组信息,采用训练后对象标签预测模型在对象标签集合中筛选出对象特征对应的至少一个候选对象标签,并对候选对象标签进行特征提取,得到候选对象标签的基础对象标签特征,采用训练后对象标签预测模型对三元组信息进行特征提取,得到基础实体特征和实体关系特征,并将基础实体特征和实体关系特征进行融合,得到实体特征,将实体特征和基础对象标签特征进行融合,得到候选对象标签的对象标签特征。
[0143]
服务器计算对象特征和对象特征标签之间的特征相似度,并将特征相似度作为目标对象对对象标签特征对应的对象标签的预测兴趣度,基于预测兴趣度,对候选对象标签进行排序,根据候选对象标签的排序信息,在候选对象标签中筛选出目标对象的预测对象标签。
[0144]
可选的,服务器在采用训练后对象标签预测模型在对象标签集合中筛选出对象特征对应的至少一个候选对象标签之前,还可以对预设对象标签训练模型进行训练,得到训练后对象标签预测模型,训练的过程可以有多种,比如,获取目标对象对应的目标对象标签样本,并基于目标对象标签样本在对象标签集合中随机负采样出对象标签负样本,得到对象标签样本集合,在预设视频知识图谱中提取出三元组信息样本,在三元组信息样本中提取出每一三元组信息中的首节点、尾节点和关系节点,在尾节点中随机筛选出与首节点不相连的尾节点作为目标尾节点,将首节点关系节点和目标尾节点作为三元组信息负样本,将三元组信息样本和三元组信息负样本作为三元组信息样本集合。
[0145]
服务器基于对象标签样本集合,确定目标对象的对象标签损失信息,根据三元组信息样本集合,确定目标对象的三元组损失信息,基于对象标签损失信息和三元组损失信息,对预设对象标签预测模型的网络参数进行更新,并对更新后网络参数进行正则化处理,得到训练后对象标签预测模型。
[0146]
207、服务器将历史对象标签和预测对象标签进行融合,得到目标对象的对象标签。
[0147]
例如,服务器可以获取每一对象标签类型对应的加权系数,在历史对象标签中筛选出历史兴趣度最大的历史对象标签,从而得到目标历史对象标签。获取预设基础操作参数,将预设基础操作参数与目标操作频次进行融合,从而得到历史对象标签的操作参数。将操作参数与目标历史对象标签的历史兴趣度进行融合,得到融合后历史兴趣度。将加权系数与融合后历史兴趣度相乘,从而得到历史对象标签的加权后历史兴趣度,具体可以参见
公式(1)。
[0148]
服务器在加权系数中筛选出预测对象标签对应的目标加权系数,基于该目标加权系数对预测兴趣度进行加权,从而得到预测对象标签的加权后预测兴趣度,具体可以如公式(2)所示。
[0149]
服务器将加权后历史兴趣度和加权后预测兴趣度进行融合,得到融合后兴趣度,对融合后兴趣度进行归一化处理,得到历史对象标签的目标历史兴趣度和预测对象标签的目标预测兴趣度,具体可以公式(3)所示。在历史对象标签和预测对象标签中筛选出兴趣度值最大的对象标签作为目标对象的对象标签,或者,还可以基于对目标历史兴趣度和目标预测兴趣度,对历史对象标签和预测对象标签进行排序,基于排序结果,在历史对象标签和预测对象标签中筛选出目标对象的对象标签。
[0150]
由以上可知,本实施例服务器在获取至少一个目标对象在预设时间段的历史观看信息后,在历史观看信息中筛选出针对预设视频知识图谱对应的目标视频的目标历史观看信息,然后,基于目标历史观看信息和预设视频知识图谱,统计出目标对象的历史对象标签,然后,根据目标视频和目标历史观看信息,在预设视频知识图谱对应的对象标签集合中确定出所述目标对象的至少一个预测对象标签,将历史对象标签和预测对象标签进行融合,得到目标对象的对象标签;由于该方案在挖掘目标对象的历史观看信息的前提下,还借助了预设视频知识图谱的关联信息,可以改善对象标签的语义不齐等问题,而且在挖掘出历史对象标签的同时还可以预测对象的潜在对象标签,因此,可以提升对象标签生成的准确性。
[0151]
为了更好地实施以上方法,本发明实施例还提供一种对象标签生成装置。
[0152]
例如,如图9所示,该对象标签生成装置可以包括获取单元301、筛选单元302、统计单元303、确定单元304和融合单元305,如下:
[0153]
(1)获取单元301;
[0154]
获取单元301,用于获取至少一个目标对象在预设时间段的历史操作信息。
[0155]
例如,获取单元301,具体可以用于获取至少一个目标对象的历史操作日志,在该历史操作日志中读取出预设时间段的操作信息,从而得到目标对象的历史操作信息,或者,还可以获取至少一个目标对象的历史操作日志,在历史操作日志中筛选出预设时间段的目标历史操作日志,在目标历史操作日志中读取出目标对象针对内容的操作信息,得到目标对象的历史操作信息。
[0156]
(2)筛选单元302;
[0157]
筛选单元302,用于在历史操作信息中筛选出针对预设内容知识图谱对应的目标内容的目标历史操作信息。
[0158]
例如,筛选单元302,具体可以用于在预设内容知识图谱中提取出至少一个内容标识,并在历史操作信息中识别出内容标识对应的目标内容,在历史操作信息中筛选并出目标内容对应的初始历史操作信息,对初始历史操作信息进行清洗,得到目标内容对应的目标历史操作信息。
[0159]
(3)统计单元303;
[0160]
统计单元303,用于基于目标历史操作信息和预设内容知识图谱,统计出目标对象的历史对象标签。
[0161]
例如,统计单元303,具体可以用于在预设内容知识图谱中提取出图谱关系,在目标历史操作信息中统计出目标对象对每一目标内容的操作频次,基于操作频次和图谱关系,确定目标对象的历史对象标签。
[0162]
(4)确定单元304;
[0163]
确定单元304,用于根据目标内容和目标历史操作信息,在预设内容知识图谱对应的对象标签集合中确定出目标对象的至少一个预测对象标签。
[0164]
例如,确定单元304,具体可以用于对目标内容的文本信息进行特征提取,得到目标内容的内容特征,基于目标历史操作信息,将内容特征转换为目标对象的对象特征,在预设内容知识图谱对应的对象标签集合中筛选出对象特征对应的至少一个对象标签,得到目标对象的预测对象标签。
[0165]
(5)融合单元305;
[0166]
融合单元305,用于将历史对象标签和预测对象标签进行融合,得到目标对象的对象标签。
[0167]
例如,融合单元305,具体可以用于获取每一对象标签类型对应的加权系数,并基于加权系数和操作频次,对历史兴趣度进行加权,得到历史对象标签的加权后历史兴趣度,根据加权系数,对预测兴趣度进行加权,得到加权后预测兴趣度,将加权后历史兴趣度和加权后预测兴趣度进行融合,以得到目标对象的对象标签。
[0168]
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
[0169]
由以上可知,本实施例在获取单元301获取至少一个目标对象在预设时间段的历史操作信息后,筛选单元302在历史操作信息中筛选出针对预设内容知识图谱对应的目标内容的目标历史操作信息,然后,统计单元303基于目标历史操作信息和预设内容知识图谱,统计出目标对象的历史对象标签,然后,确定单元304根据目标内容和目标历史操作信息,在预设内容知识图谱对应的对象标签集合中确定出所述目标对象的至少一个预测对象标签,融合单元305将历史对象标签和预测对象标签进行融合,得到目标对象的对象标签;由于该方案在挖掘目标对象的历史操作信息的前提下,还借助了预设内容知识图谱的关联信息,可以改善对象标签的语义不齐等问题,而且在挖掘出历史对象标签的同时还可以预测对象的潜在对象标签,因此,可以提升对象标签生成的准确性。
[0170]
本发明实施例还提供一种电子设备,如图10所示,其示出了本发明实施例所涉及的电子设备的结构示意图,具体来讲:
[0171]
该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图10中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
[0172]
处理器401是该电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行电子设备的各种功能和处理数据。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器
主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
[0173]
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
[0174]
电子设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
[0175]
该电子设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
[0176]
尽管未示出,电子设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,电子设备中的处理器401会按照如下的计算机程序,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
[0177]
获取至少一个目标对象在预设时间段的历史操作信息,在历史操作信息中筛选出针对预设知识图谱对应的目标内容的目标历史操作信息,基于目标历史操作信息和预设知识图谱,统计出目标对象的历史对象标签,根据目标内容和目标历史操作信息,在预设知识图谱对应的对象标签集合中确定出目标对象的至少一个预测对象标签,将历史对象标签和预测对象标签进行融合,得到目标对象的对象标签。
[0178]
例如,电子设备可以获取至少一个目标对象的历史操作日志,在该历史操作日志中读取出预设时间段的操作信息,从而得到目标对象的历史操作信息,或者,还可以获取至少一个目标对象的历史操作日志,在历史操作日志中筛选出预设时间段的目标历史操作日志,在目标历史操作日志中读取出目标对象针对内容的操作信息,得到目标对象的历史操作信息。在预设内容知识图谱中提取出至少一个内容标识,并在历史操作信息中识别出内容标识对应的目标内容,在历史操作信息中筛选并出目标内容对应的初始历史操作信息,对初始历史操作信息进行清洗,得到目标内容对应的目标历史操作信息。在预设内容知识图谱中提取出图谱关系,在目标历史操作信息中统计出目标对象对每一目标内容的操作频次,基于操作频次和图谱关系,确定目标对象的历史对象标签。对目标内容的文本信息进行特征提取,得到目标内容的内容特征,基于目标历史操作信息,将内容特征转换为目标对象的对象特征,在预设内容知识图谱对应的对象标签集合中筛选出对象特征对应的至少一个对象标签,得到目标对象的预测对象标签。获取每一对象标签类型对应的加权系数,并基于加权系数和操作频次,对历史兴趣度进行加权,得到历史对象标签的加权后历史兴趣度,根据加权系数,对预测兴趣度进行加权,得到加权后预测兴趣度,将加权后历史兴趣度和加权
后预测兴趣度进行融合,以得到目标对象的对象标签。
[0179]
以上各个操作的具体实施可参见前面的实施例,在此不作赘述。
[0180]
由以上可知,本发明实施例在获取至少一个目标对象在预设时间段的历史操作信息后,在历史操作信息中筛选出针对预设内容知识图谱对应的目标内容的目标历史操作信息,然后,基于目标历史操作信息和预设内容知识图谱,统计出目标对象的历史对象标签,然后,根据目标内容和目标历史操作信息,在预设内容知识图谱对应的对象标签集合中确定出所述目标对象的至少一个预测对象标签,将历史对象标签和预测对象标签进行融合,得到目标对象的对象标签;由于该方案在挖掘目标对象的历史操作信息的前提下,还借助了预设内容知识图谱的关联信息,可以改善对象标签的语义不齐等问题,而且在挖掘出历史对象标签的同时还可以预测对象的潜在对象标签,因此,可以提升对象标签生成的准确性。
[0181]
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过计算机程序来完成,或通过计算机程序控制相关的硬件来完成,该计算机程序可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
[0182]
为此,本发明实施例提供一种计算机可读存储介质,其中存储有计算机程序,该计算机程序能够被处理器进行加载,以执行本发明实施例所提供的任一种对象标签生成方法中的步骤。例如,该计算机程序可以执行如下步骤:
[0183]
获取至少一个目标对象在预设时间段的历史操作信息,在历史操作信息中筛选出针对预设知识图谱对应的目标内容的目标历史操作信息,基于目标历史操作信息和预设知识图谱,统计出目标对象的历史对象标签,根据目标内容和目标历史操作信息,在预设知识图谱对应的对象标签集合中确定出目标对象的至少一个预测对象标签,将历史对象标签和预测对象标签进行融合,得到目标对象的对象标签。
[0184]
例如,获取至少一个目标对象的历史操作日志,在该历史操作日志中读取出预设时间段的操作信息,从而得到目标对象的历史操作信息,或者,还可以获取至少一个目标对象的历史操作日志,在历史操作日志中筛选出预设时间段的目标历史操作日志,在目标历史操作日志中读取出目标对象针对内容的操作信息,得到目标对象的历史操作信息。在预设内容知识图谱中提取出至少一个内容标识,并在历史操作信息中识别出内容标识对应的目标内容,在历史操作信息中筛选并出目标内容对应的初始历史操作信息,对初始历史操作信息进行清洗,得到目标内容对应的目标历史操作信息。在预设内容知识图谱中提取出图谱关系,在目标历史操作信息中统计出目标对象对每一目标内容的操作频次,基于操作频次和图谱关系,确定目标对象的历史对象标签。对目标内容的文本信息进行特征提取,得到目标内容的内容特征,基于目标历史操作信息,将内容特征转换为目标对象的对象特征,在预设内容知识图谱对应的对象标签集合中筛选出对象特征对应的至少一个对象标签,得到目标对象的预测对象标签。获取每一对象标签类型对应的加权系数,并基于加权系数和操作频次,对历史兴趣度进行加权,得到历史对象标签的加权后历史兴趣度,根据加权系数,对预测兴趣度进行加权,得到加权后预测兴趣度,将加权后历史兴趣度和加权后预测兴趣度进行融合,以得到目标对象的对象标签。
[0185]
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
[0186]
其中,该计算机可读存储介质可以包括:只读存储器(rom,read only memory)、随
机存取记忆体(ram,random access memory)、磁盘或光盘等。
[0187]
由于该计算机可读存储介质中所存储的计算机程序,可以执行本发明实施例所提供的任一种对象标签生成方法中的步骤,因此,可以实现本发明实施例所提供的任一种对象标签生成方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
[0188]
其中,根据本技术的一个方面,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机程序,处理器执行该计算机程序,使得该计算机设备执行上述对象标签生成方面或者对象标签确定方面的各种可选实现方式中提供的方法。
[0189]
以上对本发明实施例所提供的一种对象标签标签生成方法、装置和计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
技术特征:
1.一种对象标签生成方法,其特征在于,包括:获取至少一个目标对象在预设时间段的历史操作信息;在所述历史操作信息中筛选出针对预设内容知识图谱对应的目标内容的目标历史操作信息;基于所述目标历史操作信息和预设内容知识图谱,统计出所述目标对象的历史对象标签;根据所述目标内容和目标历史操作信息,在所述预设内容知识图谱对应的对象标签集合中确定出所述目标对象的至少一个预测对象标签;将所述历史对象标签和预测对象标签进行融合,得到所述目标对象的对象标签。2.根据权利要求1所述的对象标签生成方法,其特征在于,所述根据所述目标内容和目标历史操作信息,在所述预设内容知识图谱对应的对象标签集合中确定出所述目标对象的至少一个预测对象标签,包括:对所述目标内容的文本信息进行特征提取,得到所述目标内容的内容特征;基于所述目标历史操作信息,将所述内容特征转换为所述目标对象的对象特征;在所述预设内容知识图谱对应的对象标签集合中筛选出所述对象特征对应的至少一个对象标签,得到所述目标对象的预测对象标签。3.根据权利要求2所述的对象标签生成方法,其特征在于,所述基于所述目标历史操作信息,将所述内容特征转换为所述目标对象的对象特征,包括:基于所述目标历史操作信息,在所述内容特征中筛选出预设时间区间内所述目标对象进行操作的至少一个目标内容的内容特征,得到基础内容特征;采用训练后对象特征生成模型对所述基础内容特征进行最大池化处理,以得到目标池化后内容特征;对所述目标池化后内容特征进行非线性转换,得到所述目标对象的对象特征。4.根据权利要求3所述的对象标签生成方法,其特征在于,所述采用训练后对象特征生成模型对所述基础内容特征进行最大池化处理,以得到目标池化后内容特征之前,还包括:获取所述目标对象操作过的历史内容样本集合对应的样本内容特征集合,所述样本内容特征集合包括至少一个标注分类结果的样本内容特征;在所述样本内容特征集合中确定出至少一个目标样本内容特征,并将所述样本内容特征集合中除所述目标样本内容特征以外的样本内容特征作为待分类样本内容的待分类样本内容特征;基于所述标注分类结果、目标样本内容特征和待分类样本内容特征,对预设对象特征生成模型进行收敛,得到训练后对象特征生成模型。5.根据权利要求4所述的对象标签生成方法,其特征在于,所述基于所述标注分类结果、目标样本内容特征和待分类样本内容特征,对预设对象特征生成模型进行收敛,得到训练后对象特征生成模型,包括:采用所述预设对象特征生成模型对所述目标样本内容特征进行特征转换,得到所述目标对象的样本对象特征;采用所述预设对象特征生成模型对所述待分类样本内容特征进行特征转换,得到所述待分类内容的分类样本内容特征;
基于所述样本对象特征和分类样本内容特征,预测所述目标对象针对所述待分类内容的分类结果,得到预测分类结果;根据所述预测分类结果和标注分类结果,对预设对象特征生成模型进行收敛,得到训练后对象特征生成模型。6.根据权利要求2所述的对象标签生成方法,其特征在于,所述在所述预设内容知识图谱对应的对象标签集合中筛选出所述对象特征对应的至少一个对象标签,得到所述目标对象的预测对象标签,包括:获取所述预设内容知识图谱对应的对象标签集合,并在所述预设内容知识图谱中提取出三元组信息;根据所述三元组信息,采用训练后对象标签预测模型对所述对象标签集合中的对象标签进行特征提取,以得到所述对象特征对应的至少一个候选对象标签的对象标签特征;计算所述对象特征和对象标签特征之间的特征相似度,以得到所述目标对象的预测对象标签。7.根据权利要求6所述的对象标签生成方法,其特征在于,所述根据所述三元组信息,采用训练后对象标签预测模型对所述对象标签集合中对象标签进行特征提取,以得到所述对象特征对应的至少一个候选对象标签的对象标签特征,包括:采用训练后对象标签预测模型在所述对象标签集合中筛选出所述对象特征对应的至少一个候选对象标签,并对所述候选对象标签进行特征提取,得到所述候选对象标签的基础对象标签特征;采用所述训练后对象标签预测模型对所述三元组信息进行特征提取,得到基础实体特征和实体关系特征,并将基础实体特征和实体关系特征进行融合,得到实体特征;将所述实体特征和所述基础对象标签特征进行融合,得到所述候选对象标签的对象标签特征。8.根据权利要求7所述的对象标签生成方法,其特征在于,所述采用训练后对象标签预测模型在所述对象标签集合中筛选出所述对象特征对应的至少一个候选对象标签之前,还包括:获取目标对象对应的目标对象标签样本,并基于所述目标对象标签样本,在所述对象标签集合中随机负采样出对象标签负样本,得到对象标签样本集合;在预设内容知识图谱中提取出三元组信息样本,并基于该三元组信息样本构建三元组信息负样本,得到三元组信息样本集合;基于所述对象标签样本集合和三元组信息样本集合对预设对象标签预测模型进行收敛,得到训练后对象标签预测模型。9.根据权利要求8所述的对象标签生成方法,其特征在于,所述基于所述对象标签样本集合和三元组信息样本集合对预设对象标签预测模型进行收敛,得到训练后对象标签预测模型,包括:基于所述对象标签样本集合,确定所述目标对象的对象标签损失信息;根据所述三元组信息样本集合,确定所述目标对象的三元组损失信息;基于所述对象标签损失信息和三元组损失信息,对所述预设对象标签预测模型的网络参数进行更新,并对更新后网络参数进行正则化处理,得到所述训练后对象标签预测模型。
10.根据权利要求6所述的对象标签生成方法,其特征在于,所述计算所述对象特征和对象标签特征之间的特征相似度,以得到所述目标对象的预测对象标签,包括:计算所述对象特征和对象标签特征之间的特征相似度,并将所述特征相似度作为所述目标对象对所述对象标签特征对应的对象标签的预测兴趣度;基于所述预测兴趣度,对所述候选对象标签进行排序;根据所述候选对象标签的排序信息,在所述候选对象标签中筛选出所述目标对象的预测对象标签。11.根据权利要求1至10任一项所述的对象标签生成方法,其特征在于,所述基于所述目标历史操作信息和预设内容知识图谱,统计出所述目标对象的历史对象标签,包括:在所述预设内容知识图谱提取出图谱关系,所述图谱关系用于指示所述目标内容与候选历史对象标签之间的关系;在所述目标历史操作信息中统计出所述目标对象针对每一所述目标内容的操作频次;基于所述操作频次和图谱关系,确定所述目标对象的历史对象标签。12.根据权利要求11所述的对象标签生成方法,其特征在于,所述基于所述操作频次和图谱关系,确定所述目标对象的历史对象标签,包括:在所述图谱关系中识别出每一所述目标内容对应的候选历史对象标签;基于所述操作频次,对所述候选历史对象标签进行排序;根据所述候选历史对象标签的排序信息,在所述候选历史对象标签中筛选出所述目标对象的历史对象标签,并确定每一历史对象标签的历史兴趣度。13.根据权利要求12所述的对象标签生成方法,其特征在于,所述将所述历史对象标签和预测对象标签进行融合,得到所述目标对象的对象标签,包括:获取每一对象标签类型对应的加权系数,并基于所述加权系数和操作频次,对所述历史兴趣度进行加权,得到所述历史对象标签的加权后历史兴趣度;根据所述加权系数,对所述预测兴趣度进行加权,得到加权后预测兴趣度;将所述加权后历史兴趣度和加权后预测兴趣度进行融合,以得到所述目标对象的对象标签。14.根据权利要求13所述的对象标签生成方法,其特征在于,所述将所述加权后历史兴趣度和加权后预测兴趣度进行融合,以得到所述目标对象的对象标签,包括:将所述加权后历史兴趣度和加权后预测兴趣度进行融合,得到融合后兴趣度;对所述融合后兴趣度进行归一化处理,得到所述历史对象标签的目标历史兴趣度和所述预测对象标签的目标预测兴趣度;基于所述目标历史兴趣度和目标预测兴趣度,在所述历史对象标签和预测对象标签中筛选出所述目标对象的对象标签。15.根据权利要求13所述的对象标签生成方法,其特征在于,所述基于所述加权系数和操作频次,对所述历史兴趣度进行加权,得到所述历史对象标签的加权后历史兴趣度,包括:根据所述历史兴趣度,在所述历史对象标签中筛选出目标历史对象标签;在所述操作频次中筛选出所述目标历史对象标签对应的目标操作频次,并基于所述目标操作频次,确定所述目标历史对象的操作参数;
将所述操作参数与所述目标历史对象标签的历史兴趣度进行融合,得到融合后历史兴趣度,并基于所述加权系数,对所述融合后历史兴趣度进行加权,得到所述历史对象标签的加权后历史兴趣度。16.根据权利要求1至10任一项所述的对象标签生成方法,其特征在于,所述在所述历史操作信息中筛选出针对预设内容知识图谱对应的目标内容的目标历史操作信息,包括:在所述预设内容知识图谱中提取出至少一个内容标识,并在所述历史操作信息中识别出所述内容标识对应的目标内容;在所述历史操作信息中筛选出所述目标内容对应的初始历史操作信息;对所述初始历史操作信息进行清洗,得到所述目标内容对应的目标历史操作信息。17.一种对象标签生成装置,其特征在于,包括:获取单元,用于获取至少一个目标对象在预设时间段的历史操作信息;筛选单元,用于在所述历史操作信息中筛选出针对预设内容知识图谱对应的目标内容的目标历史操作信息;统计单元,用于基于所述目标历史操作信息和预设内容知识图谱,统计出所述目标对象的历史对象标签;确定单元,用于根据所述目标内容和目标历史操作信息,在所述预设内容知识图谱对应的对象标签集合中确定出所述目标对象的至少一个预测对象标签;融合单元,用于将所述历史对象标签和预测对象标签进行融合,得到所述目标对象的对象标签。18.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有应用程序,所述处理器用于运行所述存储器内的应用程序,以执行权利要求1至16任一项所述的对象标签生成方法中的步骤。19.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至16任一项所述对象标签生成方法中的步骤。20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行权利要求1至16任一项所述的对象标签生成方法中的步骤。
技术总结
本发明实施例公开了一种对象标签生成方法、装置和计算机可读存储介质;本发明实施例在获取至少一个目标对象在预设时间段的历史操作信息后,在历史操作信息中筛选出针对预设内容知识图谱对应的目标内容的目标历史操作信息,然后,基于目标历史操作信息和预设内容知识图谱,统计出目标对象的历史对象标签,然后,根据目标内容和目标历史操作信息,在预设内容知识图谱对应的对象标签集合中确定出所述目标对象的至少一个预测对象标签,将历史对象标签和预测对象标签进行融合,得到目标对象的对象标签;该方案可以提升对象标签生成的准确性,本发明实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。辅助驾驶等各种场景。辅助驾驶等各种场景。
技术研发人员:朱少杰
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2022.02.11
技术公布日:2023/8/24
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:带光电校准开关的钣金加工装置 下一篇:一种卤代有机物的高灵敏高通量扫描分析方法