目标对象匹配方法、装置及计算机设备与流程
未命名
07-27
阅读:62
评论:0

1.本技术涉及计算机技术领域,特别是涉及一种目标对象匹配方法、装置及计算机设备。
背景技术:
2.随着计算机技术与网络技术的发展,内容生产的门槛降低,各种内容的发布量以指数级的速度增长。而在目前在不同的内容发布平台上,有着众多的内容发布作者,有些作者是将作品同时发布到了不同的平台,而有些作者则是单纯的搬运其他人的作品,因此在内容发布平台上有必要帮助排查搬运作者,为平台和用户创造更加优秀的环境。通过机器学习技术,将不同平台的内容发布作者作为目标对象来进行目标对象的相似度匹配是一种有效识别出搬运作者的方法。
3.目前,在进行目标对象匹配时,一般可以收集目标对象的所公开的头像,昵称以及简历数据特征等固有的特征数据构建固有特征向量,再融合目标对象的内容数据,如用户的历史发布内容信息等来构建目标对象对应的内容特征向量。最后合并两个特征向量来进行不同目标对象之间的相似度匹配。然而这种方法在进行内容特征向量融合时,无法保证内容特征向量的有效性,从而影响了目标对象匹配过程中的匹配准确率。
技术实现要素:
4.基于此,有必要针对上述技术问题,提供一种能够提高目标对象匹配准确率的目标对象匹配方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
5.第一方面,本技术提供了一种目标对象匹配方法。所述方法包括:
6.获取目标对象匹配请求;
7.根据所述目标对象匹配请求,查找所述目标对象对应的第一内容数据;
8.提取所述第一内容数据对应的内容特征向量;
9.将所述内容特征向量进行多维聚合处理,获取内容聚合特征向量;
10.基于所述内容聚合特征向量在预设对象数据库中查找所述目标对象对应的匹配对象。
11.第二方面,本技术还提供了一种目标对象匹配装置。所述装置包括:
12.请求获取模块,用于获取目标对象匹配请求;
13.内容查找模块,用于根据所述目标对象匹配请求,查找所述目标对象对应的第一内容数据;
14.特征提取模块,用于提取所述内容数据对应的特征向量;
15.特征聚合模块,用于将所述内容特征向量进行多维聚合处理,获取内容聚合特征向量;
16.对象匹配模块,用于基于所述内容聚合特征向量在预设对象数据库中查找所述目标对象对应的匹配对象。
17.第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
18.获取目标对象匹配请求;
19.根据所述目标对象匹配请求,查找所述目标对象对应的第一内容数据;
20.提取所述第一内容数据对应的内容特征向量;
21.将所述内容特征向量进行多维聚合处理,获取内容聚合特征向量;
22.基于所述内容聚合特征向量在预设对象数据库中查找所述目标对象对应的匹配对象。
23.第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
24.获取目标对象匹配请求;
25.根据所述目标对象匹配请求,查找所述目标对象对应的第一内容数据;
26.提取所述第一内容数据对应的内容特征向量;
27.将所述内容特征向量进行多维聚合处理,获取内容聚合特征向量;
28.基于所述内容聚合特征向量在预设对象数据库中查找所述目标对象对应的匹配对象。
29.第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
30.获取目标对象匹配请求;
31.根据所述目标对象匹配请求,查找所述目标对象对应的第一内容数据;
32.提取所述第一内容数据对应的内容特征向量;
33.将所述内容特征向量进行多维聚合处理,获取内容聚合特征向量;
34.基于所述内容聚合特征向量在预设对象数据库中查找所述目标对象对应的匹配对象。
35.上述目标对象匹配方法、装置、计算机设备、存储介质和计算机程序产品,其中方法通过在获取目标对象匹配请求后;根据目标对象匹配请求,查找目标对象对应的第一内容数据;提取第一内容数据对应的内容特征向量;将内容特征向量进行多维聚合处理,获取内容聚合特征向量;基于内容聚合特征向量在预设对象数据库中查找目标对象对应的匹配对象。本技术在进行目标对象的匹配时,在提取内容数据对应的特征向量后,通过聚类的思想,将内容特征向量进行多维聚合处理,获取内容聚合特征向量,这样可以在保证准确率的前提下,完成降维了工作,减少网络的参数量,从而可以融合更多的特征向量,提高目标对象匹配过程中的匹配准确率。
附图说明
36.图1为一个实施例中目标对象匹配方法的应用环境示意图;
37.图2为一个实施例中目标对象匹配方法的流程示意图;
38.图3为一个实施例中将特征向量进行聚合处理步骤的流程示意图;
39.图4为一个实施例中内容聚合特征向量的获取过程示意图;
40.图5为一个实施例中基于预设视频帧融合模型进行特征聚合处理步骤的流程示意
图;
41.图6为一个实施例中分支路聚合处理步骤的流程示意图;
42.图7为一个实施例中获取特征向量对应的初始聚合特征向量步骤的流程示意图;
43.图8为一个实施例中获取预设视频帧融合模型步骤的流程示意图;
44.图9为一个实施例中基于三元组损失函数来进行模型训练的完整流程的流程示意图;
45.图10为一个实施例中确定目标对象对应的匹配对象步骤的流程示意图;
46.图11为一个实施例中进行内容推荐步骤的流程示意图;
47.图12为一个实施例中目标对象匹配装置的结构框图;
48.图13为一个实施例中计算机设备的内部结构图。
具体实施方式
49.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
50.人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。本技术的技术方案主要涉及到了机器学习中的机器学习技术。
51.机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
52.本技术实施例提供的目标对象匹配方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。终端102可以向服务器104发送目标对象匹配请求,以通过服务器104来确定目标对象对应的匹配对象,服务器104获取目标对象匹配请求后;根据目标对象匹配请求,查找目标对象对应的第一内容数据;提取第一内容数据对应的内容特征向量;将内容特征向量进行多维聚合处理,获取内容聚合特征向量;基于内容聚合特征向量在预设对象数据库中查找目标对象对应的匹配对象。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、
平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能语音交互设备、智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本发明实施例可应用于云技术、驾驶等各种场景。
53.在本文中,需要理解的是,所涉及的术语:
54.模态:表示信息的来源或者形式。每一种信息的来源或者形式,都可以称为一种模态,例如,多媒体资源的信息有语音、图像、文字等多个模态。
55.特征:指数据或信息经过计算机模型处理后的高维度数值表示,也可称作特征向量。视频特征指视频数据经过计算机模型处理后的高维度数值表示,也可称作视频向量。由于特征是模型对视频的数值化输出,所以不同的模型对视频的偏好作用和输出特征也是不同的,例如,视觉模型用于提取视频的视觉信息,那么输出的就是视频的视觉特征;音频模型用于提取视频的声音信息,输出的则为音频特征;文本模型用于提取视频文字或标题信息内容,输出的是文本特征等。
56.多模态特征:多媒体资源的各个模态的特征表示共同组成了多媒体资源的数值表示,可以将多媒体资源的多个模态的特征称为多媒体资源的多模态特征。设多媒体资源为视频,则多模态特征包括音频模态特征、图像模态特征、文本模态特征,各个模态的特征表示共同组成了视频的数值表征,将视频的多个模态的特征表示称为视频多模态特征。
57.多模态特征融合:综合多媒体资源的各个模态的特征,实现各个模态特征之间的信息互补。
58.在一个实施例中,如图2所示,提供了一种目标对象匹配方法,以该方法应用于图1中的服务器104端为例进行说明,包括以下步骤:
59.步骤201,获取目标对象匹配请求。
60.其中,目标对象匹配请求是指本技术的目标对象匹配方法所处理目标对象,目标对象具体可以一个用户或者是一个平台账号,而匹配则是指在预设对象数据库内,查找能与目标对象相匹配的其他对象。目标对象匹配请求具体可以包括有目标对象的身份标识信息。在其中一个实施例中,本技术的目标对象匹配方法具体用于进行多平台下内容发文作者的匹配,此时可以将多平台中一个平台的发文作者作为目标对象,而对象数据库中则存放有多平台中其他作者的数据。因此可以通过根据目标对象在对象数据库中查找匹配对象。而此时,目标对象的身份标识信息还可以包括目标对象所属内容发布平台的信息。
61.具体地,当终端102方的工作人员需要进行目标对象的匹配时,可以通过向服务器104发送目标对象匹配请求,以在预设对象数据库查找目标对象对应的匹配对象。服务器104则会接收该目标对象匹配请求,从而开始目标对象的匹配查询进程。在其中一个实施例中,本技术的方案具体用于在多个内容发布平台中匹配相同的作者。在进行匹配时,目标对象匹配请求中可以指定需要匹配的目标对象的身份标识,而后服务器基于身份标识,确定目标对象,从而开始匹配对象的查找工作。
62.步骤203,根据目标对象匹配请求,查找目标对象对应的第一内容数据。
63.其中,内容数据是指基于目标对象的行为而提取出的与目标对象相关联的内容数据。如在其中一个实施例中,本技术的方案适用于在内容发布平台中,查找目标对象的匹配对象,此时,目标对象对应的第一内容数据具体可以是指目标对象在内容发布平台中发布
的内容,包括有视频内容以及图文内容等多模态的内容。
64.具体地,在得到目标对象匹配请求后,可以基于目标对象匹配请求来确定用于进行目标对象匹配的第一内容数据,而后基于第一内容数据来提取得到目标用户对应的特征,从而进行目标对象的匹配。其中一个实施例中,目标对象匹配请求具体用于进行多平台下内容发布作者的相似性匹配,查找到不同平台中的同一作者,从而进行创作作者与搬运作者的识别。在此时,目标对象匹配请求则具体可以包含了目标对象所处的内容发布平台以及目标对象的身份标识,服务器104则可以根据目标对象匹配请求,先连接目标对象所处的内容发布平台,而后基于身份标识在内容发布平台上进行查找,从而获取目标对象对应的最新发布内容,并将这些最新发布内容作为目标对象对应的第一内容数据。在其中一个实施例中,具体可以将目标对象最新发布的10篇内容作为目标对象对应的第一内容数据。
65.步骤205,提取第一内容数据对应的内容特征向量。
66.步骤207,将内容特征向量进行多维聚合处理,获取内容聚合特征向量。
67.其中,内容特征向量是指通过嵌入(embedding)处理所获取的特征向量。在特征提取时,可以将目标对象的内容数据进行嵌入处理,每一个内容数据都用一个特征向量来表示。而后综合多个特征向量,即可得到目标对象对应的特征向量。将内容特征向量进行多维聚合处理,获取内容聚合特征向量,具体可以是指通过视频帧融合来将多个内容特征向量进行多维聚合处理,获取内容聚合特征向量。视频帧融合即为视频帧融合算法,视频帧融合算法是把帧级别的特征降维成视频级别的特征,然后可以对视频级别的特征进行分类。在其中一个实施例中,视频帧融合算法具体可以是指nextvlad算法,它的提出是为了解决netvlad参数量过多而导致的模型不易训练和容易过拟合问题。而在另外的实施例中,视频帧融合算法还可以通过mobilenetvlad等轻量级的模型来实现。本技术中可以内容数据中的图文数据作为视频帧来进行视频帧融合算法的处理,而视频数据则可以通过抽帧得到视频帧,而后进行视频帧融合算法的处理,通过视频帧融合算法可以对内容数据对应的内容特征向量进行降维,从而将多个内容数据对应的特征向量聚合为一个内容聚合特征向量。
68.具体地,在得到目标对象对应的第一内容数据后,则可以根据目标对象对应的第一内容数据来进行进一步的特征提取操作。首先可以对内容数据进行嵌入处理,获取到内容数据对应的内容特征向量,而后将内容特征向量视为视频帧向量,并通过视频帧融合将内容特征向量进行聚合处理,将多个不同内容数据的内容特征向量进行聚合,得到一个内容聚合特征向量。在具体地实施例中,本技术的目标对象匹配具体用于多平台下内容发布作者的相似性匹配,查找到不同平台中的同一作者,从而进行创作作者与搬运作者的识别。申请人发现,在现有的技术中,一般会使用监督神经网络将最近发布内容的3篇进行嵌入处理,而后将这三个特征向量融合成一个特征向量,这种方法虽然应用到了作者发布的内容信息,但是由于方法的原因,没有将更多的历史发布内容信息充分进行充分利用,这种比较的结果也会差生很大的误解。因此,本技术中可以基于视频帧融合来将历史发布内容信息的内容特征向量进行聚合处理,可以有效地将作者多篇发布内容(如可以直接使用作者最新发布10篇内容)进行聚合,从而有效利用作者的历史发布内容信息。本技术使用了高效的神经网络结构对作者的历史发布内容进特征提取和特征聚合。为了使得模型提取特征信息时更加高效,在神经网络中加入了聚类的思想,这样可以在保证准确率的前提下,完成降维了工作,减少网络的参数量。
69.步骤209,基于内容聚合特征向量在预设对象数据库中查找目标对象对应的匹配对象。
70.其中,预设对象数据库基于所有已有的对象数据构建,在预设对象数据库中,保存有每个已有对象对应的内容聚合特征向量。匹配对象具体是指预设对象数据库与目标对象相似的其他对象。在其中一个实施例中,预设对象数据库中除了保存对象的内容聚合特征向量,还可以保存一些根据对象已公开的信息所确定的固有特征向量,如对于内容发布平台的作者,其公开的头像,昵称以及简历等数据都可以用与构建作者对应的固有特征向量。
71.具体地,在得到目标对象对应的内容聚合特征向量后,可以基于内容聚合特征向量在预设对象数据库中进行查找,确定与当前内容聚合特征向量相似的已有内容聚合特征向量。而后将这些相似的已有内容聚合特征向量对应的对象,作为目标对象对应的匹配对象,即这些对象可能是同一个对象,当本技术的目标对象匹配用于识别不同内容发布平台的相同内容发布作者时,则目标对象与匹配对象是同一作者的不同账号。在另一个实施例中,进行目标对象匹配时,除了考虑内容聚合特征向量之外,还可以考虑使用内容聚合特征向量结合目标对象的其他特征来进行目标对象的匹配。
72.上述目标对象匹配方法,通过在获取目标对象匹配请求后;根据目标对象匹配请求,查找目标对象对应的第一内容数据;提取第一内容数据对应的内容特征向量;将内容特征向量进行多维聚合处理,获取内容聚合特征向量;基于内容聚合特征向量在预设对象数据库中查找目标对象对应的匹配对象。本技术在进行目标对象的匹配时,在提取内容数据对应的特征向量后,通过聚类的思想,将内容特征向量进行多维聚合处理,获取内容聚合特征向量,这样可以在保证准确率的前提下,完成降维了工作,减少网络的参数量,从而可以融合更多的特征向量,提高目标对象匹配过程中的匹配准确率。
73.在其中一个实施例中,如图3所示,步骤207包括:
74.步骤302,将内容特征向量输入至预设视频帧融合模型,获取内容特征向量对应的初始聚合特征向量,预设视频帧融合模型基于视频帧融合算法、且结合三元组损失函数构建。
75.步骤304,基于注意力机制对初始聚合特征向量进行调整,获取内容聚合特征向量。
76.其中,内容特征向量具体是可以对内容数据进行多模态特征提取后得到的向量数据,多模态特征提取用于提取出内容数据中多模态特征数据,具体可以包括视频特征、图文特征在内的多种不同模态下特征。预设视频帧融合模型是指基于视频帧融合算法、且结合三元组损失函数构建的一个神经网络模型,用于进行内容特征向量的聚合。它具体可以基于初始的视频帧融合模型通过无监督训练获取。注意力机制可以使得神经网络具备专注于其输入(或特征)子集的能力:选择特定的输入。注意力可以应用于任何类型的输入而不管其形状如何。在计算能力有限情况下,注意力机制是解决信息超载问题的主要手段的一种资源分配方案,将计算资源分配给更重要的任务,本技术中主要通过注意力机制来提高模型的特征提取能力。三元组损失函数即triplet loss,triplet通过构造三元组数据(a,p,n),a表示anchor,是关注的样本;然后p表示positive sample,是跟anchor同类别的样本,n表示negative sample,是跟anchor不同类别的样本。而三元组损失函数希望anchor的特征向量跟positive接近,跟negative距离比较远。本技术正是利用这一思想动机,通过三元组
损失函数可以使得相近的对象的内容聚合特征向量距离差较小,不相似对象之间的内容聚合特征向量距离差更大,从而可以基于内容聚合特征向量来进行相似对象的识别。
77.具体地,在进行内容特征向量的聚合时,首先可以对内容数据的多模态数据进行多模态特征提取操作,得到每一个内容数据对应的内容特征向量。而后将得到的所有内容特征向量通过预设视频帧融合模型,从而将这些内容特征向量进行聚合,而后通过注意力机制,增强特征提取能力。同时,需要在视频帧融合模型融入了三元组损失函数的思想,更好的学习不同对象之间的相似性,保证内容聚合特征向量的有效性。由于三元组的优势在于细节区分,因此,当两个输入相似时,triplet loss能够更好地对细节进行建模,相当于加入了两个输入差异性差异的度量,学习到输入的更好表示。在其中一个实施例中,本技术的方案用于对多平台发布内容的作者进行相似度匹配。内容聚合特征向量的获取过程具体可以参照图4所示,首先,可以获取作者发布的近10个视频数据以及近10个图文数据。通过多模态特征提取,获取发布内容对应的内容特征向量,内容特征向量具体包括了视频特征向量和图文特征向量,然后将这些所有的特征向量通过视频帧融合模型(此处是nextvlad)聚合成一个内容聚合特征向量,在视频帧融合模型后引入se-gating注意力机制,来增强模型的特征提取能力。在视频帧融合模型融入了三元组损失函数,更好的学习不同内容发布作者之间的相似性,生产出的内容聚合特征向量也能有效地提供给下游任务使用。本实施例中,通过视频帧融合算法、且结合三元组损失函数以及注意力机制来进行特征的聚合,可以有效保证内容特征向量聚合过程的聚合效果,从而保证目标对象识别的准确率。
78.在其中一个实施例中,如图5所示,步骤302包括:
79.步骤502,将内容特征向量输入至预设视频帧融合模型,通过预设视频帧融合模型对内容特征向量进行升维处理,获取升维特征向量。
80.步骤504,基于预设分组数对升维特征向量进行分支路聚合处理,获取分支路聚合特征向量。
81.步骤506,对分支路聚合特征向量执行正则化处理操作。
82.步骤508,对正则化处理操作得到的分支路聚合特征向量进行降维处理,获取分支路聚合特征向量对应的初始聚合特征向量。
83.其中,全连接层即fc层,神经网络的全连接层的每一个结点都与上一层的所有结点相连,用来把前边提取到的特征向量综合起来。由于其全相连的特性,一般全连接层的参数也是最多的。升维则具体是指将特征向量的维数增加,如用向量x表示特征向量的话,其维数假如为n,先使用全连接层fc把输入向量x的n维升维到λn维。分支路聚合处理则是指视频帧融合模型的一个处理过程,通过在全连接层的分支路聚合可以有效地将输入的所有内容特征向量进行聚合。正则化处理具体是指intra-normalization操作,intra-normalization操作是一种正则化的方法,用于对视频帧融合模型中的vlad描述子的块残差进行独立的l2-normalization。
84.具体地,在通过预设视频帧融合模型来对内容特征向量进行聚合,以得到初始聚合特征向量时,具体可以先通过预设视频帧融合模型的全连接层来对输入的所有内容特征向量进行升维处理,得到升维特征向量。假如用m代表内容数据数量,n表示输入特征的维度,即输入全连接层的数据是(m,n)。然后对先使用全连接层fc把输入向量x的n维升维到λn维,维度变为(m,λn)。而后通过预设视频帧融合模型对输入的升维向量进行进一步的分支
路处理,来得到获取分支路聚合特征向量;对分支路聚合特征向量执行正则化处理操作,通过全连接层对正则化处理操作得到的分支路聚合特征向量进行进一步的降维处理,即可得到获取特征向量对应的初始聚合特征向量。本实施例中,通过升维、分支路聚合以及正则化等操作,可以有效地将输入的内容特征向量进行聚合,得到最终的初始聚合特征向量。
85.在其中一个实施例中,如图6所示,步骤506中的分支路聚合处理包括:
86.步骤601,基于预设分组数对升维特征向量进行变换处理,基于变换处理后的升维特征向量以及升维特征向量对应的聚类中心,获取第一支路特征向量,变换处理用于将升维特征向量转化为预设分组数对应的特定维数矩阵,第一支路特征向量用于表征升维特征向量与升维特征向量对应的聚类中心的差值数据。
87.步骤603,通过预设归一化指数函数对升维特征向量进行处理,获取第二支路特征向量,第二支路特征向量用于表征升维特征向量与升维特征向量对应的聚类中心的比例数据。
88.步骤605,通过预设激活函数对升维特征向量进行处理,获取第三支路特征向量,第三支路特征向量用于表征升维特征向量对应的权重数据。
89.步骤607,根据第一支路特征向量、第二支路特征向量以及第三支路特征向量,获取分支路聚合特征向量。
90.其中,变换处理具体可以是指reshape处理,reshape处理是数组array中的方法,作用是将数据重新组织,本技术中,可以用于将升维特征向量转化为预设分组数对应的特定维数矩阵。聚类中心是指聚类分析中的一个特殊样本。用来代表某一类,其他样本通过与它计算距离来决定是否属于该类。归一化指数函数即归一化指数函数,它能将一个含任意实数的k维向量z“压缩”到另一个k维实向量σ(z)中,使得每一个元素的范围都在(0,1)之间,并且所有元素的和为1。激活函数则是在神经网络的神经元上运行的函数,负责将神经元的输入映射到输出端。
91.具体地,分支路聚合的过程具体可以分为三个支路的处理过程,其中第一个支路通过reshape操作来进行处理,第二个支路基于预设归一化指数函数来进行处理,第三个支路则是在全连接层中的激活函数来进行处理。最终通过,综合三个支路特征向量,进行聚合,即可获取最终的分支路聚合特征向量。在一个具体地实施例中,本技术具体进行多平台中发文作者的相似度识别,则基于预设视频帧融合模型,获取特征向量对应的初始聚合特征向量的过程具体可以参照图7所示,加入用对于确定的目标作者,使用m代表发布内容数量,n表示输入特征的维度,同时每一个发布内容作为视频帧融合模型的一帧数据。即输入是(m,n),g为分组数。先使用全连接层fc把输入向量x的n维升维到λn维变成维度变为(m,λn),然后分成三条支路,第一支路是根据分组数将先升维特征向量进行reshape处理成即将(m,λn)转化为(m,g,),再把分别与k个维度为的聚类中心ck做差,得到第一支路特征向量,即下列公式中右值的第三项;第二支路输入到全连接层在经过归一化指数,得到第二支路特征向量,即下面公式中右值的第二项,表示第i帧的第g组的特征第k个聚类中心ck的比例;第三条支路把输入到全连接层在经过sigmoid激活函数,得到第三支路特征向量,即下面公式中右值的第一项,表示第i帧在第g组的权重。把上面三条支路的结果相乘后的所得的最终结果就是下边公式等式左边的值。
[0092][0093][0094][0095][0096]
接着在帧维度和组维度求和,即得到降维之后的特征,公式如下:
[0097][0098]
最后对y
jk
作intra-normalization操作,再连个全连接进行进一步降维,即可得到最终的分支路聚合特征向量。本实施例中,通过三个支路来对升维特征向量进行分支路聚合处理,可以有效地对升维特征向量进行聚合,保证所得的分支路聚合特征向量的准确性。
[0099]
在其中一个实施例中,如图8所示,步骤205之前,还包括:
[0100]
步骤801,获取历史数据中的第二内容数据。
[0101]
步骤803,根据第二内容数据,构建三元组模型训练数据。
[0102]
步骤805,基于三元组模型训练数据对初始视频帧融合模型进行训练,以获取预设视频帧融合模型,初始视频帧融合模型基于视频帧融合算法、且结合三元组损失函数构建。
[0103]
其中,历史数据中的第二内容数据可以根据目标对象匹配过程中所使用的内容数据来确定。如目标对象匹配所使用的是视频数据和图文数据结合的多模态数据,则在模型训练时,也需要获取历史数据中的视频数据和图文数据,来构建模型训练数据。三元组模型训练数据则是指将模型训练数据中的样本分为三个组,即《a,p,n》三元组。其中a(anchor)表示一个基准正例,p(positive)表示一个与anchor同类别的正例,n(negative)表示一个与anchor不同类的负例。
[0104]
具体地,在通过预设视频帧融合模型来进行特征聚合之前,还需要对模型进行训练,而由于训练的初始视频帧融合模型是基于视频帧融合算法、且结合三元组损失函数构建,因此,可以通过历史数据中的第二内容数据构建三元组模型训练数据,基于三元组模型训练数据来对初始视频帧融合模型进行无监督的训练。在有监督的机器学习领域,通常有固定的类别,这时就可以使用基于归一化指数的交叉熵损失函数进行训练。但有时,类别是一个变量,此时使用三元组损失函数就能解决问题。三元组损失函数的优势在于细节区分,即当两个输入相似时,三元组损失函数能够更好地对细节进行建模,相当于加入了两个输入差异性差异的度量,学习到输入的更好表示。本技术中基于三元组损失函数来进行模型训练的完整流程可以参照图9所示,三元组损失函数的目标是:两个具有同样标签的样本,他们在新的编码空间里距离很近。两个具有不同标签的样本,他们在新的编码空间里距离很远。
[0105]
三元组损失函数定义在《a,p,n》三元组之上,a(anchor)表示一个基准正例,p
(positive)表示一个与anchor同类别的正例,n(negative)表示一个与anchor不同类的负例。对于一个三元组《a,p,n》,其triplet loss可以写作为:
[0106]
l=max(d(a,p)-d(a,n)+margin,0)
[0107]
这时可以通过最小化上述损失函数,使得a与p之间的距离d(a,p)趋近于0,并且使得a与n之间的距离d(a,n)大于d(a,p)+margin。当n样例很好识别时,上述损失函数为0,否则是一个比较大的值。本实施例中,通过构造三元组模型训练数据,从而对初始视频帧融合模型进行无监督训练,这样只需要将历史数据中的第二内容数据构成三元组即可完成模型训练的工作,不需要进行大量的数据标注即可完成内容数据的特征融合,保证目标对象匹配过程中,预设视频帧融合模型的构造效率。
[0108]
在其中一个实施例中,步骤803包括:根据第二内容数据,构建三元组模型训练数据包括:在第二内容数据中随机选取基准正例;获取基准正例与除基准正例自身外的第二内容数据之间的相似度,构建基准正例对应的相似度排名;将相似度排名在预设名次内的第二内容数据,作为基准正例对应的同类正例,将相似度低于预设阈值的第二内容数据,作为基准正例对应的不同类负例;根据基准正例,同类正例以及不同类负例构建三元组模型训练数据。
[0109]
具体地,由于三元组模型训练数据则是指将模型训练数据中的样本分为三个组,即《a,p,n》三元组。其中a(anchor)表示一个基准正例,p(positive)表示一个与anchor同类别的正例,n(negative)表示一个与anchor不同类的负例。在进行模型训练,构建训练数据时,可以先在原始的第二内容数据中随机选取出基准正例,而后根据基准正例确定相应的同类别正例以及不同类别的负例,识别正例与负例的过程具体可以通过相似度来进行,先获取基准正例与除基准正例自身外的第二内容数据之间的相似度,构建基准正例对应的相似度排名。与当前的基准正例类似的为同类正例,而不相似的则为不同类的负例。当确定正例与负例后,即可构建出多个与基准正例关联的三元组模型训练数据。在一个具体的实施例中,进行用户关注账号的相似度识别时,可以基于用户关注账号序列,统计账号的icf(基于协同过滤的相似度),选择排行前10的账号作为同类别正例。基于全量用户统计的账号icf,将低于0.02选择为不同类的负例。本实施例中,基于相似度的思想来识别出基准正例对应的同类正例与不同类负例,可以有效地构建出用于模型训练的三元组训练数据,从而保证模型训练过程的效率的准确性。
[0110]
在其中一个实施例中,如图10所示,步骤207包括:
[0111]
步骤1001,获取目标对象对应的对象信息特征向量。
[0112]
步骤1003,根据内容聚合特征向量以及对象信息特征向量构建目标对象对应的对象特征向量。
[0113]
步骤1005,获取对象特征向量与预设对象数据库中特征向量的特征向量相似度。
[0114]
步骤1007,基于特征向量相似度确定目标对象对应的匹配对象。
[0115]
其中,目标对象对应的对象信息特征向量具体是将基于目标对象自身信息所构造的特征向量,当目标对象为内容发布平台上的账户时,对象信息特征向量则可以根据该账户的头像,昵称以及简历等数据构造。
[0116]
具体地,在进行目标对象的匹配时,为了保证匹配准确率,除了考虑目标对象对应的第一内容数据外,还可以结合目标对象对应的对象信息特征向量来进行进一步的考虑,
可以先获取目标对象对应的对象信息所构造的对象信息特征向量;而后根据内容聚合特征向量以及对象信息特征向量构建目标对象对应的对象特征向量,其中在构建对象特征向量时,可以将内容聚合特征向量以及对象信息特征向量合并来构造对象特征向量。而后获取对象特征向量与预设对象数据库中特征向量的特征向量相似度,其中特征相似度具体可以通过余弦相似度来进行计算,当得到特征向量相似度后基于特征向量相似度确定目标对象对应的匹配对象,例如在其中一个实施例中,可以将特征相似度高于预设相似度阈值的所有对象都作为目标对象对应的匹配对象。在本实施例中,通过结合目标对象对应的对象信息特征向量来进行匹配对象的识别,可以有效保证对象匹配过程中的匹配准确率。
[0117]
在其中一个实施例中,如图11所示,步骤209之后,还包括:
[0118]
步骤1102,在预设对象数据库内查找匹配对象对应的待推荐对象。
[0119]
步骤1104,根据目标对象对应的第一内容数据构建内容推荐信息。
[0120]
步骤1106,向待推荐对象推送内容推荐信息。
[0121]
其中,待推荐对象是指可以基于匹配对象所对应的内容数据,向其进行内容推荐的一个对象。内容推荐信息用于向待推荐对象推荐目标对象对应的第一内容数据。预设对象数据库除了存储匹配对象自身的数据外,还可以保存有匹配对象对应的待推荐对象。
[0122]
具体地,本技术的目标对象匹配方法在识别出目标对象的匹配对象后,即可基于该匹配对象对应的待推荐对象来实现内容推荐处理。由于目标对象与匹配对象在特征维度上相似,因此,可以基于匹配对象对应的待推荐对象来实现相应的内容数据推荐。在其中一个实施例中,用户a喜欢浏览内容发布作者甲在平台1发布的内容,当内容发布作者甲在平台1发布内容后,新发布的内容也会被推荐给用户a。而当服务器识别出平台2中的内容发布作者乙的匹配对象为内容发布作者甲后,确定两者高度相似。因此在可以根据内容发作者乙的发布内容,构建内容推荐信息,而后向用户a推送该内容推荐信息。在另一个实施例中,还可以基于匹配对象对应的内容数据,来向目标对象对应的待推荐对象进行内容推荐。本实施例中,通过查找匹配对象对应的待推荐对象,可以有效在推荐系统中匹配到相应的待推荐对象,进而实现内容推荐,提高内容推荐的成功率。
[0123]
本技术还提供一种应用场景,该应用场景应用上述的目标对象匹配方法。具体地,该目标对象匹配方法在该应用场景的应用如下:
[0124]
当需要识别出内容发布平台中的搬运作者识别时,需要识别出不同平台中同一内容是否为同一个作者发布,因此可以通过本技术中的标对象匹配方法,来确定不同平台的两个作者账号是否归属于同一个作者,如果归属于同一作者,则说明其中没有搬运作者,而如果不归属于同一作者,则其中有一方为搬运作者。在可以将平台中作者发布内容的账号作为一个目标对象,来进行目标对象的匹配。首先,服务器需要获取目标对象匹配请求。该目标对象匹配请求具体用于请求识别两个内容发布平台账号是否归属为同一个作者。而服务器则可以根据目标对象匹配请求查找这两个账号在内容发布平台中发布的图文内容以及视频内容等,将这些作为目标对象对应的第一内容数据。而后先提取出这些内容数据对应的内容特征向量,将内容特征向量视为视频帧向量后,基于视频帧融合将内容特征向量进行聚合处理,获取内容聚合特征向量。而后通过比对两个账户的内容聚合特征向量的相似度,确定这两个账号是否归属于同一个作者。此外,还可以根据一个确定的平台账号,识别出所有的内容发布平台中,是否存在与该平台账号作者相同的其他账号,此时可以识别
出这个平台账号对应的内容聚合特征向量,而后基于内容聚合特征向量在预设对象数据库中查找目标对象对应的匹配对象。这些查找到的匹配对象即为该平台账号作者相同的其他账号。本技术方法中的内容聚合特征向量的聚合过程可以通过预设视频帧融合模型来实现,首先通过多模态特征提取,获取内容数据对应的内容特征向量;基于预设视频帧融合模型,获取内容特征向量对应的初始聚合特征向量,预设视频帧融合模型基于视频帧融合算法、且结合三元组损失函数构建;基于注意力机制对初始聚合特征向量进行调整,获取内容聚合特征向量。其中视频帧融合模型的处理过程包括:通过全连接层对内容特征向量进行升维处理,获取升维特征向量;基于预设分组数对升维特征向量进行分支路聚合处理,获取分支路聚合特征向量;对分支路聚合特征向量执行正则化处理操作,通过全连接层对正则化处理操作得到的特征进行降维,获取内容特征向量对应的初始聚合特征向量。而分支路的聚合处理具体包括:基于预设分组数对升维特征向量进行变换处理,基于变化处理后的升维特征向量以及升维特征向量对应的聚类中心,获取第一支路特征向量;通过预设归一化指数函数对升维特征向量进行处理,获取第二支路特征向量;通过全连接层以及预设激活函数对升维特征向量进行处理,获取第三支路特征向量;根据第一支路特征向量、第二支路特征向量以及第三支路特征向量,获取分支路聚合特征向量。在识别前,还需要构造预设视频帧融合模型,此时可以获取历史数据中的第二内容数据;根据内容数据构建三元组模型训练数据;基于三元组模型训练数据对初始视频帧融合模型进行训练,以获取预设视频帧融合模型。同时,为了保证匹配的准确率,在匹配过程中还可以结合目标对象对应的对象信息特征向量来进行匹配。可以根据内容聚合特征向量以及对象信息特征向量构建目标对象对应的对象特征向量;获取对象特征向量与预设对象数据库中特征的特征相似度;基于特征相似度确定目标对象对应的匹配对象。通过研究发现,当前作者相似度的基线指标为准确率68%,召回率52%。而结合本技术的方案,通过实验可以确定。
[0125]
(1)加上视频帧融合模型进行特征聚合后,准确率提升至72%,召回率提升至55%;
[0126]
(2)在此基础上融入了三元组损失函数,准确率提升至75%,召回率提升至59%。具体数据如表格1所示。可见,利用视频帧融合模型融入历史内容发布信息后,作者相似匹配的准确率和召回率有了明显的提高,证明了本技术方案的有效性。
[0127]
表格1不同模型的效果对比
[0128]
方法准确率召回率基线68%52%基线+视频帧融合72%55%基线+视频帧融合+三元组损失75%59%
[0129]
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0130]
基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的目标对象匹配方法的目标对象匹配装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个目标对象匹配装置实施例中的具体限定可以参见上文中对于目标对象匹配方法的限定,在此不再赘述。
[0131]
在一个实施例中,如图12所示,提供了一种目标对象匹配装置,包括:
[0132]
请求获取模块1201,用于获取目标对象匹配请求。
[0133]
内容查找模块1203,用于根据目标对象匹配请求,查找目标对象对应的第一内容数据。
[0134]
特征提取模块1205,用于提取第一内容数据对应的内容特征向量。
[0135]
特征聚合模块1207,用于将内容特征向量进行多维聚合处理,获取内容聚合特征向量。
[0136]
对象匹配模块1209,用于基于内容聚合特征向量在预设对象数据库中查找目标对象对应的匹配对象。
[0137]
在其中一个实施例中,特征提取模块1205具体用于:将内容特征向量输入至预设视频帧融合模型,获取内容特征向量对应的初始聚合特征向量,预设视频帧融合模型基于视频帧融合算法、且结合三元组损失函数构建;基于注意力机制对初始聚合特征向量进行调整,获取内容聚合特征向量。
[0138]
在其中一个实施例中,特征提取模块1205还用于:将内容特征向量输入至预设视频帧融合模型,通过预设视频帧融合模型对内容特征向量进行升维处理,获取升维特征向量;基于预设分组数对升维特征向量进行分支路聚合处理,获取分支路聚合特征向量;对分支路聚合特征向量执行正则化处理操作,对正则化处理操作得到的分支路聚合特征向量进行降维处理,获取分支路聚合特征向量对应的初始聚合特征向量。
[0139]
在其中一个实施例中,特征提取模块1205还用于:基于预设分组数对升维特征向量进行变换处理,基于变换处理后的升维特征向量以及升维特征向量对应的聚类中心,获取第一支路特征向量,变换处理用于将升维特征向量转化为预设分组数对应的特定维数矩阵,第一支路特征向量用于表征升维特征向量与升维特征向量对应的聚类中心的差值数据;通过预设归一化指数函数对升维特征向量进行处理,获取第二支路特征向量,第二支路特征向量用于表征升维特征向量与升维特征向量对应的聚类中心的比例数据;通过预设激活函数对升维特征向量进行处理,获取第三支路特征向量;根据第一支路特征向量、第二支路特征向量以及第三支路特征向量,获取分支路聚合特征向量。
[0140]
在其中一个实施例中,还包括模型训练模块,用于:获取历史数据中的第二内容数据;根据第二内容数据,构建三元组模型训练数据;基于三元组模型训练数据对初始视频帧融合模型进行训练,以获取预设视频帧融合模型,初始视频帧融合模型基于视频帧融合算法、且结合三元组损失函数构建。
[0141]
在其中一个实施例中,模型训练模块还用于:在第二内容数据中随机选取基准正例;获取基准正例与除基准正例自身外的第二内容数据之间的相似度,构建基准正例对应的相似度排名;将相似度排名在预设名次内的第二内容数据,作为基准正例对应的同类正例,将相似度低于预设阈值的第二内容数据,作为基准正例对应的不同类负例;根据基准正例,同类正例以及不同类负例构建三元组模型训练数据。
[0142]
在其中一个实施例中,对象匹配模块1209具体用于:获取目标对象对应的对象信息特征向量;根据内容聚合特征向量以及对象信息特征向量构建目标对象对应的对象特征向量;获取对象特征向量与预设对象数据库中特征向量的特征向量相似度;基于特征向量相似度确定目标对象对应的匹配对象。
[0143]
在其中一个实施例中,还包括内容推荐模块,用于:在预设对象数据库内查找匹配对象对应的待推荐对象;根据目标对象对应的第一内容数据构建内容推荐信息;向待推荐对象推送内容推荐信息。
[0144]
上述目标对象匹配装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0145]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图13所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储轨迹图像数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种目标对象匹配方法。
[0146]
本领域技术人员可以理解,图13中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0147]
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
[0148]
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0149]
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
[0150]
需要说明的是,本技术所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据在使用前已经经过了脱敏处理,相关数据的收集、使用和处理符合当地安全标准和当地法律法规。
[0151]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器
(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
[0152]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0153]
以上实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。
技术特征:
1.一种目标对象匹配方法,其特征在于,所述方法包括:获取目标对象匹配请求;根据所述目标对象匹配请求,查找所述目标对象对应的第一内容数据;提取所述第一内容数据对应的内容特征向量;将所述内容特征向量进行多维聚合处理,获取内容聚合特征向量;基于所述内容聚合特征向量在预设对象数据库中查找所述目标对象对应的匹配对象。2.根据权利要求1所述的方法,其特征在于,所述将所述内容特征向量进行多维聚合处理,获取内容聚合特征向量包括:将所述内容特征向量输入至预设视频帧融合模型,获取所述内容特征向量对应的初始聚合特征向量,所述预设视频帧融合模型基于视频帧融合算法、且结合三元组损失函数构建;基于注意力机制对所述初始聚合特征向量进行调整,获取内容聚合特征向量。3.根据权利要求2所述的方法,其特征在于,所述将所述特征向量输入至预设视频帧融合模型,获取所述内容特征向量对应的初始聚合特征向量包括:将所述内容特征向量输入至预设视频帧融合模型,通过所述预设视频帧融合模型对所述内容特征向量进行升维处理,获取升维特征向量;基于预设分组数对所述升维特征向量进行分支路聚合处理,获取分支路聚合特征向量;对所述分支路聚合特征向量执行正则化处理操作;对正则化处理操作得到的分支路聚合特征向量进行降维处理,获取所述分支路聚合特征向量对应的初始聚合特征向量。4.根据权利要求3所述的方法,其特征在于,所述基于预设分组数对所述升维特征向量进行分支路聚合处理,获取分支路聚合特征向量包括:基于预设分组数对所述升维特征向量进行变换处理,基于变换处理后的升维特征向量以及所述升维特征向量对应的聚类中心,获取第一支路特征向量,所述变换处理用于将所述升维特征向量转化为所述预设分组数对应的特定维数矩阵,所述第一支路特征向量用于表征升维特征向量与升维特征向量对应的聚类中心的差值数据;通过预设归一化指数函数对所述升维特征向量进行处理,获取第二支路特征向量,所述第二支路特征向量用于表征升维特征向量与升维特征向量对应的聚类中心的比例数据;通过预设激活函数对所述升维特征向量进行处理,获取第三支路特征向量,所述第三支路特征向量用于表征升维特征向量对应的权重数据;根据所述第一支路特征向量、第二支路特征向量以及第三支路特征向量,获取分支路聚合特征向量。5.根据权利要求2所述的方法,其特征在于,所述基于预设视频帧融合模型,获取所述内容特征向量对应的初始聚合特征向量之前,还包括:获取历史数据中的第二内容数据;根据所述第二内容数据,构建三元组模型训练数据;基于所述三元组模型训练数据对初始视频帧融合模型进行训练,以获取预设视频帧融合模型,所述初始视频帧融合模型基于视频帧融合算法、且结合三元组损失函数构建。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第二内容数据,构建三元组模型训练数据包括:在所述第二内容数据中随机选取基准正例;获取所述基准正例与除所述基准正例自身外的所述第二内容数据之间的相似度,构建所述基准正例对应的相似度排名;将相似度排名在预设名次内的第二内容数据,作为所述基准正例对应的同类正例,将相似度低于预设阈值的第二内容数据,作为所述基准正例对应的不同类负例;根据所述基准正例,所述同类正例以及所述不同类负例构建三元组模型训练数据。7.根据权利要求1所述的方法,其特征在于,所述基于所述内容聚合特征向量在预设对象数据库中查找所述目标对象对应的匹配对象包括:获取所述目标对象对应的对象信息特征向量;根据所述内容聚合特征向量以及所述对象信息特征向量构建所述目标对象对应的对象特征向量;获取所述对象特征向量与预设对象数据库中特征向量的特征向量相似度;基于所述特征向量相似度确定所述目标对象对应的匹配对象。8.根据权利要求1所述的方法,其特征在于,所述基于所述内容聚合特征向量在预设对象数据库中查找所述目标对象对应的匹配对象之后,还包括:在所述预设对象数据库内查找所述匹配对象对应的待推荐对象;根据所述目标对象对应的第一内容数据构建内容推荐信息;向所述待推荐对象推送所述内容推荐信息。9.一种目标对象匹配装置,其特征在于,所述装置包括:请求获取模块,用于获取目标对象匹配请求;内容查找模块,用于根据所述目标对象匹配请求,查找所述目标对象对应的第一内容数据;特征提取模块,用于提取所述第一内容数据对应的内容特征向量;特征聚合模块,用于将所述内容特征向量进行多维聚合处理,获取内容聚合特征向量;对象匹配模块,用于基于所述内容聚合特征向量在预设对象数据库中查找所述目标对象对应的匹配对象。10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。
技术总结
本申请涉及一种目标对象匹配方法、装置及计算机设备,本申请在进行目标对象的匹配时,在提取内容数据对应的特征向量后,通过聚类的思想,将所述内容特征向量进行多维聚合处理,获取内容聚合特征向量,这样可以在保证准确率的前提下,完成降维了工作,减少网络的参数量,从而可以融合更多的特征向量,提高目标对象匹配过程中的匹配准确率。配过程中的匹配准确率。配过程中的匹配准确率。
技术研发人员:高常粮 赵博 黄展鹏
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2022.01.17
技术公布日:2023/7/26
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种燃料电池系统、车辆以及活化方法与流程 下一篇:SSRI/5-HT的制作方法