推荐信息的处理方法、装置、电子设备及存储介质与流程

未命名 09-21 阅读:78 评论:0


1.本公开涉及计算机技术领域,尤其涉及车联网、人工智能技术领域,具体涉及一种推荐信息的处理方法、装置、电子设备及存储介质。


背景技术:

2.随着移动互联网的快速发展,各种终端设备的智能化、信息化的程度越来越高,比如智能手机、车载终端、智能电视等。终端设备通过安装客户端的应用程序,可以为用户提供音频、视频等多媒体信息服务。同时,根据用户的使用数据,可以向其主动推荐兴趣内容。然而,当用户改换终端设备时,当前设备的客户端必须通过登录账号才能获取用户最近的使用数据,进而实现兴趣内容的精准推荐。因此,研究如何在无需登录用户账号的条件下,实现不同的客户端向同一用户精准推荐兴趣内容,具有重要意义。


技术实现要素:

3.本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
4.本公开第一方面实施例提出了一种推荐信息的处理方法,包括:
5.第一客户端获取用户语音数据;
6.所述第一客户端对所述用户语音数据进行解析,以确定所述用户语音数据的声纹特征;
7.所述第一客户端向服务端发送包含所述声纹特征的推荐信息获取请求,以使所述服务端确定与所述声纹特征关联的推荐信息,其中,所述推荐信息是所述第一客户端和/或第二客户端发送给所述服务端的;
8.所述第一客户端接收并展示所述服务端返回的所述推荐信息。
9.本公开第二方面实施例提出了一种推荐信息的处理方法,包括:
10.服务端接收第一客户端发送的推荐信息获取请求,其中,所述推荐信息获取请求中包括声纹特征;
11.所述服务端确定所述声纹特征关联的推荐信息,其中,所述推荐信息是所述第一客户端和/或第二客户端发送给所述服务端的;
12.所述服务端向所述第一客户端发送所述推荐信息,以使所述第一客户端接收并展示所述推荐信息。
13.本公开第三方面实施例提出了一种推荐信息的处理装置,包括:
14.第一获取模块,用于第一客户端获取用户语音数据;
15.第一确定模块,用于所述第一客户端对所述用户语音数据进行解析,以确定所述用户语音数据的声纹特征;
16.第一发送模块,用于所述第一客户端向服务端发送包含所述声纹特征的推荐信息获取请求,以使所述服务端确定与所述声纹特征关联的推荐信息,其中,所述推荐信息是所述第一客户端和/或第二客户端发送给所述服务端的;
17.第一接收模块,用于所述第一客户端接收并展示所述服务端返回的所述推荐信息。
18.本公开第四方面实施例提出了一种推荐信息的处理装置,包括:
19.第一接收模块,用于服务端接收第一客户端发送的推荐信息获取请求,其中,所述推荐信息获取请求中包括声纹特征;
20.确定模块,用于所述服务端确定所述声纹特征关联的推荐信息,其中,所述推荐信息是所述第一客户端和/或第二客户端发送给所述服务端的;
21.发送模块,用于所述服务端向所述第一客户端发送所述推荐信息,以使所述第一客户端接收并展示所述推荐信息。
22.本公开第五方面实施例提出了一种车辆,包括如本公开第三方面实施例提出的装置。
23.本公开第六方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时,实现如本公开第一方面实施例或第二方面实施例提出的方法。
24.本公开第七方面实施例提出了一种非临时性计算机可读存储介质,存储有计算机指令,所述计算机指令被处理器执行时实现如本公开第一方面实施例或第二方面实施例提出的方法。
25.本公开第八方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行本公开第一方面实施例或第二方面实施例提出的方法。
26.本公开提供的推荐信息的处理方法、装置、计算机设备及存储介质,存在如下有益效果:
27.第一客户端首先获取用户语音数据;然后对用户语音数据进行解析,以确定用户语音数据的声纹特征;之后向服务端发送包含声纹特征的推荐信息获取请求,以使服务端确定与声纹特征关联的推荐信息,其中,推荐信息是第一客户端和/或第二客户端发送给服务端的;最后接收并展示服务端返回的推荐信息。本公开通过用户的声纹特征,将不同的客户端基于用户的使用数据生成的推荐信息进行关联,实现了在无需用户登录账号的前提下,不同的客户端向同一用户精准推荐兴趣内容。
28.本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
29.本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
30.图1为本公开一实施例所提供的推荐信息的处理方法的流程示意图;
31.图2为本公开另一实施例所提供的推荐信息的处理方法的流程示意图;
32.图3为本公开又一实施例所提供的推荐信息的处理方法的流程示意图;
33.图4为本公开又一实施例所提供的推荐信息的处理方法的流程示意图;
34.图5为本公开一实施例所提供的推荐信息的处理装置的结构示意图;
35.图6为本公开另一实施例所提供的推荐信息的处理装置的结构示意图;
36.图7示出了适于用来实现本公开实施方式的示例性电子设备的框图。
具体实施方式
37.下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
38.下面参考附图描述本公开实施例的推荐信息的处理方法、装置、电子设备和存储介质。
39.图1为本公开实施例所提供的推荐信息的处理方法的流程示意图。
40.本公开实施例以该推荐信息的处理方法被配置于推荐信息的处理装置中来举例说明,该推荐信息的处理装置可以应用于用户侧的终端设备中,比如车载终端设备、家庭终端设备或移动终端设备等,以使该终端设备可以执行推荐信息的处理功能。
41.如图1所示,该推荐信息的处理方法可以包括以下步骤:
42.步骤101,第一客户端获取用户语音数据。
43.其中,第一客户端可以为用户侧客户端。第一客户端可以应用于任意类型的终端设备上,比如车载终端、家庭电视或智能手机等。
44.目前,很多终端设备已经具备语音识别的能力。因此,用户可以通过语音唤醒客户端的应用,以使客户端提供相应的服务。
45.本公开实施例中,用户语音数据可以为任意类型的语音指令。比如,用户语音数据可以为播放音乐的指令,或者播放视频的指令等。
46.步骤102,第一客户端对用户语音数据进行解析,以确定用户语音数据的声纹特征。
47.其中,声纹是用电声学仪器显示的携带言语信息的声波频谱。根据从说话人发出的语音数据中提取的声纹特征,能够准确地区分不同的说话人。
48.因此,为了确定用户的身份,可以对用户语音数据进行解析,提取用户语音数据的声纹特征。其中,对用户语音数据进行解析,可以采用任意可能的实现方式。
49.比如,可以提取语音数据的声学特征、词法特征、韵律特征、口音信息、通道信息等,并根据上述特征中一种或几种生成语音数据的声纹特征,本公开对此不做限定。
50.步骤103,第一客户端向服务端发送包含声纹特征的推荐信息获取请求,以使服务端确定与声纹特征关联的推荐信息,其中,推荐信息是第一客户端和/或第二客户端发送给服务端的。
51.其中,声纹特征可以作为用户的身份标识。服务端可以存储用户的声纹特征,以根据声纹特征确定用户身份。
52.具体的,当用户在第一客户端上使用信息服务时,第一客户端可以向服务端发送包含声纹特征的推荐信息获取请求。服务端将接收到的声纹特征与已存储的所有声纹特征进行匹配,当确定接收到的声纹特征与某个已存储的声纹特征一致时,可以将该已存储的声纹特征关联的推荐信息返回给第一客户端。
53.需要说明的是,与声纹特征关联的推荐信息,是各个客户端基于用户的历史使用数据,生成并发送给服务端的。
54.比如,在某个时间段内,用户可能在车载设备的客户端使用了信息服务;在另一时间段内,用户可能在家庭电视的客户端使用了信息服务。
55.因此,当用户在任一客户端使用信息服务后,该客户端可以基于用户的历史使用数据生成推荐信息,以针对不同用户的使用习惯和偏好提供个性化的内容和服务。
56.其中,为了保证其他客户端能够及时更新对用户的推荐信息,各个客户端可以将最新生成的推荐信息发送给服务端,服务端根据用户的声纹特征,对用户的推荐信息进行更新。进而,当用户在任一客户端使用信息服务时,可以将最新的推荐信息发送给该客户端。
57.需要说明的是,用户可以在同一客户端多次使用信息服务,也可以在不同的客户端多次使用信息服务。
58.比如,用户可以第一次在第一客户端使用信息服务,第二次在第一客户端使用信息服务,第三次在第二客户端使用信息服务。
59.或者,用户可以第一次在第一客户端使用信息服务,第二次在第二客户端使用信息服务,第三次在第一客户端使用信息服务。
60.本公开实施例中,第二客户端可以为区别于第一客户端的多个终端。比如,当第一客户端为车载终端时,第二客户端可以为电视终端、手机终端等。
61.步骤104,第一客户端接收并展示服务端返回的推荐信息。
62.具体的,当第一客户端接收到服务端返回的推荐信息时,可以向用户展示推荐信息,以使用户自由选择是否播放推荐信息对应的多媒体内容。
63.其中,推荐信息可以包括多种类型的信息。比如,推荐信息可以包括用户上次收听的的音乐或观看的视频等。或者,推荐信息还可以包括用户可能感兴趣的音乐或视频等,本公开对此不做限定。
64.本公开实施例中,第一客户端首先获取用户语音数据;然后对用户语音数据进行解析,以确定用户语音数据的声纹特征;之后向服务端发送包含声纹特征的推荐信息获取请求,以使服务端确定与声纹特征关联的推荐信息,其中,推荐信息是第一客户端和/或第二客户端发送给服务端的;最后接收并展示服务端返回的推荐信息。本公开通过用户的声纹特征,将不同的客户端基于用户的使用数据生成的推荐信息进行关联,实现了在无需用户登录账号的前提下,不同的客户端向同一用户精准推荐兴趣内容,并保证了用户隐私安全。
65.图2为本公开另一实施例所提供的推荐信息的处理方法的流程示意图。如图2所示,该推荐信息的处理方法可以包括以下步骤:
66.步骤201,第一客户端获取用户语音数据。
67.需要说明的是,步骤201的具体实现方式,可以参照本公开其他实施例的详细描述,在此不再赘述。
68.步骤202,第一客户端对用户语音数据进行识别,以确定用户语音数据的文本内容。
69.需要说明的是,在实际场景中,第一客户端获取到的用户语音数据,可能不是用户期望获取信息服务的语音指令。
70.比如,当用户在车辆内时,第一客户端获取到的用户语音数据可能是用户与他人
交谈时的语音;或者,可能是车辆所在环境中的背景声音等。
71.因此,在第一客户端获取到用户语音数据后,可以首先对语音数据进行识别,以确定语音数据包含的文本内容。
72.步骤203,响应于用户语音数据的文本内容为唤醒指令,第一客户端对用户语音数据进行解析,以确定用户语音数据的声纹特征。
73.其中,唤醒指令的判定规则可以根据需要提前设定。比如,可以为唤醒指令设置多个关键词。当用户语音数据的文本内容包含一个以上关键词时,确定该语音数据为唤醒指令。反之,当用户语音数据的文本内容未包含关键词时,确定该语音数据非唤醒指令。
74.或者,可以将唤醒指令固定为预设文本。当用户语音数据的文本内容与预设文本相同时,确定该语音数据为唤醒指令。反之,当用户语音数据的文本内容与预设文本不相同时,确定该语音数据非唤醒指令。
75.进而,在确定用户语音数据的文本内容为唤醒指令后,可以进一步对用户语音数据进行解析,以确定用户语音数据的声纹特征。具体实现方式,可以参照本公开其他实施例的详细描述,在此不再赘述。
76.本公开实施例中,通过识别用户语音数据的文本内容,确定用户语音是否为唤醒指令。由此,避免了背景声音的干扰,提高了信息推荐服务的可靠性和准确性。
77.步骤204,第一客户端获取用户的面部图像数据。
78.可以理解的是,同一个人的声音具有易变性。比如,易受个人身体状况、拾音设备性能、环境噪音等的影响。
79.因此,在终端设备具备图像采集功能的条件下,可以同时获取用户的面部图像数据,从而结合用户声音数据及面部图像数据准确、快速确认用户身份。
80.步骤205,第一客户端对面部图像数据进行解析,以确定面部图像数据的人脸特征。
81.比如,可以从面部图像数据中确定各个主要面部器官的位置信息,并依据这些信息,形成人脸特征。
82.步骤206,第一客户端向服务端发送包含声纹特征及人脸特征的推荐信息获取请求,以使服务端确定与声纹特征及人脸特征关联的推荐信息,其中,推荐信息是第一客户端和/或第二客户端发送给服务端的。
83.其中,声纹特征和人脸特征可以共同作为用户的身份标识。也就是说,同一用户的声纹特征和人脸特征相互关联。服务端可以存储用户的声纹特征和人脸特征,以根据声纹特征和人脸特征确定用户身份。
84.具体的,当用户在第一客户端上使用信息服务时,第一客户端可以向服务端发送包含声纹特征和人脸特征的推荐信息获取请求。服务端将接收到的声纹特征与已存储的所有声纹特征进行匹配,当确定接收到的声纹特征与某个已存储的声纹特征一致时,可以进一步将接收到的人脸特征与该已存储的声纹特征关联的人脸特征进行匹配,如果人脸特征匹配结果满足要求,则可以将该已存储的声纹特征关联的推荐信息返回给第一客户端。
85.或者,服务端可以将接收到的人脸特征与已存储的所有人脸特征进行匹配,当确定接收到的人脸特征与某个已存储的人脸特征一致时,可以进一步将接收到的声纹特征与该已存储的人脸特征关联的声纹特征进行匹配,如果声纹特征匹配结果满足要求,则可以
将该已存储的人脸特征关联的推荐信息返回给第一客户端。
86.本公开实施例中,同时基于用户的声纹特征和人脸特征确定用户身份,提高了对用户推荐兴趣内容的准确性和可靠性。
87.在一些实施例中,服务端也可以仅根据推荐信息获取请求中的声纹特征或人脸特征确定用户身份,进而返回对应的推荐信息。
88.需要说明的是,推荐信息的具体实现方式,可以参照本公开其他实施例的详细描述,在此不再赘述。
89.步骤207,第一客户端接收并展示服务端返回的推荐信息。
90.需要说明的是,步骤207的具体实现方式,可以参照本公开其他实施例的详细描述,在此不再赘述。
91.步骤208,响应于第一客户端接收到多媒体内容播放指令,记录多媒体播放数据。
92.需要说明的是,当用户在第一客户端使用信息服务时,可以形成新的使用数据。比如,观看某个视频;或者,收听某个歌曲、相声等。
93.其中,当用户期望获取某种信息服务时,可以向第一客户端发送多媒体内容播放指令。多媒体内容播放指令可以基于用户对客户端的触发动作实现。
94.比如,可以通过用户点击客户端显示的图标按钮实现。或者,也可以通过用户发出语音播放指令的方式实现,本公开对此不做限定。
95.进而,在客户端根据播放指令播放相应的多媒体内容时,可以记录多媒体播放数据。比如,多媒体播放数据可以包括播放的视频或音频的名称、播放的时长以及播放的时间等。
96.步骤209,第一客户端根据多媒体播放数据,更新推荐信息。
97.其中,当前的多媒体播放数据记录了用户最新的使用数据。因此,客户端可以根据多媒体播放数据,更新从服务端获取到的推荐信息。
98.比如,可以根据播放的时间,将本次的多媒体播放数据加入已有的推荐信息中,并按照播放时间的先后顺序进行排列。或者,还可以根据本次的多媒体播放数据,查询类型相同或相似的多媒体信息,并加入已有的推荐信息中。
99.步骤210,第一客户端将更新后的推荐信息及声纹特征发送给服务端。
100.其中,为了保证用户改换其他客户端使用信息服务时,其他客户端能够获取最新的推荐信息。第一客户端可以将更新后的推荐信息及表征用户身份的声纹特征发送给服务端。进而,服务端可以根据声纹特征更新其关联的推荐信息。
101.需要说明的是,用户在第一客户端使用信息服务时,也可能会主动搜索其感兴趣的多媒体信息,进而产生搜索记录。因此,第一客户端还可以根据相应的搜索数据,更新推荐信息。
102.本公开实施例中,第一客户端根据用户的最新使用数据,更新对用户的推荐信息,并将更新后的推荐信息发送给服务端,保证用户在其他客户端使用信息服务时,可以获取最新的推荐信息。由此,实现了在无需用户登录账号的前提下,不同的客户端向同一用户精准推荐兴趣内容。
103.图3为本公开实施例所提供的推荐信息的处理方法的流程示意图。
104.本公开实施例以该用户界面的生成方法被配置于服务端的推荐信息的处理装置
中来举例说明,该用户界面的生成装置可以应用于云端服务器中,以使该云端服务器可以执行推荐信息的处理功能。
105.如图3所示,该推荐信息的处理方法可以包括以下步骤:
106.步骤301,服务端接收第一客户端发送的推荐信息获取请求,其中,推荐信息获取请求中包括声纹特征。
107.其中,当用户需要在第一客户端使用信息服务时,可以通过第一客户端向服务端发送推荐信息获取请求,以使服务端向第一客户端发送相关数据。
108.此外,由于服务端可以存储针对不同用户的推荐信息,因此采用声纹特征作为用户的身份标识。具体的,服务端可以预先存储用户的声纹特征,当接收到推荐信息获取请求时,可以根据推荐信息获取请求中的声纹特征确定用户身份,进而向第一客户端返回该用户对应的相关数据。
109.步骤302,服务端确定声纹特征关联的推荐信息,其中,推荐信息是第一客户端和/或第二客户端发送给服务端的。
110.其中,服务端可以将接收到的声纹特征与已存储的所有声纹特征进行匹配,当确定接收到的声纹特征与某个已存储的声纹特征一致时,可以将该已存储的声纹特征关联的推荐信息返回给第一客户端。
111.比如,服务端可以采用神经网络模型对声纹特征进行匹配,从已存储的所有声纹特征中确定与接收到的声纹特征一致的声纹特征。或者,服务端可以采用多项式分类器方法对声纹特征进行匹配,本公开对比不做限定。
112.需要说明的是,与声纹特征关联的推荐信息,是各个客户端基于用户的历史使用数据,生成并发送给服务端的。
113.比如,在某个时间段内,用户可能在车载设备的客户端使用了信息服务;在另一时间段内,用户可能在家庭电视的客户端使用了信息服务。
114.因此,当用户在任一客户端使用信息服务后,该客户端可以基于用户的历史使用数据生成推荐信息,以针对不同用户的使用习惯和偏好提供个性化的内容和服务。
115.其中,为了保证其他客户端能够及时更新对用户的推荐信息,各个客户端可以将最新生成的推荐信息发送给服务端,服务端根据用户的声纹特征,对用户的推荐信息进行更新。进而,当用户在任一客户端使用信息服务时,可以将最新的推荐信息发送给该客户端。
116.需要说明的是,用户可以在同一客户端多次使用信息服务,也可以在不同的客户端多次使用信息服务。
117.比如,用户可以第一次在第一客户端使用信息服务,第二次在第一客户端使用信息服务,第三次在第二客户端使用信息服务。
118.或者,用户可以第一次在第一客户端使用信息服务,第二次在第二客户端使用信息服务,第三次在第一客户端使用信息服务。
119.本公开实施例中,第二客户端可以为区别于第一客户端的多个终端。比如,当第一客户端为车载终端时,第二客户端可以为电视终端、手机终端等。
120.步骤303,服务端向第一客户端发送推荐信息,以使第一客户端接收并展示推荐信息。
121.具体的,当服务端确定与声纹特征关联的推荐信息后,可以向第一客户端返回推荐信息。进而,第一客户端可以向用户展示推荐信息,以使用户自由选择是否播放推荐信息对应的多媒体内容。
122.其中,推荐信息可以包括多种类型的信息。比如,推荐信息可以包括用户上次收听的的音乐或观看的视频等。或者,推荐信息还可以包括用户可能感兴趣的音乐或视频等,本公开对此不做限定。
123.本公开实施例中,服务端首先接收第一客户端发送的推荐信息获取请求,其中,推荐信息获取请求中包括声纹特征;然后确定声纹特征关联的推荐信息;最后向第一客户端发送推荐信息,以使第一客户端接收并展示推荐信息。本公开通过用户的声纹特征,将不同的客户端基于用户的使用数据生成的推荐信息进行关联,实现了在无需用户登录账号的前提下,不同的客户端向同一用户精准推荐兴趣内容,保证了用户隐私安全。
124.图4为本公开另一实施例所提供的推荐信息的处理方法的流程示意图。如图4所示,该推荐信息的处理方法可以包括以下步骤:
125.步骤401,服务端接收第一客户端发送的推荐信息获取请求,其中,推荐信息获取请求中包括声纹特征。
126.需要说明的是,步骤401的具体实现方式,可以参照本公开其他实施例的详细描述,在此不再赘述。
127.可以理解的是,同一个人的声音具有易变性。比如,易受个人身体状况、拾音设备性能、环境噪音等的影响。在一些实施例中,推荐信息获取请求中还可以包括人脸特征,从而结合用户声纹特征及人脸特征确认用户身份。
128.步骤402,确定声纹特征与声纹库中的每个候选声纹特征的相似度。
129.需要说明的是,为了使服务端确定声纹特征关联的推荐信息,可以预先建立声纹库。其中,声纹库中可以包括多个候选声纹特征。每个候选声纹特征是从一个用户的语音数据中提取得到的。
130.也就是说,声纹库中的每个候选声纹特征可以分别作为一个用户的身份标识。通过比较当前获取的声纹特征与每个候选声纹特征的相似度,可以确定当前获取的声纹特征对应的用户身份。
131.步骤403,根据相似度,从候选声纹特征中选取目标声纹特征。
132.可以理解的是,两个声纹特征间的相似度越高,该两个声纹特征属于同一用户的可能性越大。因此,可以选择与接收到的声纹特征相似度最高的候选声纹特征作为目标声纹特征。
133.需要说明的是,如果当前用户为新用户,即服务端的声纹库中没有记录该用户对应的候选声纹特征,则不应从候选声纹特征中选取目标声纹特征。因此,可以为相似度设定阈值,并从相似度大于设定阈值的各候选声纹特征中,选取相似度最高的候选声纹特征作为目标声纹特征。
134.其中,相似度的阈值可以为提前设定好的任意数值。比如,可以为0.8、0.9、0.95等,本公开对此不做限定。
135.此外,如果当前用户为新用户,可以将接收到的声纹特征作为新增候选声纹特征加入声纹库中,以便在用户下次使用信息服务时进行对比。
136.步骤404,确定目标声纹特征关联的推荐信息。
137.其中,目标声纹特征即当前用户的声纹特征。目标声纹特征关联的推荐信息,可以是各个客户端基于当前用户的历史使用数据,生成并发送给服务端的。
138.进而,服务端可以根据用户的声纹特征,对一个用户的推荐信息进行更新。当用户在任一客户端使用信息服务时,可以将最新的推荐信息发送给该客户端。
139.在一些实施例中,当声纹特征和人脸特征共同作为用户的身份标识时,服务端可以将同一用户的声纹特征和人脸特征相互关联,同时根据声纹特征和人脸特征确定用户身份。
140.比如,客户端可以向服务端发送包含声纹特征和人脸特征的推荐信息获取请求。服务端将接收到的声纹特征与已存储的所有声纹特征进行匹配,当确定接收到的声纹特征与某个已存储的声纹特征一致时,可以进一步将接收到的人脸特征与该已存储的声纹特征关联的人脸特征进行匹配,如果人脸特征匹配结果满足要求,则可以确定该已存储的声纹特征为目标声纹特征。
141.或者,服务端可以将接收到的人脸特征与已存储的所有人脸特征进行匹配,当确定接收到的人脸特征与某个已存储的人脸特征一致时,可以进一步将接收到的声纹特征与该已存储的人脸特征关联的声纹特征进行匹配,如果声纹特征匹配结果满足要求,则可以确定该已存储的声纹特征为目标声纹特征。
142.步骤405,服务端向第一客户端发送推荐信息,以使第一客户端接收并展示推荐信息。
143.其中,步骤405的具体实现方式,可以参照本公开其他实施例的详细描述,在此不再赘述。
144.步骤406,服务端接收第一客户端发送的更新后的推荐信息及声纹特征。
145.步骤407,服务端根据更新后的推荐信息,对声纹特征关联的推荐信息进行更新。
146.需要说明的是,当用户在客户端使用信息服务时,可以形成新的使用数据。比如,观看某个视频;或者,收听某个歌曲、相声等。因此,客户端可以根据最新的使用数据,更新获取到的推荐信息。
147.比如,可以根据播放的时间,将本次的多媒体播放数据加入已有的推荐信息中,并按照播放时间的先后顺序进行排列。或者,还可以根据本次的多媒体播放数据,查询类型相同或相似的多媒体信息,并加入已有的推荐信息中。
148.进而,为了保证用户更换其他客户端使用信息服务时,其他客户端能够获取最新的推荐信息。第一客户端可以将更新后的推荐信息及表征用户身份的声纹特征发送给服务端。进而,服务端可以根据声纹特征更新其关联的推荐信息。
149.本公开实施例中,服务端通过接收根据用户的使用数据更新后的推荐信息,并基于用户的声纹特征对关联的推荐信息进行更新,保证了用户在其他客户端使用信息服务时,可以获取最新的推荐信息。
150.为了实现上述实施例,本公开还提出一种推荐信息的处理装置。
151.图5为本公开实施例所提供的一种推荐信息的处理装置的结构示意图。
152.如图5所示,该推荐信息的处理装置100可以包括:第一获取模块110、第一确定模块120、第一发送模块130及第一接收模块140。
153.其中,第一获取模块110,用于第一客户端获取用户语音数据;
154.第一确定模块120,用于第一客户端对用户语音数据进行解析,以确定用户语音数据的声纹特征;
155.第一发送模块130,用于第一客户端向服务端发送包含声纹特征的推荐信息获取请求,以使服务端确定与声纹特征关联的推荐信息,其中,推荐信息是第一客户端和/或第二客户端发送给服务端的;
156.第一接收模块140,用于第一客户端接收并展示服务端返回的推荐信息。
157.在一些实施例中,该装置还包括:
158.第二获取模块,第一客户端获取用户的面部图像数据;
159.第二确定模块,用于第一客户端对面部图像数据进行解析,以确定面部图像数据的人脸特征;
160.第一发送模块用于第一客户端向服务端发送包含声纹特征及人脸特征的推荐信息获取请求,以使服务端确定与声纹特征及人脸特征关联的推荐信息。
161.在一些实施例中,该装置还包括:
162.记录模块,用于响应于第一客户端接收到多媒体内容播放指令,记录多媒体播放数据;
163.更新模块,用于第一客户端根据多媒体播放数据,更新推荐信息;
164.第二发送模块,用于第一客户端将更新后的推荐信息及声纹特征发送给服务端。
165.在一些实施例中,第一确定模块具体用于:
166.第一客户端对用户语音数据进行识别,以确定用户语音数据的文本内容;
167.响应于用户语音数据的文本内容为唤醒指令,第一客户端对用户语音数据进行解析,以确定用户语音数据的声纹特征。
168.本公开实施例中的上述各模块的功能及具体实现原理,可参照上述各方法实施例,此处不再赘述。
169.本公开实施例的推荐信息的处理装置,第一客户端首先获取用户语音数据;然后对用户语音数据进行解析,以确定用户语音数据的声纹特征;之后向服务端发送包含声纹特征的推荐信息获取请求,以使服务端确定与声纹特征关联的推荐信息,其中,推荐信息是第一客户端和/或第二客户端发送给服务端的;最后接收并展示服务端返回的推荐信息。本公开通过用户的声纹特征,将不同的客户端基于用户的使用数据生成的推荐信息进行关联,实现了在无需用户登录账号的前提下,不同的客户端向同一用户精准推荐兴趣内容,并保证了用户隐私安全。
170.为了实现上述实施例,本公开还提出一种推荐信息的处理装置。
171.图6为本公开实施例所提供的推荐信息的处理装置的结构示意图。
172.如图6所示,该推荐信息的处理装置200可以包括:第一接收模块210、确定模块220、发送模块230。
173.其中,第一接收模块210,用于服务端接收第一客户端发送的推荐信息获取请求,其中,推荐信息获取请求中包括声纹特征;
174.确定模块220,用于服务端确定声纹特征关联的推荐信息,其中,推荐信息是第一客户端和/或第二客户端发送给服务端的;
175.发送模块230,用于服务端向第一客户端发送推荐信息,以使第一客户端接收并展示推荐信息。
176.在一些实施例中,推荐信息获取请求中还包括人脸特征,确定模块220具体用于:
177.服务端确定声纹特征及人脸特征关联的推荐信息。
178.在一些实施例中,确定模块220具体用于:
179.确定声纹特征与声纹库中的每个候选声纹特征的相似度;
180.根据相似度,从候选声纹特征中选取目标声纹特征;
181.确定目标声纹特征关联的推荐信息。
182.在一些实施例中,该装置还包括:
183.第二接收模块,用于服务端接收第一客户端发送的更新后的推荐信息及声纹特征;
184.更新模块,用于服务端根据更新后的推荐信息,对声纹特征关联的推荐信息进行更新。
185.本公开实施例中的上述各模块的功能及具体实现原理,可参照上述各方法实施例,此处不再赘述。
186.本公开实施例的推荐信息的处理装置,本公开实施例中,服务端首先接收第一客户端发送的推荐信息获取请求,其中,推荐信息获取请求中包括声纹特征;然后确定声纹特征关联的推荐信息;最后向第一客户端发送推荐信息,以使第一客户端接收并展示推荐信息。本公开通过用户的声纹特征,将不同的客户端基于用户的使用数据生成的推荐信息进行关联,实现了在无需用户登录账号的前提下,不同的客户端向同一用户精准推荐兴趣内容,保证了用户隐私安全。
187.图7示出了适于用来实现本公开实施方式的示例性电子设备的框图。图7显示的电子设备700仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
188.如图7所示,电子设备700可以包括以下一个或多个组件:处理组件702,存储器704,电源组件706,多媒体组件708,音频组件710,输入/输出(i/o)的接口712,传感器组件714,以及通信组件716。
189.处理组件702通常控制电子设备700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
190.存储器704被配置为存储各种类型的数据以支持在电子设备700的操作。这些数据的示例包括用于在电子设备700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
191.电源组件706为电子设备700的各种组件提供电力。电源组件706可以包括电源管理系统,一个或多个电源,及其他与为电子设备700生成、管理和分配电力相关联的组件。
192.多媒体组件708包括在电子设备700和用户之间的提供一个输出接口的触控显示屏。在一些实施例中,触控显示屏可以包括液晶显示器(lcd)和触摸面板(tp)。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当电子设备700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
193.音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(mic),当电子设备700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。
194.在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
195.i/o接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
196.传感器组件714包括一个或多个传感器,用于为电子设备700提供各个方面的状态评估。例如,传感器组件714可以检测到电子设备700的打开/关闭状态,组件的相对定位,例如组件为电子设备700的显示器和小键盘,传感器组件714还可以检测电子设备700或电子设备700一个组件的位置改变,用户与电子设备700接触的存在或不存在,电子设备700方位或加速/减速和电子设备700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
197.通信组件716被配置为便于电子设备700和其他设备之间有线或无线方式的通信。电子设备700可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件716还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
198.在示例性实施例中,电子设备700可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
199.在示例性实施例中,还提供一种车辆,包括如前述实施例提出的电子设备。
200.在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器704,上述指令可由电子设备700的处理器720执行以完成上述方法。可选地,计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
201.在示例性实施例中,还提供一种计算机程序产品,包括计算机程序,计算机程序被
处理器执行时实现如前的方法。
202.本公开的技术方案,第一客户端首先获取用户语音数据;然后对用户语音数据进行解析,以确定用户语音数据的声纹特征;之后向服务端发送包含声纹特征的推荐信息获取请求,以使服务端确定与声纹特征关联的推荐信息,其中,推荐信息是第一客户端和/或第二客户端发送给服务端的;最后接收并展示服务端返回的推荐信息。本公开通过用户的声纹特征,将不同的客户端基于用户的使用数据生成的推荐信息进行关联,实现了在无需用户登录账号的前提下,不同的客户端向同一用户精准推荐兴趣内容,并保证了用户隐私安全。
203.在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
204.此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
205.流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本公开的实施例所属技术领域的技术人员所理解。
206.在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
207.应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技
术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
208.本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
209.此外,在本公开各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
210.上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本公开的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本公开的限制,本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。

技术特征:
1.一种推荐信息的处理方法,其特征在于,包括:第一客户端获取用户语音数据;所述第一客户端对所述用户语音数据进行解析,以确定所述用户语音数据的声纹特征;所述第一客户端向服务端发送包含所述声纹特征的推荐信息获取请求,以使所述服务端确定与所述声纹特征关联的推荐信息,其中,所述推荐信息是所述第一客户端和/或第二客户端发送给所述服务端的;所述第一客户端接收并展示所述服务端返回的所述推荐信息。2.如权利要求1所述的方法,其特征在于,还包括:所述第一客户端获取用户的面部图像数据;所述第一客户端对所述面部图像数据进行解析,以确定所述面部图像数据的人脸特征;所述第一客户端向服务端发送包含所述声纹特征的推荐信息获取请求,以使所述服务端确定与所述声纹特征关联的推荐信息,包括:所述第一客户端向所述服务端发送包含所述声纹特征及所述人脸特征的推荐信息获取请求,以使所述服务端确定与所述声纹特征及所述人脸特征关联的推荐信息。3.如权利要求1所述的方法,其特征在于,在所述第一客户端接收并展示所述服务端返回的所述推荐信息之后,还包括:响应于所述第一客户端接收到多媒体内容播放指令,记录多媒体播放数据;所述第一客户端根据所述多媒体播放数据,更新所述推荐信息;所述第一客户端将更新后的所述推荐信息及所述声纹特征发送给所述服务端。4.如权利要求1-3任一所述的方法,其特征在于,所述第一客户端对所述用户语音数据进行解析,以确定所述用户语音数据的声纹特征,包括:所述第一客户端对所述用户语音数据进行识别,以确定所述用户语音数据的文本内容;响应于所述用户语音数据的文本内容为唤醒指令,所述第一客户端对所述用户语音数据进行解析,以确定所述用户语音数据的声纹特征。5.一种推荐信息的处理方法,其特征在于,包括:服务端接收第一客户端发送的推荐信息获取请求,其中,所述推荐信息获取请求中包括声纹特征;所述服务端确定所述声纹特征关联的推荐信息,其中,所述推荐信息是所述第一客户端和/或第二客户端发送给所述服务端的;所述服务端向所述第一客户端发送所述推荐信息,以使所述第一客户端接收并展示所述推荐信息。6.如权利要求5所述的方法,其特征在于,所述推荐信息获取请求中还包括人脸特征,所述服务端确定所述声纹特征关联的推荐信息,包括:所述服务端确定所述声纹特征及所述人脸特征关联的推荐信息。7.如权利要求5所述的方法,其特征在于,所述服务端确定所述声纹特征关联的推荐信息,包括:
确定所述声纹特征与声纹库中的每个候选声纹特征的相似度;根据所述相似度,从所述候选声纹特征中选取目标声纹特征;确定所述目标声纹特征关联的推荐信息。8.如权利要求5-7任一所述的方法,其特征在于,还包括:所述服务端接收所述第一客户端发送的更新后的推荐信息及所述声纹特征;所述服务端根据所述更新后的推荐信息,对所述声纹特征关联的推荐信息进行更新。9.一种推荐信息的处理装置,其特征在于,包括:第一获取模块,用于第一客户端获取用户语音数据;第一确定模块,用于所述第一客户端对所述用户语音数据进行解析,以确定所述用户语音数据的声纹特征;第一发送模块,用于所述第一客户端向服务端发送包含所述声纹特征的推荐信息获取请求,以使所述服务端确定与所述声纹特征关联的推荐信息,其中,所述推荐信息是所述第一客户端和/或第二客户端发送给所述服务端的;第一接收模块,用于所述第一客户端接收并展示所述服务端返回的所述推荐信息。10.一种车辆,其特征在于,包括如权利要求9所述的装置。11.一种推荐信息的处理装置,其特征在于,包括:第一接收模块,用于服务端接收第一客户端发送的推荐信息获取请求,其中,所述推荐信息获取请求中包括声纹特征;确定模块,用于所述服务端确定所述声纹特征关联的推荐信息,其中,所述推荐信息是所述第一客户端和/或第二客户端发送给所述服务端的;发送模块,用于所述服务端向所述第一客户端发送所述推荐信息,以使所述第一客户端接收并展示所述推荐信息。12.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时,实现如权利要求1-8中任一项所述的方法。13.一种计算机可读存储介质,存储有计算机指令,其特征在于,所述计算机指令被处理器执行时实现如权利要求1-8中任一项所述的方法。14.一种计算机程序产品,其特征在于,包括计算机指令,所述计算机指令在被处理器执行时实现如权利要求1-8中任一项所述的方法。

技术总结
本公开提出一种推荐信息的处理方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及车联网、人工智能技术领域。该方法包括:第一客户端获取用户语音数据;所述第一客户端对所述用户语音数据进行解析,以确定所述用户语音数据的声纹特征;所述第一客户端向服务端发送包含所述声纹特征的推荐信息获取请求,以使所述服务端确定与所述声纹特征关联的推荐信息,其中,所述推荐信息是所述第一客户端和/或第二客户端发送给所述服务端的;所述第一客户端接收并展示所述服务端返回的所述推荐信息。本公开基于用户的声纹特征将不同的客户端生成的推荐信息进行关联,实现了不同的客户端向同一用户精准推荐兴趣内容。客户端向同一用户精准推荐兴趣内容。客户端向同一用户精准推荐兴趣内容。


技术研发人员:傅强 丁彬 帅一帆
受保护的技术使用者:北京罗克维尔斯科技有限公司
技术研发日:2022.03.09
技术公布日:2023/9/20
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐