语音信息的处理方法、装置、电子设备和可读存储介质与流程
未命名
07-23
阅读:62
评论:0

1.本技术属于语音处理领域,具体涉及一种语音信息的处理方法、装置、电子设备和可读存储介质。
背景技术:
2.用户使用语音聊天软件与其它用户可以通过语音信息进行通信,然发送的语音信息中除了包含用户声音信息之外,还会发送录制用户声音信息时所处环境的声音信息,也即背景声音信息。
3.用户声音信息中包含了用户的音调和音色,通过对其进行分析,能够得到当前用户的年龄、性别等信息。环境声音信息包含用户所处环境的信息,在将用户所处的环境的信息与用户的年龄、性别等信息综合分析的情况下,能够绘制用户的画像,危害用户的个人信息安全。
技术实现要素:
4.本技术实施例的目的是提供一种语音信息的处理方法、装置、电子设备和可读存储介质,能够解决用户声音信息中包含了用户的音调和音色,通过对其进行分析,能够得到当前用户的年龄、性别等信息。环境声音信息包含用户所处环境的信息,在将用户所处的环境的信息与用户的年龄、性别等信息综合分析的情况下,能够绘制用户的画像,危害用户的个人信息安全的问题。
5.第一方面,本技术实施例提供了一种语音信息的处理方法,该方法包括:获取语音信息,语音信息包括用户声音信息和背景声音信息;获取用户声音信息和背景声音信息之间的冲突系数;获取用户与第一用户群体之间的亲密系数;根据亲密系数和冲突系数确定语音信息的处理策略;向第一用户群体发送按照处理策略处理后的语音信息。
6.第二方面,本技术实施例提供了一种语音信息的处理装置,包括:第一获取模组,用于获取语音信息,语音信息包括用户声音信息和背景声音信息;第二获取模组,用于获取用户声音信息和背景声音信息之间的冲突系数;第三获取模组,用于获取用户与第一用户群体之间的亲密系数;处理模组,用于根据亲密系数和冲突系数确定语音信息的处理策略;发送模组,用于向第一用户群体发送按照处理策略处理后的语音信息。
7.第三方面,本技术实施例提供了一种电子设备,该电子设备包括处理器和存储器,存储器存储可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如第一方面的方法的步骤。
8.第四方面,本技术实施例提供了一种可读存储介质,可读存储介质上存储程序或指令,程序或指令被处理器执行时实现如第一方面的方法的步骤。
9.第五方面,本技术实施例提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面的方法。
10.第六方面,本技术实施例提供一种计算机程序产品,该程序产品被存储在存储介
质中,该程序产品被至少一个处理器执行以实现如第一方面的方法。
11.在本技术实施例中,在电子设备接收到需要向第一用户群体发送的语音信息的情况下,对语音信息进行解析,得到其包含的用户语音信息和背景语音信息。通过对用户声音信息和背景声音信息进行分析,进而确定用户声音信息和背景声音信息之间的冲突系数,结合获取得到的用户与第一用户群体之间的亲密系数来确定对语音信息的处理策略,进而将按照处理策略处理后的语音信息发送至第一用户群体。
12.在上述实施例中,确定处理策略的过程结合用户与第一用户群体之间的亲密关系的同时,还参考了用户声音信息和录制声音信息时的背景声音信息之间的冲突系数,因此,语音信息能够根据用户与第一用户群体之间的亲密关系以及语音信息中的用户声音信息和背景声音信息之间的冲突系数所确定的处理策略进行有针对性的处理,减少直接向第一用户群体发送语音信息时,可能存在的个人信息的泄露,提高了个人信息安全。
附图说明
13.图1是本技术中的一些实施例中语音信息的处理方法的流程示意图;
14.图2是本技术中的一些实施例中亲密系数和冲突系数确定语音信息的处理策略的示意图;
15.图3是本技术中的另一些实施例中语音信息的处理方法的流程示意图;
16.图4是本技术中的一些实施例中语音信息的处理装置的示意框图;
17.图5是本技术中的一些实施例中电子设备的示意框图;
18.图6是本技术中的一些实施例中电子设备的硬件结构示意图。
具体实施方式
19.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本技术保护的范围。
20.本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
21.下面结合附图,通过具体的实施例及其应用场景对本技术实施例提供的语音信息的处理方法、装置、电子设备和可读存储介质进行详细地说明。
22.在本技术中的一些实施例中,如图1所示,提出的语音信息的处理方法,包括:
23.步骤102,获取语音信息,语音信息包括用户声音信息和背景声音信息;
24.步骤104,获取用户声音信息和背景声音信息之间的冲突系数;
25.步骤106,获取用户与第一用户群体之间的亲密系数;
26.步骤108,根据亲密系数和冲突系数确定语音信息的处理策略;
27.步骤110,向第一用户群体发送按照处理策略处理后的语音信息。
28.在本技术实施例中,在电子设备接收到需要向第一用户群体发送的语音信息的情况下,对语音信息进行解析,得到其包含的用户语音信息和背景语音信息。通过对用户声音信息和背景声音信息进行分析,进而确定用户声音信息和背景声音信息之间的冲突系数,结合获取得到的用户与第一用户群体之间的亲密系数来确定对语音信息的处理策略,进而将按照处理策略处理后的语音信息发送至第一用户群体。
29.在上述实施例中,确定处理策略的过程结合用户与第一用户群体之间的亲密关系的同时,还参考了用户声音信息和录制声音信息时的背景声音信息之间的冲突系数,因此,语音信息能够根据用户与第一用户群体之间的亲密关系以及语音信息中的用户声音信息和背景声音信息之间的冲突系数所确定的处理策略进行有针对性的处理,减少直接向第一用户群体发送语音信息时,可能存在的个人信息的泄露,提高了个人信息安全。
30.在本技术中的一些实施例中,第一用户群体的表现形式可以是与用户进行语音信息通信的单一用户。
31.具体地,举例来说,电子设备的用户为第一用户,则与第一用户进行语音信息通信的第一用户群体为第二用户。
32.在本技术中的一些实施例中,第一用户群体的表现形式可以是与电子设备的用户进行语音通信的多个用户,其中,多个用户与电子设备的用户位于同一个虚拟聊天室内。
33.具体地,举例来说,在电子设备的通讯界面中,第一用户群体表示为一个群聊对象,例如第一用户群体为“摄影爱好交流群”、“二次元动漫交流群”等。
34.在本技术中的一些实施例中,用户采用电子设备来实现与位于第一用户群体中的其它用户的通信,在用户需要向第一用户群体发送语音的信息的情况下,调用电子设备的麦克风,以便利用麦克风录制用户所要说的内容,在电子设备在利用麦克风实现录制之后,采用本技术实施例所记载的语音信息的处理方法对录制得到的语音信息进行处理,以实现用户与第一用户群体之间的通信。
35.在上述实施例中,冲突系数和亲密系数的表现形式为数值,其中,冲突系数的取值范围可以根据设计需要进行选取,其具体选取范围在此不再进行赘述。
36.在上述实施例中,经过处理策略处理后的语音信息的表现形式可以是文字、也可以是基于语音信息所重新构建的新的语音信息,亦或是原语音信息。
37.在本技术中的一些实施例中,获取用户与第一用户群体之间的亲密系数,包括:获取用户与第一用户群体之间的会话数据;根据会话数据确定用户与第一用户群体之间的用户重叠度;根据会话数据确定会话内容亲密度;根据会话数据确定会话活跃度;根据用户重叠度、会话内容亲密度和会话活跃度中的至少一个确定亲密系数。
38.在本技术中的一些实施例中,根据会话数据确定用户与第一用户群体之间的用户重叠度,包括:确定第一用户群体中与用户属于好友关系的用户数量;根据用户数量与第一用户群体中的用户总数量确定用户重叠度。
39.在该实施例中,给出了用户重叠度、会话内容亲密度和会话活跃度的确定方式,并基于用户重叠度、会话内容亲密度和会话活跃度中的一个或多个来实现亲密系数的确定。
40.具体地,在亲密系数可以由用户重叠度、会话内容亲密度和会话活跃度中的任意一个来表示,也可以是由用户重叠度、会话内容亲密度和会话活跃度中的任意两个的乘积来表示,亦或用户重叠度、会话内容亲密度和会话活跃度三者的乘积来表示,其中,亲密系
数的计算方式可以根据实际使用需要进行选取,在此不再进行赘述。
41.在本技术中的一些实施例中,第一用户群体中与用户属于好友关系的用户构成第二用户群体。
42.通常情况下,对于关系比较亲密的两个用户来说,两者之间的好友的重叠度越高,也即两者的社交圈交集越大。基于此,本技术的实施例中,将用户的第二用户群体与第一用户群体进行重叠度的计算,以便判断第一用户群体与用户之间社交圈的亲密程度,并基于此来实现亲密系数的确定。
43.在此过程中,能够参考与用户的社交对象来实现亲密系数的确定,提高了亲密系数的可信度,从而确保了本技术实施例在实施过程的可信性。
44.具体地,用户重叠度等于第一用户群体与第二用户群体中重复用户的数量与第一用户群体中用户的总数量的比值。
45.例如,第一用户群体包含100个用户,第二用户群体包含70个用户,而第一用户群体中与第二用户群体中重复的用户数量为50,则用户重叠度的取值为50/100,也即,0.5。
46.在其中一个实施例中,在第一用户群体中的用户数量为1的情况下,也即,与用户的第一用户群体为单一用户的情况下,上文中的用户重叠度为1。
47.在本技术中的一些实施例中,用户与第一用户群体之间的会话数据可以是一段时间内的会话数据,其中,一段时间内可以是一周、30天、一个季度或年度,可以根据实际使用需要来选取时间。
48.其中,会话数据包括但不局限于用户进行通讯的通讯群、用户进行通讯的用户、用户对通讯的用户标注的标签、聊天内容、第一用户群体中群成员与用户的好友关系等。
49.其中,标签是指用户对通讯的用户的备注,具体地,备注的内容可以是好友或陌生人。
50.在本技术中的一些实施例中,根据会话数据确定会话内容亲密度,包括:根据会话数据确定用户与第一用户群体之间的会话总次数;根据会话数据确定用户与第一用户群体之间的目标会话类型的会话次数;根据会话次数与会话总次数的比值确定会话内容亲密度。
51.在该实施例中,在用户或第一用户群体中的群成员每发送一次消息,则记录会话总次数累计增加一次。
52.其中,用户或第一用户群体中的群成员发送的消息可以特指语音消息,还可以泛指为如文字、图像、表情、视频、标点符号等。
53.在上述实施例中,目标会话类型可以是亲密会话类型,具体地,在语音信息中包含亲密词汇的情况下,认为当前语音信息的会话类型为亲密会话类型。
54.具体地,亲密词汇可以是基于日常会话时所记录的具有表达亲密关系的词汇,其可以是预先标定得到的。
55.举例来说,亲密词汇可以是“亲爱的”、“兄弟”等称谓词汇,也可以是,“爱你”、“想你”等表达情感的词汇,亲密词汇具体所涉及到的词汇根据需要进行设置,在此不再赘述。
56.在本技术中的一些实施例中,根据会话数据确定会话活跃度,包括:根据会话数据确定用户与第一用户群体之间的累计会话天数;根据会话数据确定截止当日,用户与第一用户群体之间的建立会话通道的累计天数;根据累计会话天数与累计天数的比值确定会话
活跃度。
57.在该实施例中,由上文可知,会话数据中包含用户与第一用户群体之间的聊天记录,因此,可以通过聊天记录中每一条记录的发送或到达的时间作为统计依据,以天作为统计单位,统计用户与第一用户群体之间出现沟通的天数,也即上文中的累计会话天数。
58.举例来说,用户向第一用户群体发送的语音信息为“你在哪?,我在中央大街等你”,在电子设备将该条语音信息发送给第一用户群体的时候,电子设备会记录该条信息的发送时间,如2022年12月01日18时19分,则该发送时间对应的日期被记录为通话一天,也即2022年12月01日被标记为发生过会话,此时,会话天数增加1,此时,电子设备获取下一条信息的发送时间,以实现用户与第一用户群体之间的会话天数的统计。
59.在上述实施例中,在第一用户群体中包含不止一位群用户的情况下(不包含电子设备的用户),用户与第一用户群体之间的建立会话通道,可以理解为,用户添加到第一用户群体所在的聊天室、或用户建立第一用户群体的聊天室。
60.在上述实施例中,在第一用户群体中有且仅有一位群用户的情况下(不包含电子设备的用户),用户与第一用户群体之间的建立会话通道,可以理解为,用户与第一用户群体之间添加好友。
61.在上述实施例中,累计天数理解为,自用户与第一用户群体之间的建立会话通道的日期到当前日期之间的天数,通过计算用户与第一用户群体之间的会话天数与累计天数的比值,以便确定用户与第一用户群体之间的沟通频率,也即会话活跃度。
62.通常情况下,在沟通频率越高的情况下,也即会话活跃度越高的情况下,用户与第一用户群体之间越熟悉,因此,通过统计并分析得到会话活跃度,并以此来作为亲密系数或计算亲密系数的参数,以便提高亲密系数这一数值的可信度。
63.在本技术中的一些实施例中,获取用户声音信息和背景声音信息之间的冲突系数,包括:在用户声音信息对应的第一语义与背景声音信息对应的第二语义包含冲突词对的情况下,用户声音信息和背景声音信息之间的关系类型为冲突型,冲突系数为1;相对用户声音信息,在背景声音信息为负面评价的情况下,用户声音信息和背景声音信息之间的关系类型为干扰型,冲突系数为分贝比值的负值;相对用户声音信息,在背景声音信息为正面评价的情况下,用户声音信息和背景声音信息之间的关系类型为增强型,冲突系数为分贝比值;其中,分贝比值是背景声音信息的声音分贝数值与语音信息的声音分贝数值的比值。
64.在该实施例中,对用户声音信息和背景声音信息进行语义分析,得到用户声音信息所对应的第一语义以及背景声音信息所对应的第二语义,进而根据第一语义与第二语义信息判断是否包含冲突词对,从而实现冲突型的识别。
65.具体地,预先根据会话场景,构建冲突词对,若第一语义中包含冲突词对中的第一词,第二语义中包含与第一词互为冲突词对的第二词的情况下,认为用户声音信息和背景声音信息的关系类型为冲突型。
66.举例来说,在用户向第一用户群体发送的语音信息中的用户声音信息所解析得到的语义是“我在办公室加班”,而用户向第一用户群体发送的语音信息中的背景声音信息所解析得到的语义分析得到,用户当前所处的场景是“菜市场”,则办公室与菜市场之间属于冲突词对,此时,认为用户声音信息和背景声音信息的关系类型为冲突型。
67.又如,在用户向第一用户群体发送的语音信息中的用户声音信息所解析得到的语义是“我在学习”,而用户向第一用户群体发送的语音信息中的背景声音信息被语音识别到游戏的声音中呼喊“抓紧打怪”的声音,此时,学习和打怪之间属于冲突词对,此时,认为用户声音信息和背景声音信息的关系类型为冲突型。
68.在本技术中的一些实施例中,可以获取语音信息之前用户与第一用户群体之间的历史聊天记录,通过对历史聊天记录的上下文语义分析,以便确保用户声音信息和背景声音信息的关系类型确定的准确性。
69.在上述实施例中,通过获取相对用户声音信息,背景声音信息的评价,以便根据评价来实现关系类型的判断。
70.其中,负面评价是指背景声音信息的存在消减了用户声音信息的正确表达;基于此,正面评价是指背景声音信息的存在增强了用户声音信息的正确表达。
71.举例来说,负面评价是在地铁上聊天时,人群的声音掩盖了用户的说话声。具体地,在聊天记录上表现为“你那边太吵了,我听不清”等。
72.举例来说,正面评价是在聊天记录上的表现为“你听,那边是海浪的声音”等引导用户去听背景声。
73.在本技术中的一些实施例中,负面评价和正面评价可以利用训练好的网络模型评价得到的。
74.具体地,训练好的网络模型可以部署在电子设备上,也可以部署在服务器上。在训练好的网络模型部署在服务器上的情况下,电子设备将待发送至第一用户群体的语音信息发送至服务器,以供服务器上的网络模型对其进行评价,电子设备从服务器中得到评价结果,并基于评价结果来确定用户声音信息和背景声音信息的关系类型。
75.在本技术中的一些实施例中,语音信息的声音分贝数值可以理解为背景声音信息的声音分贝数值与用户声音信息的声音分贝数值的数值和。
76.具体地,举例来说,用户声音信息的声音分贝数值为60,背景声音信息的声音分贝数值为39,则语音信息的声音分贝数值为39与60的和值,也即99。
77.在本技术中的一些实施例中,根据亲密系数和冲突系数确定语音信息的处理策略,包括:在亲密系数小于第一阈值、且冲突系数在第二阈值与第三阈值之间的情况下,将用户声音信息转化为文本信息;在亲密系数大于或等于第一阈值、且冲突系数在第四阈值与第五阈值之间的情况下,保持语音信息不变;在亲密系数大于或等于第一阈值、且冲突系数在第二阈值与第四阈值之间的情况下,或在亲密系数大于或等于第一阈值、且冲突系数在第三阈值与第五阈值之间的情况下,执行以下一种或多种操作:修改用户声音信息中的冲突词对所对应的声音数据、修改背景声音信息中的冲突词对所对应的声音数据、删除背景声音信息、增大背景声音信息的声音分贝、降低用户声音信息的声音分贝、对用户声音信息和背景声音信息进行音色调整、对用户声音信息和背景声音信息进行音调平滑处理、将用户声音信息中的第一词语修改为第二词语;其中,第二词语的亲密性强于第一词语的亲密性,第二阈值、第四阈值、第五阈值和第三阈值依次减小。
78.在该实施例中,通过设置第一阈值、第二阈值、第三阈值、第四阈值和第五阈值,以便根据亲密系数和冲突系数,为待发送至第一用户群体的语音信息划分为三种情况并匹配对应的处理策略,在实际使用过程中,第一阈值、第二阈值、第三阈值、第四阈值和第五阈值
可以根据实际使用需要进行取值。
79.在上述实施例中,亲密系数的取值与亲密程度之间成正相关,具体地,在亲密系数的取值越大的情况下,亲密程度越高,对应的处理策略让第一用户群体感受越亲密温和,反之,在亲密系数的取值越小的情况下,亲密程度越低,对应的处理策略让第一用户群体感受越陌生。
80.具体地,在亲密系数小于第一阈值、且冲突系数在第二阈值与第三阈值之间的情况下(对应图2中的方案一),认为用户与第一用户群体比较陌生,此时为更好的保护用户的声纹,对语音信息进行最大程度的裁剪,将用户声音信息转化为文本信息,向第一用户群体发送文本信息,在此过程中,不再向第一用户群体发送语音信息,因此,可以减少直接向第一用户群体发送语音信息时,可能存在的个人信息的泄露,提高了个人信息安全。
81.此外,相对于直接向第一用户群体发送语音信息来说,发送文本信息可以减少用户流量的使用。
82.值得说明的时,对于在亲密系数小于第一阈值的情况下,待向第一用户群体发送的语音信息以文本信息的形式存储,以便减少电子设备中存储空间的占用。
83.在上述实施例中,第一用户群体能够将文本信息转化为对应的声音信息,在此过程中,可以不影响第一用户群体听取语音信息的听取体验。
84.其中,第一用户群体所使用的电子设备可以使用语音合成引擎生成文本信息转化为对应的声音信息。
85.在上述实施例中,在亲密系数大于或等于第一阈值、且冲突系数在第四阈值与第五阈值之间的情况下(对应图2中的方案三),认为用户与第一用户群体比较熟悉,但是亲密程度不高,对此情况下,用户的个人信息安全被泄露的风险较低,可以保持原语音信息发送,以便保持用户与第一用户群体的正常通信。
86.而在亲密系数大于或等于第一阈值、且冲突系数在第二阈值与第四阈值之间的情况下,或在亲密系数大于或等于第一阈值、且冲突系数在第三阈值与第五阈值之间的情况下(对应图2中的方案二),对用户声音信息和/或背景声音信息进行处理,以便维护用户与第一用户群体之间的会话体验,使得语音会话更加舒适。
87.在本技术中的一些实施例中,在亲密系数大于或等于第一阈值、且冲突系数在第二阈值与第四阈值之间的情况下,或在亲密系数大于或等于第一阈值、且冲突系数在第三阈值与第五阈值之间的情况下,电子设备仍向第一用户群体发送语音信息,而此时,向第一用户群体发送语音信息是电子设备调用语音合成引擎生成的语音信息。
88.具体地,举例来说,如图2所示,第一阈值的取值为0.5,第二阈值的取值为1,第三阈值的取值为-1,第四阈值的取值为0.5,第五阈值的取值为-0.5。
89.在本技术中的一些实施例中,在亲密系数大于或等于第一阈值、且冲突系数在第二阈值与第四阈值之间的情况下,或在亲密系数大于或等于第一阈值、且冲突系数在第三阈值与第五阈值之间的情况下:若用户声音信息和背景声音信息之间的关系类型为冲突型,修改用户声音信息和/或背景声音信息中的冲突词对所对应的声音数据;和/或删除背景声音信息;若用户声音信息和背景声音信息之间的关系类型为增强型,增大背景声音信息的声音分贝和/或降低用户声音信息的声音分贝;若用户声音信息和背景声音信息之间的关系类型为干扰型,执行以下至少一种:降低背景声音信息的声音分贝、增大用户声音信
息的声音分贝、删除背景声音信息。
90.在该实施例中,在关系类型为冲突型的情况下修改用户声音信息和/或背景声音信息中的冲突词对所对应的声音数据,可以是将冲突词对进行替换或删除,以此解决语义冲突。
91.在上述实施例中,在关系类型为冲突型的情况下,删除背景声音信息,可以从本质上消除冲突词对,以此解决语义冲突。
92.在上述实施例中,在关系类型为增强型的情况下,增大背景声音信息的声音分贝和/或降低用户声音信息的声音分贝,以便降低背景声音信息对用户声音信息的负面影响,使得用户声音信息更加突出。
93.而对于在关系类型为干扰型的情况下,通过降低背景声音信息的声音分贝,以便减少背景声音信息对用户声音信息的干扰,从而提高第一用户群体的收听体验。
94.具体地,在关系类型为干扰型的情况下,可以执行以下任意一种:降低背景声音信息的声音分贝、增大用户声音信息的声音分贝、删除背景声音信息。也可以是降低背景声音信息的声音分贝的同时,增大用户声音信息的声音分贝。亦或增大用户声音信息的声音分贝的同时,删除背景声音信息。
95.在本技术中的一些实施例中,音色和/或音调平滑处理包括如滤除掉用户声音信息和/或背景声音信息中的尖锐声音,使得第一用户群体播放的听起来更加舒服。
96.其中,尖锐声音是指用户声音信息和/或背景声音信息中突变部分。
97.在上述实施例中,第一词语和第二词语的文字含义相同,区别在于,第二词语的亲密性强于第一词语的亲密性,可以预先构建相同文字含义的词语库,并根据亲密性对词语库中的词语进行排序,以便在确定第一词语的情况下,根据词语库来选取第二词语。
98.在其中一个实施例中,如图3所示,语音信息的处理方法包括:
99.步骤302,本地端收集用户聊天信息;
100.步骤304,计算聊天群或聊天用户的亲密系数;
101.步骤306,语义解析用户声音信息和背景声音信息,计算冲突系数;
102.步骤308,计算变声结果,执行自动变声;
103.步骤310,合成新语音或原声发送;
104.步骤312,用户声音信息转化成文本,以语义文本发送;
105.步骤314,接收端接收文本信息后,以语音消息呈现,点击时合成语音播放。
106.本技术实施例提供的语音信息的处理方法,执行主体可以为语音信息的处理装置。本技术实施例中以语音信息的处理装置执行语音信息的处理方法为例,说明本技术实施例提供的语音信息的处理装置。
107.在本技术中的一些实施例中,如图4所示,提出的语音信息的处理装置400,包括:第一获取模组402,用于获取语音信息,语音信息包括用户声音信息和背景声音信息;第二获取模组404,用于获取用户声音信息和背景声音信息之间的冲突系数;第三获取模组406,用于获取用户与第一用户群体之间的亲密系数;处理模组408,用于根据亲密系数和冲突系数确定语音信息的处理策略;发送模组410,用于向第一用户群体发送按照处理策略处理后的语音信息。
108.在本技术实施例中,在电子设备接收到需要向第一用户群体发送的语音信息的情
况下,对语音信息进行解析,得到其包含的用户语音信息和背景语音信息。通过对用户声音信息和背景声音信息进行分析,进而确定用户声音信息和背景声音信息之间的冲突系数,结合获取得到的用户与第一用户群体之间的亲密系数来确定对语音信息的处理策略,进而将按照处理策略处理后的语音信息发送至第一用户群体。
109.在上述实施例中,确定处理策略的过程结合用户与第一用户群体之间的亲密关系的同时,还参考了用户声音信息和录制声音信息时的背景声音信息之间的冲突系数,因此,语音信息能够根据用户与第一用户群体之间的亲密关系以及语音信息中的用户声音信息和背景声音信息之间的冲突系数所确定的处理策略进行有针对性的处理,减少直接向第一用户群体发送语音信息时,可能存在的个人信息的泄露,提高了个人信息安全。
110.在本技术中的一些实施例中,第一用户群体的表现形式可以是与用户进行语音信息通信的单一用户。
111.在本技术中的一些实施例中,第一用户群体的表现形式可以是与电子设备的用户进行语音通信的多个用户,其中,多个用户与电子设备的用户位于同一个虚拟聊天室内。
112.在本技术中的一些实施例中,用户采用电子设备来实现与位于第一用户群体中的其它用户的通信,在用户需要向第一用户群体发送语音的信息的情况下,调用电子设备的麦克风,以便利用麦克风录制用户所要说的内容,在电子设备在利用麦克风实现录制之后,采用本技术实施例所记载的语音信息的处理方法对录制得到的语音信息进行处理,以实现用户与第一用户群体之间的通信。
113.在上述实施例中,冲突系数和亲密系数的表现形式为数值,其中,冲突系数的取值范围可以根据设计需要进行选取,其具体选取范围在此不再进行赘述。
114.在上述实施例中,经过处理策略处理后的语音信息的表现形式可以是文字、也可以是基于语音信息所重新构建的新的语音信息,亦或是原语音信息。
115.在本技术中的一些实施例中,第三获取模组406,具体用于:获取用户与第一用户群体之间的会话数据;根据会话数据确定用户与第一用户群体之间的用户重叠度;根据会话数据确定会话内容亲密度;根据会话数据确定会话活跃度;根据用户重叠度、会话内容亲密度和会话活跃度中的至少一个确定亲密系数。
116.在本技术中的一些实施例中,第三获取模组406,具体用于:确定第一用户群体中与用户属于好友关系的用户数量;根据用户数量与第一用户群体中的用户总数量确定用户重叠度。
117.在该实施例中,给出了用户重叠度、会话内容亲密度和会话活跃度的确定方式,并基于用户重叠度、会话内容亲密度和会话活跃度中的一个或多个来实现亲密系数的确定。
118.具体地,在亲密系数可以由用户重叠度、会话内容亲密度和会话活跃度中的任意一个来表示,也可以是由用户重叠度、会话内容亲密度和会话活跃度中的任意两个的乘积来表示,亦或用户重叠度、会话内容亲密度和会话活跃度三者的乘积来表示,其中,亲密系数的计算方式可以根据实际使用需要进行选取,在此不再进行赘述。
119.在本技术中的一些实施例中,第一用户群体中与用户属于好友关系的用户构成第二用户群体。
120.通常情况下,对于关系比较亲密的两个用户来说,两者之间的好友的重叠度越高,也即两者的社交圈交集越大。基于此,本技术的实施例中,将用户的第二用户群体与第一用
户群体进行重叠度的计算,以便判断第一用户群体与用户之间社交圈的亲密程度,并基于此来实现亲密系数的确定。
121.在此过程中,能够参考与用户的社交对象来实现亲密系数的确定,提高了亲密系数的可信度,从而确保了本技术实施例在实施过程的可信性。
122.具体地,用户重叠度等于第一用户群体与第二用户群体中重复用户的数量与第一用户群体中用户的总数量的比值。
123.在其中一个实施例中,在第一用户群体中的用户数量为1的情况下,也即,与用户的第一用户群体为单一用户的情况下,上文中的用户重叠度为1。
124.在本技术中的一些实施例中,用户与第一用户群体之间的会话数据可以是一段时间内的会话数据,其中,一段时间内可以是一周、30天、一个季度或年度,可以根据实际使用需要来选取时间。
125.其中,会话数据包括但不局限于用户进行通讯的通讯群、用户进行通讯的用户、用户对通讯的用户标注的标签、聊天内容、第一用户群体中群成员与用户的好友关系等。
126.其中,标签是指用户对通讯的用户的备注,具体地,备注的内容可以是好友或陌生人。
127.在本技术中的一些实施例中,第三获取模组406,具体用于:根据会话数据确定用户与第一用户群体之间的会话总次数;根据会话数据确定用户与第一用户群体之间的目标会话类型的会话次数;根据会话次数与会话总次数的比值确定会话内容亲密度。
128.在该实施例中,在用户或第一用户群体中的群成员每发送一次消息,则记录会话总次数累计增加一次。
129.其中,用户或第一用户群体中的群成员发送的消息可以特指语音消息,还可以泛指为如文字、图像、表情、视频、标点符号等。
130.在上述实施例中,目标会话类型可以是亲密会话类型,具体地,在语音信息中包含亲密词汇的情况下,认为当前语音信息的会话类型为亲密会话类型。
131.具体地,亲密词汇可以是基于日常会话时所记录的具有表达亲密关系的词汇,其可以是预先标定得到的。
132.在本技术中的一些实施例中,第三获取模组406,具体用于:根据会话数据确定用户与第一用户群体之间的累计会话天数;根据会话数据确定截止当日,用户与第一用户群体之间的建立会话通道的累计天数;根据累计会话天数与累计天数的比值确定会话活跃度。
133.在该实施例中,由上文可知,会话数据中包含用户与第一用户群体之间的聊天记录,因此,可以通过聊天记录中每一条记录的发送或到达的时间作为统计依据,以天作为统计单位,统计用户与第一用户群体之间出现沟通的天数,也即上文中的累计会话天数。
134.在上述实施例中,在第一用户群体中包含不止一位群用户的情况下(不包含电子设备的用户),用户与第一用户群体之间的建立会话通道,可以理解为,用户添加到第一用户群体所在的聊天室、或用户建立第一用户群体的聊天室。
135.在上述实施例中,在第一用户群体中有且仅有一位群用户的情况下(不包含电子设备的用户),用户与第一用户群体之间的建立会话通道,可以理解为,用户与第一用户群体之间添加好友。
136.在上述实施例中,累计天数理解为,自用户与第一用户群体之间的建立会话通道的日期到当前日期之间的天数,通过计算用户与第一用户群体之间的会话天数与累计天数的比值,以便确定用户与第一用户群体之间的沟通频率,也即会话活跃度。
137.通常情况下,在沟通频率越高的情况下,也即会话活跃度越高的情况下,用户与第一用户群体之间越熟悉,因此,通过统计并分析得到会话活跃度,并以此来作为亲密系数或计算亲密系数的参数,以便提高亲密系数这一数值的可信度。
138.在本技术中的一些实施例中,第二获取模组404,具体用于:在用户声音信息对应的第一语义与背景声音信息对应的第二语义包含冲突词对的情况下,用户声音信息和背景声音信息之间的关系类型为冲突型,冲突系数为1;相对用户声音信息,在背景声音信息为负面评价的情况下,用户声音信息和背景声音信息之间的关系类型为干扰型,冲突系数为分贝比值的负值;相对用户声音信息,在背景声音信息为正面评价的情况下,用户声音信息和背景声音信息之间的关系类型为增强型,冲突系数为分贝比值;其中,分贝比值是背景声音信息的声音分贝数值与语音信息的声音分贝数值的比值。
139.在该实施例中,对用户声音信息和背景声音信息进行语义分析,得到用户声音信息所对应的第一语义以及背景声音信息所对应的第二语义,进而根据第一语义与第二语义信息判断是否包含冲突词对,从而实现冲突型的识别。
140.具体地,预先根据会话场景,构建冲突词对,若第一语义中包含冲突词对中的第一词,第二语义中包含与第一词互为冲突词对的第二词的情况下,认为用户声音信息和背景声音信息的关系类型为冲突型。
141.在本技术中的一些实施例中,可以获取语音信息之前用户与第一用户群体之间的历史聊天记录,通过对历史聊天记录的上下文语义分析,以便确保用户声音信息和背景声音信息的关系类型确定的准确性。
142.在上述实施例中,通过获取相对用户声音信息,背景声音信息的评价,以便根据评价来实现关系类型的判断。
143.其中,负面评价是指背景声音信息的存在消减了用户声音信息的正确表达;基于此,正面评价是指背景声音信息的存在增强了用户声音信息的正确表达。
144.在本技术中的一些实施例中,负面评价和正面评价可以利用训练好的网络模型评价得到的。
145.具体地,训练好的网络模型可以部署在电子设备上,也可以部署在服务器上。在训练好的网络模型部署在服务器上的情况下,电子设备将待发送至第一用户群体的语音信息发送至服务器,以供服务器上的网络模型对其进行评价,电子设备从服务器中得到评价结果,并基于评价结果来确定用户声音信息和背景声音信息的关系类型。
146.在本技术中的一些实施例中,语音信息的声音分贝数值可以理解为背景声音信息的声音分贝数值与用户声音信息的声音分贝数值的数值和。
147.在本技术中的一些实施例中,处理模组408,具体用于:在亲密系数小于第一阈值、且冲突系数在第二阈值与第三阈值之间的情况下,将用户声音信息转化为文本信息;在亲密系数大于或等于第一阈值、且冲突系数在第四阈值与第五阈值之间的情况下,保持语音信息不变;在亲密系数大于或等于第一阈值、且冲突系数在第二阈值与第四阈值之间的情况下,或在亲密系数大于或等于第一阈值、且冲突系数在第三阈值与第五阈值之间的情况
下,执行以下一种或多种操作:修改用户声音信息中的冲突词对所对应的声音数据、修改背景声音信息中的冲突词对所对应的声音数据、删除背景声音信息、增大背景声音信息的声音分贝、降低用户声音信息的声音分贝、对用户声音信息和背景声音信息进行音色调整、对用户声音信息和背景声音信息进行音调平滑处理、将用户声音信息中的第一词语修改为第二词语;其中,第二词语的亲密性强于第一词语的亲密性,第二阈值、第四阈值、第五阈值和第三阈值依次减小。
148.在该实施例中,通过设置第一阈值、第二阈值、第三阈值、第四阈值和第五阈值,以便根据亲密系数和冲突系数,为待发送至第一用户群体的语音信息划分为三种情况并匹配对应的处理策略,在实际使用过程中,第一阈值、第二阈值、第三阈值、第四阈值和第五阈值可以根据实际使用需要进行取值。
149.在上述实施例中,亲密系数的取值与亲密程度之间成正相关,具体地,在亲密系数的取值越大的情况下,亲密程度越高,对应的处理策略让第一用户群体感受越亲密温和,反之,在亲密系数的取值越小的情况下,亲密程度越低,对应的处理策略让第一用户群体感受越陌生。
150.具体地,在亲密系数小于第一阈值的情况下,认为用户与第一用户群体比较陌生,此时为更好的保护用户的声纹,对语音信息进行最大程度的裁剪,将用户声音信息转化为文本信息,向第一用户群体发送文本信息,在此过程中,不再向第一用户群体发送语音信息,因此,可以减少直接向第一用户群体发送语音信息时,可能存在的个人信息的泄露,提高了个人信息安全。
151.此外,相对于直接向第一用户群体发送语音信息来说,发送文本信息可以减少用户流量的使用。
152.值得说明的时,对于在亲密系数小于第一阈值的情况下,待向第一用户群体发送的语音信息以文本信息的形式存储,以便减少电子设备中存储空间的占用。
153.在上述实施例中,第一用户群体能够将文本信息转化为对应的声音信息,在此过程中,可以不影响第一用户群体听取语音信息的听取体验。
154.其中,第一用户群体所使用的电子设备可以使用语音合成引擎生成文本信息转化为对应的声音信息。
155.在上述实施例中,在亲密系数大于或等于第一阈值、且冲突系数在第四阈值与第五阈值之间的情况下,认为用户与第一用户群体比较熟悉,但是亲密程度不高,对此情况下,用户的个人信息安全被泄露的风险较低,可以保持原语音信息发送,以便保持用户与第一用户群体的正常通信。
156.而在亲密系数大于或等于第一阈值、且冲突系数在第二阈值与第四阈值之间的情况下,或在亲密系数大于或等于第一阈值、且冲突系数在第三阈值与第五阈值之间的情况下,对用户声音信息和/或背景声音信息进行处理,以便维护用户与第一用户群体之间的会话体验,使得语音会话更加舒适。
157.在本技术中的一些实施例中,在亲密系数大于或等于第一阈值、且冲突系数在第二阈值与第四阈值之间的情况下,或在亲密系数大于或等于第一阈值、且冲突系数在第三阈值与第五阈值之间的情况下,电子设备仍向第一用户群体发送语音信息,而此时,向第一用户群体发送语音信息是电子设备调用语音合成引擎生成的语音信息。
158.在本技术中的一些实施例中,处理模组408,具体用于:若用户声音信息和背景声音信息之间的关系类型为冲突型,修改用户声音信息和/或背景声音信息中的冲突词对所对应的声音数据;和/或删除背景声音信息;若用户声音信息和背景声音信息之间的关系类型为增强型,增大背景声音信息的声音分贝和/或降低用户声音信息的声音分贝;若用户声音信息和背景声音信息之间的关系类型为干扰型,执行以下至少一种:降低背景声音信息的声音分贝、增大用户声音信息的声音分贝、删除背景声音信息。
159.在该实施例中,在关系类型为冲突型的情况下修改用户声音信息和/或背景声音信息中的冲突词对所对应的声音数据,可以是将冲突词对进行替换或删除,以此解决语义冲突。
160.在上述实施例中,在关系类型为冲突型的情况下,删除背景声音信息,可以从本质上消除冲突词对,以此解决语义冲突。
161.在上述实施例中,在关系类型为增强型的情况下,增大背景声音信息的声音分贝和/或降低用户声音信息的声音分贝,以便降低背景声音信息对用户声音信息的负面影响,使得用户声音信息更加突出。
162.而对于在关系类型为干扰型的情况下,通过降低背景声音信息的声音分贝,以便减少背景声音信息对用户声音信息的干扰,从而提高第一用户群体的收听体验。
163.具体地,在关系类型为干扰型的情况下,可以执行以下任意一种:降低背景声音信息的声音分贝、增大用户声音信息的声音分贝、删除背景声音信息。也可以是降低背景声音信息的声音分贝的同时,增大用户声音信息的声音分贝。亦或增大用户声音信息的声音分贝的同时,删除背景声音信息。
164.在本技术中的一些实施例中,音色和/或音调平滑处理包括如滤除掉用户声音信息和/或背景声音信息中的尖锐声音,使得第一用户群体播放的听起来更加舒服。
165.其中,尖锐声音是指用户声音信息和/或背景声音信息中突变部分。
166.在上述实施例中,第一词语和第二词语的文字含义相同,区别在于,第二词语的亲密性强于第一词语的亲密性,可以预先构建相同文字含义的词语库,并根据亲密性对词语库中的词语进行排序,以便在确定第一词语的情况下,根据词语库来选取第二词语。
167.本技术实施例中的语音信息的处理装置400可以是电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性的,电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置(mobile internet device,mid)、增强现实(augmented reality,ar)/虚拟现实(virtual reality,vr)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,umpc)、上网本或者个人数字助理(personal digital assistant,pda)等,还可以为服务器、网络附属存储器(network attached storage,nas)、个人计算机(personal computer,pc)、电视机(television,tv)、柜员机或者自助机等,本技术实施例不作具体限定。
168.本技术实施例中的语音信息的处理装置可以为具有操作系统的装置。该操作系统可以为安卓(android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本技术实施例不作具体限定。
169.本技术实施例提供的语音信息的处理装置能够实现图1或图3方法实施例实现的
各个过程,为避免重复,这里不再赘述。
170.可选地,如图5所示,本技术实施例还提供一种电子设备500,包括处理器502和存储器504,存储器504上存储有可在处理器502上运行的程序或指令,该程序或指令被处理器502执行时实现上述语音信息的处理方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
171.需要说明的是,本技术实施例中的电子设备包括上述的移动电子设备和非移动电子设备。
172.图6为实现本技术实施例的一种电子设备的硬件结构示意图。
173.该电子设备600包括但不限于:射频单元601、网络模块602、音频输出单元603、输入单元604、传感器605、显示单元606、用户输入单元607、接口单元608、存储器609、以及处理器610等部件。
174.本领域技术人员可以理解,电子设备600还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器610逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图6中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
175.处理器610,用于获取语音信息,语音信息包括用户声音信息和背景声音信息;获取用户声音信息和背景声音信息之间的冲突系数;获取用户与第一用户群体之间的亲密系数;根据亲密系数和冲突系数确定语音信息的处理策略;向第一用户群体发送按照处理策略处理后的语音信息。
176.在本技术中的一些实施例中,处理器610,用于:获取用户与第一用户群体之间的会话数据;根据会话数据确定用户与第一用户群体之间的用户重叠度;根据会话数据确定会话内容亲密度;根据会话数据确定会话活跃度;根据用户重叠度、会话内容亲密度和会话活跃度中的至少一个确定亲密系数。
177.在本技术中的一些实施例中,处理器610,用于:根据会话数据确定用户与第一用户群体之间的会话总次数;根据会话数据确定用户与第一用户群体之间的目标会话类型的会话次数;根据会话次数与会话总次数的比值确定会话内容亲密度。
178.在本技术中的一些实施例中,处理器610,用于:根据会话数据确定用户与第一用户群体之间的累计会话天数;根据会话数据确定截止当日,用户与第一用户群体之间的建立会话通道的累计天数;根据累计会话天数与累计天数的比值确定会话活跃度。
179.在本技术中的一些实施例中,处理器610,用于:确定第一用户群体中与用户属于好友关系的用户数量;根据用户数量与第一用户群体中的用户总数量确定用户重叠度。
180.在本技术中的一些实施例中,处理器610,用于:在用户声音信息对应的第一语义与背景声音信息对应的第二语义包含冲突词对的情况下,用户声音信息和背景声音信息之间的关系类型为冲突型,冲突系数为1;相对用户声音信息,在背景声音信息为负面评价的情况下,用户声音信息和背景声音信息之间的关系类型为干扰型,冲突系数为分贝比值的负值;相对用户声音信息,在背景声音信息为正面评价的情况下,用户声音信息和背景声音信息之间的关系类型为增强型,冲突系数为分贝比值,其中,分贝比值是背景声音信息的声音分贝数值与语音信息的声音分贝数值的比值。
181.在本技术中的一些实施例中,处理器610,用于:在亲密系数小于第一阈值、且冲突系数在第二阈值与第三阈值之间的情况下,将用户声音信息转化为文本信息;在亲密系数大于或等于第一阈值、且冲突系数在第四阈值与第五阈值之间的情况下,保持语音信息不变;在亲密系数大于或等于第一阈值、且冲突系数在第二阈值与第四阈值之间的情况下,或在亲密系数大于或等于第一阈值、且冲突系数在第三阈值与第五阈值之间的情况下,执行以下一种或多种操作:修改用户声音信息中的冲突词对所对应的声音数据、修改背景声音信息中的冲突词对所对应的声音数据、删除背景声音信息、增大背景声音信息的声音分贝、降低用户声音信息的声音分贝、对用户声音信息和背景声音信息进行音色调整、对用户声音信息和背景声音信息进行音调平滑处理、将用户声音信息中的第一词语修改为第二词语;其中,第二词语的亲密性强于第一词语的亲密性,第二阈值、第四阈值、第五阈值和第三阈值依次减小。
182.在本技术中的一些实施例中,处理器610,用于:若用户声音信息和背景声音信息之间的关系类型为冲突型,修改用户声音信息和/或背景声音信息中的冲突词对所对应的声音数据;和/或删除背景声音信息;若用户声音信息和背景声音信息之间的关系类型为增强型,增大背景声音信息的声音分贝和/或降低用户声音信息的声音分贝;若用户声音信息和背景声音信息之间的关系类型为干扰型,执行以下至少一种:降低背景声音信息的声音分贝、增大用户声音信息的声音分贝、删除背景声音信息。
183.应理解的是,本技术实施例中,输入单元604可以包括图形处理器(graphics processing unit,gpu)6041和麦克风6042,图形处理器6041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元606可包括显示面板6061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板6061。用户输入单元607包括触控面板6071以及其他输入设备6072中的至少一种。触控面板6071,也称为触摸屏。触控面板6071可包括触摸检测装置和触摸控制器两个部分。其他输入设备6072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
184.存储器609可用于存储软件程序以及各种数据。存储器609可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器609可以包括易失性存储器或非易失性存储器,或者,存储器609可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasable prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,ram),静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic ram,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddrsdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synch link dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,drram)。本技术实施例中的存储器609包括但不限于这些和任意其它适合类型的存储器。
185.处理器610可包括一个或多个处理单元;可选的,处理器610集成应用处理器和调
制解调处理器,其中,应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器610中。
186.本技术实施例还提供一种可读存储介质,可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述语音信息的处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
187.其中,处理器为上述实施例中的电子设备中的处理器。可读存储介质,包括计算机可读存储介质,如计算机只读存储器rom、随机存取存储器ram、磁碟或者光盘等。
188.本技术实施例另提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现上述语音信息的处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
189.应理解,本技术实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
190.本技术实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如上述语音信息的处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
191.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本技术实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
192.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本技术各个实施例的方法。
193.上面结合附图对本技术的实施例进行了描述,但是本技术并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本技术的启示下,在不脱离本技术宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本技术的保护之内。
技术特征:
1.一种语音信息的处理方法,其特征在于,包括:获取语音信息,所述语音信息包括用户声音信息和背景声音信息;获取所述用户声音信息和所述背景声音信息之间的冲突系数;获取用户与第一用户群体之间的亲密系数;根据所述亲密系数和所述冲突系数确定所述语音信息的处理策略;向所述第一用户群体发送按照所述处理策略处理后的所述语音信息。2.根据权利要求1所述的语音信息的处理方法,其特征在于,所述获取用户与第一用户群体之间的亲密系数,包括:获取用户与所述第一用户群体之间的会话数据;根据所述会话数据确定所述用户与所述第一用户群体之间的用户重叠度;根据所述会话数据确定会话内容亲密度;根据所述会话数据确定会话活跃度;根据所述用户重叠度、所述会话内容亲密度和所述会话活跃度中的至少一个确定所述亲密系数。3.根据权利要求2所述的语音信息的处理方法,其特征在于,所述根据所述会话数据确定会话内容亲密度,包括:根据所述会话数据确定用户与所述第一用户群体之间的会话总次数;根据所述会话数据确定用户与所述第一用户群体之间的目标会话类型的会话次数;根据所述会话次数与所述会话总次数的比值确定所述会话内容亲密度。4.根据权利要求2所述的语音信息的处理方法,其特征在于,所述根据所述会话数据确定会话活跃度,包括:根据所述会话数据确定用户与所述第一用户群体之间的累计会话天数;根据所述会话数据确定截止当日,用户与所述第一用户群体之间的建立会话通道的累计天数;根据所述累计会话天数与所述累计天数的比值确定所述会话活跃度。5.根据权利要求2所述的语音信息的处理方法,其特征在于,所述根据所述会话数据确定所述用户与所述第一用户群体之间的用户重叠度,包括:确定所述第一用户群体中与用户属于好友关系的用户数量;根据所述用户数量与所述第一用户群体中的用户总数量确定所述用户重叠度。6.根据权利要求1至5中任一项所述的语音信息的处理方法,其特征在于,所述获取所述用户声音信息和所述背景声音信息之间的冲突系数,包括:在所述用户声音信息对应的第一语义与所述背景声音信息对应的第二语义包含冲突词对的情况下,所述用户声音信息和所述背景声音信息之间的关系类型为冲突型,所述冲突系数为1;相对所述用户声音信息,在所述背景声音信息为正面评价的情况下,所述用户声音信息和所述背景声音信息之间的关系类型为增强型,所述冲突系数为分贝比值;相对所述用户声音信息,在所述背景声音信息为负面评价的情况下,所述用户声音信息和所述背景声音信息之间的关系类型为干扰型,所述冲突系数为分贝比值的负值;其中,所述分贝比值是所述背景声音信息的声音分贝数值与所述语音信息的声音分贝
数值的比值。7.根据权利要求1所述的语音信息的处理方法,其特征在于,所述根据所述亲密系数和所述冲突系数确定所述语音信息的处理策略,包括:在所述亲密系数小于第一阈值、且所述冲突系数在第二阈值与第三阈值之间的情况下,将所述用户声音信息转化为文本信息;在所述亲密系数大于或等于第一阈值、且所述冲突系数在第四阈值与第五阈值之间的情况下,保持所述语音信息不变;在所述亲密系数大于或等于第一阈值、且所述冲突系数在第二阈值与第四阈值之间的情况下,或在所述亲密系数大于或等于第一阈值、且所述冲突系数在第三阈值与第五阈值之间的情况下,执行以下一种或多种操作:修改所述用户声音信息中的冲突词对所对应的声音数据、修改所述背景声音信息中的冲突词对所对应的声音数据、删除所述背景声音信息、增大所述背景声音信息的声音分贝、降低所述用户声音信息的声音分贝、对所述用户声音信息和所述背景声音信息进行音色调整、对所述用户声音信息和所述背景声音信息进行音调平滑处理、将所述用户声音信息中的第一词语修改为第二词语;其中,所述第二词语的亲密性强于所述第一词语的亲密性,所述第二阈值、所述第四阈值、所述第五阈值和所述第三阈值依次减小。8.根据权利要求7所述的语音信息的处理方法,其特征在于,在所述亲密系数大于或等于第一阈值、且所述冲突系数在第二阈值与第四阈值之间的情况下,或在所述亲密系数大于或等于第一阈值、且所述冲突系数在第三阈值与第五阈值之间的情况下:若所述用户声音信息和所述背景声音信息之间的关系类型为冲突型,修改所述用户声音信息和/或所述背景声音信息中的冲突词对所对应的声音数据;和/或删除所述背景声音信息;若所述用户声音信息和所述背景声音信息之间的关系类型为增强型,增大所述背景声音信息的声音分贝和/或降低所述用户声音信息的声音分贝;若所述用户声音信息和所述背景声音信息之间的关系类型为干扰型,执行以下至少一种:降低所述背景声音信息的声音分贝、增大所述用户声音信息的声音分贝、删除所述背景声音信息。9.一种语音信息的处理装置,其特征在于,包括:第一获取模组,用于获取语音信息,所述语音信息包括用户声音信息和背景声音信息;第二获取模组,用于获取所述用户声音信息和所述背景声音信息之间的冲突系数;第三获取模组,用于获取用户与第一用户群体之间的亲密系数;处理模组,用于根据所述亲密系数和所述冲突系数确定所述语音信息的处理策略;发送模组,用于向所述第一用户群体发送按照所述处理策略处理后的所述语音信息。10.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至8中任一项所述的方法的步骤。11.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至8中任一项所述的方法的步骤。
技术总结
本申请公开了一种语音信息的处理方法、装置、电子设备和可读存储介质,属于语音处理领域。其中,处理方法包括:获取语音信息,语音信息包括用户声音信息和背景声音信息;获取用户声音信息和背景声音信息之间的冲突系数;获取用户与第一用户群体之间的亲密系数;根据亲密系数和冲突系数确定语音信息的处理策略;向第一用户群体发送按照处理策略处理后的语音信息。息。息。
技术研发人员:袁俊淼
受保护的技术使用者:维沃移动通信有限公司
技术研发日:2023.04.25
技术公布日:2023/7/22
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/