一种基于预训练深度神经网络模型的语音回复方法与流程
未命名
08-14
阅读:66
评论:0

1.本发明涉及智能硬件技术领域,尤其涉及一种基于预训练深度神经网络模型的语音回复方法和装置、电子设备。
背景技术:
2.由于语音的便捷性,智能语音交互已经成为连接人与智能设备的主要方式。人机对话技术旨在让机器通过与人类的对话交互,以更自然友好的方式帮助用户高效地完成任务,以及与用户进行情感沟通。智能设备能够“听懂”用户的语言,执行相应的指令或者进行合理的回复。
3.人机对话是智能语音交互的重要支撑技术,在对用户的输入进行语音识别和内容理解后,通过人机对话技术管理对话状态、生成合理回复,以实现连续语音智能交互。而如何在人机对话过程中针对用户输入输出精准地回复语句是本领域技术人员研究的重要课题。
技术实现要素:
4.本发明实施例的目的是提供一种基于预训练深度神经网络模型的语音回复方法和装置、电子设备,能够解决现有人机对话方案中存在的回复语句不准确的问题。
5.为解决上述技术问题,本发明提供如下技术方案:
6.本发明实施例提供了一种基于预训练深度神经网络模型的语音回复方法,其中,该方法包括:
7.针对一轮与用户语音对话中的每次语音交互,采集用户输入的语音信号并生成语音输入;
8.通过语言处理系统对所述语音输入进行分析得到语音处理结果;
9.采用预先训练的概率神经网络,确定所述语音处理结果命中预设的各语言回复系统的概率;
10.基于各所述概率筛选出目标语言回复系统;
11.采用所述目标语言回复系统生成所述语音处理结果对应的回复语句,并反馈至用户。
12.可选地,所述预设的各语言回复系统包括以下至少之二:
13.基于匹配规则建立的第一语言回复系统、基于人工标注语料对预先构建的语言回复模型进行训练生成的第二语言回复系统以及基于深度学习网络建立的第三语言回复系统。
14.可选地,所述概率神经网络通过如下方式训练生成:
15.采用x个参数组成初始概率神经网络;
16.依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述初始概率神经网络的组成参数进行调整,直至调整后的x个所述参数满足
预设条件停止参数调整操作;
17.采用调整后的x个所述参数组成所述概率神经网络。
18.可选地,依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述初始概率神经网络的组成参数进行调整的步骤,包括:依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述x个参数中的y个参数进行调整,其中,x大于y。
19.可选地,依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述x个参数中的y个参数进行调整的步骤,包括:
20.对所述x个参数中的y个参数进行随机调整,并确定调整后的y个参数的参数变化趋势;
21.采用调整后的x个参数组成中间概率神经网络;
22.确定所述中间概率神经网络对应的第一总评价分;
23.确定所述第一总评价分相较于本次调整前的中间概率神经网络对应的第二总评价分的分数变化趋势;
24.基于所述参数变化趋势和所述分数变化趋势,确定下一次参数调整时的参数调整趋势。
25.可选地,基于所述参数变化趋势和所述分数变化趋势,确定下一次参数调整时的参数调整趋势的步骤,包括:
26.若所述分数变化趋势为分数上升,则确定下一次参数调整时的参数调整趋势与所述参数变化趋势同向;
27.若所述分数变化趋势为分数下降,则确定下一次参数调整时的参数调整趋势与所述参数变化趋势反向。
28.可选地,所述预设条件包括:所述中间概率神经网络对应的总评价分相较于本次调整前的中间概率神经网络对应的总评价分的分数上升值小于预设阈值。
29.本发明实施例还提供了一种基于预训练深度神经网络模型的语音回复装置,其中,所述装置包括:
30.采集模块,用于针对一轮与用户语音对话中的每次语音交互,采集用户输入的语音信号并生成语音输入;
31.第一调用模块,用于通过语言处理系统对所述语音输入进行分析得到语音处理结果;
32.第二调用模块,用于采用预先训练的概率神经网络,确定所述语音处理结果命中预设的各语言回复系统的概率;
33.筛选模块,用于基于各所述概率筛选出目标语言回复系统;
34.第三调用模块,用于采用所述目标语言回复系统生成所述语音处理结果对应的回复语句,并反馈至用户。
35.可选地,所述预设的各语言回复系统包括以下至少之二:
36.基于匹配规则建立的第一语言回复系统、基于人工标注语料对预先构建的语言回复模型进行训练生成的第二语言回复系统以及基于深度学习网络建立的第三语言回复系统。
37.可选地,所述装置还包括训练模块,用于训练生成概率神经网络,所述装置包括:
38.初始网络构建子模块,用于采用x个参数组成初始概率神经网络;
39.调整子模块,用于依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述初始概率神经网络的组成参数进行调整,直至调整后的x个所述参数满足预设条件停止参数调整操作;
40.目标网络生成子模块,用于采用调整后的x个所述参数组成所述概率神经网络。
41.可选地,所述调整子模块依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对初始概率神经网络的组成参数进行调整时,具体用于:依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述x个参数中的y个参数进行调整,其中,x大于y。
42.可选地,所述调整子模块依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述x个参数中的y个参数进行调整时,具体用于:
43.对所述x个参数中的y个参数进行随机调整,并确定调整后的y个参数的参数变化趋势;
44.采用调整后的x个参数组成中间概率神经网络;
45.确定所述中间概率神经网络对应的第一总评价分;
46.确定所述第一总评价分相较于本次调整前的中间概率神经网络对应的第二总评价分的分数变化趋势;
47.基于所述参数变化趋势和所述分数变化趋势,确定下一次参数调整时的参数调整趋势。
48.可选地,所述调整子模块基于所述参数变化趋势和所述分数变化趋势,确定下一次参数调整时的参数调整趋势时,具体用于:
49.若所述分数变化趋势为分数上升,则确定下一次参数调整时的参数调整趋势与所述参数变化趋势同向;
50.若所述分数变化趋势为分数下降,则确定下一次参数调整时的参数调整趋势与所述参数变化趋势反向。
51.可选地,所述预设条件包括:所述中间概率神经网络对应的总评价分相较于本次调整前的中间概率神经网络对应的总评价分的分数上升值小于预设阈值。
52.本发明实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现上述任意一种基于预训练深度神经网络模型的语音回复方法的步骤。
53.本发明实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现上述任意一种基于预训练深度神经网络模型的语音回复方法的步骤。
54.本发明实施例提供的基于预训练深度神经网络模型的语音回复方案,针对一轮与用户语音对话中的每次语音交互,采集用户输入的语音信号并生成语音输入;通过语言处理系统对语音输入进行分析得到语音处理结果;采用预先训练的概率神经网络,确定语音处理结果命中预设的各语言回复系统的概率;基于各概率筛选出目标语言回复系统;采用目标语言回复系统生成语音处理结果对应的回复语句,并反馈至用户。通过该基于预训练
深度神经网络模型的语音回复方案,采用预先训练的概率神经网络从多个语言回复系统筛选出最优的回复系统来生成回复语句,使得所生成的回复语句更加准确、合理。
附图说明
55.图1是表示本技术实施例的一种基于预训练深度神经网络模型的语音回复方法的步骤流程图;
56.图2是表示本技术实施例中的一种计算机设备的工作流程示意图;
57.图3是表示本技术实施例中的概率神经网络训练原理示意图;
58.图4是表示本技术实施例的一种基于预训练深度神经网络模型的语音回复装置的结构框图;
59.图5是表示本技术实施例的一种电子设备的结构框图。
具体实施方式
60.为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
61.下面结合附图,通过具体的实施例及其应用场景对本技术实施例提供的基于预训练深度神经网络模型的语音回复方案进行详细地说明。
62.如附图1所示,本技术实施例的基于预训练深度神经网络模型的语音回复方法包括以下步骤:
63.步骤101:针对一轮与用户语音对话中的每次语音交互,采集用户输入的语音信号并生成语音输入。
64.本技术实施例的基于预训练深度神经网络模型的语音回复方法通过计算机设备执行,计算机设备可以为服务器、电脑等具有分析功能的设备。计算机设备中的存储介质存储有语音回复执行流程对应的计算机程序,计算机设备的处理器运行存储介质中的程序执行语音回复流程。本技术计算机设备中除存储有语音回复执行流程对应的计算机程序外,还包括语言处理系统、概率神经网络以及多个语言回复系统。
65.附图2为计算机设备的工作流程示意图,如图2所示本技术实施例中用户与计算机设备各自作为独立的认知主体,通过自然语言进行双向信息交互。每轮对话包括多次语音交互过程,每次语音交互时计算机设备系统采集用户语音信号并生成语音输入,之后语言处理系统对语音输入进行分析处理得到语言处理结果,概率神经网络根据语言处理结果计算n个语言回复系统各自的概率,最终基于概率从n个语言回复系统中筛选出一个目标回复系统生成语言处理结果对应的回复语句,之后进入下一次交互重复上述过程,直至本轮对话结束。
66.步骤102:通过语言处理系统对语音输入进行分析得到语音处理结果。
67.在实际实现过程中,计算机设备系统接收到用户输入后,通过语言处理系统对用户的语音输入进行分析,确定用户语音输入包含的意图和所属的领域;基于意图和领域,从而确定用户语音输入对应的语音处理结果例如语义信息。
68.需要说明的是,语言处理系统对用户语音输入进行分析时可以采用任意适当的语义分析手段,本技术实施例中对此不作具体限制。
69.步骤103:采用预先训练的概率神经网络,确定语音处理结果命中预设的各语言回复系统的概率。
70.本技术实施例中在计算机设备中预设有多个语言回复系统,预设的各语言回复系统包括以下至少之二:基于匹配规则建立的第一语言回复系统、基于人工标注语料对预先构建的语言回复模型进行训练生成的第二语言回复系统以及基于深度学习网络建立的第三语言回复系统。
71.本技术实施例中以计算机设备中包括如下n个语言回复系统为例进行说明:
72.基于匹配规则建立的回复系统1即第一语言回复系统,利用人工定义的匹配规则根据输入语句生成回复语句,基于匹配规则的方法优点在于无需训练数据,并且对于能够覆盖的输入语句,生成回复语句的准确率高。但是,人工定义的匹配规则有限,难以覆盖广泛的输入语句。而且,不同领域需要针对性构建相应的匹配规则,为了保证语言回复系统正常运行,对这些匹配规则进行编写与维护是必要的,需要付出高昂的人工成本。
73.基于统计机器学习建立的回复系统2即第二语言回复系统,人工定义特征并构建语言回复模型,依靠大量的标注语料进行训练从而确定模型参数,训练后的模型能够生成输入语句对应的回复语句。统计机器学习方法的优点在于模型的健壮性较强,但其性能一定程度取决于训练数据的大小与质量,同时其需要人工进行特征工程。然而,统计学习方法在自然语言理解中虽然取得了良好的表现,但是其依赖于人工定义特征,需要使用额外的语义语法资源。
74.基于深度学习建立的回复系统3即第三语言回复系统,具有强大的健壮性,能够从海量数据中自动捕获并归纳有用的特征,避免人工构造特征导致的不确定性。构建深度学习网络模型,通过标注预料对其进行训练,训练后的模型能够生成输入语句对应的回复语句。
75.上述仅是列举了三个语言回复系统,在实际实现过程中并不限于此还可以为其他任意类型的语言回复系统。n的数量也不局限于3,还可以为2、4或者5等。
76.本步骤中需要借助预先训练的概率神经网络,确定预设的多个语言回复系统对语音处理结果命中概率值。因此,概率神经网络训练的方式直接影响该网络预测概率的精准度,下面对概率神经网络的大体训练过程进行说明:
77.初始的概率神经网络是由随机产生的x个参数组成的神经网络,之后对x个参数进行调整,计算调整后的x个参数的变化趋势,并将调整后的x个参数组成新的概率神经网络。如图3中的概率神经网络训练原理示意图所示,每次产生的概率神经网络用到计算设备系统中会得到一个总评价分,如果本次参数调整后总评价分上升,下一次调整x个参数就继续沿用这个趋势;反之,如果总评价分下降,下一次调整x个参数就沿用反向的趋势,直到总评价分趋于稳定没有明显上升,得到最终训练完成的概率神经网络。
78.步骤104:基于各概率筛选出目标语言回复系统。
79.基于概率神经网络确定语音处理结果命中预设的各语言回复系统的概率后,可将概率最高的语言回复系统确定为目标语言回复系统;也可以将概率大于预设概率阈值的语言回复系统中的任意之一确定为目标语言回复系统;还可以将概率大于预设概率阈值的语言回复系统中的特定类型的语言回复系统确定为目标语言回复系统。基于各概率筛选出目标语言回复系统的具体筛选规则可由本领域技术人员灵活设置,本技术实施例中对此不作
具体限制。
80.步骤105:采用目标语言回复系统生成语音处理结果对应的回复语句,并反馈至用户。
81.输出的回复语句可以为文本、语音或者二者结合。需要说明的是,回复语句的输出形式并不局限于文本、语音这两种形式或者组合,还可以结合其他形式例如图像、动画等组合输出,本技术中对回复语句的输出形式不作具体限制。
82.需要说明的是,步骤101至步骤105仅为一轮人机对话中的一次语音交互反馈回复语句的流程,在实际实现过程中,一轮人机对话需重复步骤101至步骤105中的流程依次为一轮对话中的每次语音交互确定并输出回复语句,直至一轮人机对话完成。
83.本技术实施例提供的基于预训练深度神经网络模型的语音回复方法,针对一轮与用户语音对话中的每次语音交互,采集用户输入的语音信号并生成语音输入;通过语言处理系统对语音输入进行分析得到语音处理结果;采用预先训练的概率神经网络,确定语音处理结果命中预设的各语言回复系统的概率;基于各概率筛选出目标语言回复系统;采用目标语言回复系统生成语音处理结果对应的回复语句,并反馈至用户。通过该基于预训练深度神经网络模型的语音回复方法,采用预先训练的概率神经网络从多个语言回复系统筛选出最优的回复系统来生成回复语句,使得所生成的回复语句更加准确、合理。
84.在一种可选地实施例中,概率神经网络可通过如下方式训练生成,包括如下子步骤:
85.子步骤一:采用x个参数组成初始概率神经网络。
86.子步骤二:依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对初始概率神经网络的组成参数进行调整,直至调整后的x个参数满足预设条件停止参数调整操作。
87.预设条件可以包括但不限于:中间概率神经网络对应的总评价分相较于本次调整前的中间概率神经网络对应的总评价分的分数上升值小于预设阈值。
88.对初始概率神经网络的组成参数进行调整时,可以对组成初始概率神经网络的x个参数中的全部或者部分进行调整。一种可行性地实现方式中,循环对初始概率神经网络的组成参数进行调整时,循环对x个参数中的y个参数进行调整,x大于y;对于x、y以及预设阈值的具体数值可由本领域技术人员根据需求灵活设置,本技术实施例中对此不作具体限制。
89.一种可行性地依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对x个参数中的y个参数进行调整的方式可以如下:
90.对x个参数中的y个参数进行随机调整,并确定调整后的y个参数的参数变化趋势;采用调整后的x个参数组成中间概率神经网络;确定中间概率神经网络对应的第一总评价分;确定第一总评价分相较于本次调整前的中间概率神经网络对应的第二总评价分的分数变化趋势;基于参数变化趋势和分数变化趋势,确定下一次参数调整时的参数调整趋势。
91.基于参数变化趋势和分数变化趋势,确定下一次参数调整时的参数调整趋势时,可采用如下调整规则:若分数变化趋势为分数上升,则确定下一次参数调整时的参数调整趋势与参数变化趋势同向;若分数变化趋势为分数下降,则确定下一次参数调整时的参数调整趋势与参数变化趋势反向。
92.子步骤三:采用调整后的x个参数组成概率神经网络。
93.本技术实施例中提供的概率神经网络训练方法,基于参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势来调整概率神经网络的参数,所训练得到的概率神经网络预测结果更加准确。
94.图4为实现本技术实施例的一种基于预训练深度神经网络模型的语音回复装置的结构框图。
95.本技术实施例提供的基于预训练深度神经网络模型的语音回复装置,所述装置包括如下功能模块:
96.采集模块401,用于针对一轮与用户语音对话中的每次语音交互,采集用户输入的语音信号并生成语音输入;
97.第一调用模块402,用于通过语言处理系统对所述语音输入进行分析得到语音处理结果;
98.第二调用模块403,用于采用预先训练的概率神经网络,确定所述语音处理结果命中预设的各语言回复系统的概率;
99.筛选模块404,用于基于各所述概率筛选出目标语言回复系统;
100.第三调用模块405,用于采用所述目标语言回复系统生成所述语音处理结果对应的回复语句,并反馈至用户。
101.可选地,所述预设的各语言回复系统包括以下至少之二:
102.基于匹配规则建立的第一语言回复系统、基于人工标注语料对预先构建的语言回复模型进行训练生成的第二语言回复系统以及基于深度学习网络建立的第三语言回复系统。
103.可选地,所述装置还包括训练模块,用于训练生成概率神经网络,所述装置包括:
104.初始网络构建子模块,用于采用x个参数组成初始概率神经网络;
105.调整子模块,用于依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述所述初始概率神经网络的组成参数进行调整,直至调整后的x个所述参数满足预设条件停止参数调整操作;
106.目标网络生成子模块,用于采用调整后的x个所述参数组成所述概率神经网络。
107.可选地,所述调整子模块依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对初始概率神经网络的组成参数进行调整时,具体用于:依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述x个参数中的y个参数进行调整,其中,x大于y。
108.可选地,所述调整子模块依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述x个参数中的y个参数进行调整时,具体用于:
109.对所述x个参数中的y个参数进行随机调整,并确定调整后的y个参数的参数变化趋势;
110.采用调整后的x个参数组成中间概率神经网络;
111.确定所述中间概率神经网络对应的第一总评价分;
112.确定所述第一总评价分相较于本次调整前的中间概率神经网络对应的第二总评价分的分数变化趋势;
113.基于所述参数变化趋势和所述分数变化趋势,确定下一次参数调整时的参数调整趋势。
114.可选地,所述调整子模块基于所述参数变化趋势和所述分数变化趋势,确定下一次参数调整时的参数调整趋势时,具体用于:
115.若所述分数变化趋势为分数上升,则确定下一次参数调整时的参数调整趋势与所述参数变化趋势同向;
116.若所述分数变化趋势为分数下降,则确定下一次参数调整时的参数调整趋势与所述参数变化趋势反向。
117.可选地,所述预设条件包括:所述中间概率神经网络对应的总评价分相较于本次调整前的中间概率神经网络对应的总评价分的分数上升值小于预设阈值。
118.本技术实施例提供的基于预训练深度神经网络模型的语音回复装置,针对一轮与用户语音对话中的每次语音交互,采集用户输入的语音信号并生成语音输入;通过语言处理系统对语音输入进行分析得到语音处理结果;采用预先训练的概率神经网络,确定语音处理结果命中预设的各语言回复系统的概率;基于各概率筛选出目标语言回复系统;采用目标语言回复系统生成语音处理结果对应的回复语句,并反馈至用户。通过该基于预训练深度神经网络模型的语音回复装置,采用预先训练的概率神经网络从多个语言回复系统筛选出最优的回复系统来生成回复语句,可使得生成的回复语句更加准确、合理。
119.本技术实施例中图4所示的语音回复装置可以是装置,也可以是服务器中的部件、集成电路、或芯片。本技术实施例中的图4所示的基于预训练深度神经网络模型的语音回复装置可以为具有操作系统的装置。该操作系统可以为安卓(android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本技术实施例不作具体限定。
120.本技术实施例提供的图4所示的语音回复装置能够实现图1的方法实施例实现的各个过程,为避免重复,这里不再赘述。
121.可选地,如图5所示,本技术实施例还提供一种电子设备500,包括处理器501,存储器502,存储在存储器502上并可在所述处理器501上运行的程序或指令,该程序或指令被处理器501执行时实现上述基于预训练深度神经网络模型的语音回复方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
122.需要注意的是,本技术实施例中的电子设备包括上述所述的服务器。
123.本技术实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述基于预训练深度神经网络模型的语音回复方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
124.其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(read-only memory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等。
125.本技术实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述语音回复方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
126.应理解,本技术实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
127.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
128.以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
技术特征:
1.一种基于预训练深度神经网络模型的语音回复方法,其特征在于,包括:针对一轮与用户语音对话中的每次语音交互,采集用户输入的语音信号并生成语音输入;通过语言处理系统对所述语音输入进行分析得到语音处理结果;采用预先训练的概率神经网络,确定所述语音处理结果命中预设的各语言回复系统的概率;基于各所述概率筛选出目标语言回复系统;采用所述目标语言回复系统生成所述语音处理结果对应的回复语句,并反馈至用户。2.根据权利要求1所述的方法,其特征在于,所述预设的各语言回复系统包括以下至少之二:基于匹配规则建立的第一语言回复系统、基于人工标注语料对预先构建的语言回复模型进行训练生成的第二语言回复系统以及基于深度学习网络建立的第三语言回复系统。3.根据权利要求1所述的方法,其特征在于,所述概率神经网络通过如下方式训练生成:采用x个参数组成初始概率神经网络;依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述初始概率神经网络的组成参数进行调整,直至调整后的x个所述参数满足预设条件停止参数调整操作;采用调整后的x个所述参数组成所述概率神经网络。4.根据权利要求1所述的方法,其特征在于,依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述初始概率神经网络的组成参数进行调整的步骤,包括:依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述x个参数中的y个参数进行调整,其中,x大于y。5.根据权利要求4所述的方法,其特征在于,依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述x个参数中的y个参数进行调整的步骤,包括:对所述x个参数中的y个参数进行随机调整,并确定调整后的y个参数的参数变化趋势;采用调整后的x个参数组成中间概率神经网络;确定所述中间概率神经网络对应的第一总评价分;确定所述第一总评价分相较于本次调整前的中间概率神经网络对应的第二总评价分的分数变化趋势;基于所述参数变化趋势和所述分数变化趋势,确定下一次参数调整时的参数调整趋势。6.根据权利要求5所述的方法,其特征在于,基于所述参数变化趋势和所述分数变化趋势,确定下一次参数调整时的参数调整趋势的步骤,包括:若所述分数变化趋势为分数上升,则确定下一次参数调整时的参数调整趋势与所述参数变化趋势同向;若所述分数变化趋势为分数下降,则确定下一次参数调整时的参数调整趋势与所述参
数变化趋势反向。7.根据权利要求3所述的方法,其特征在于,所述预设条件包括:所述中间概率神经网络对应的总评价分相较于本次调整前的中间概率神经网络对应的总评价分的分数上升值小于预设阈值。8.一种基于预训练深度神经网络模型的语音回复装置,其特征在于,包括:采集模块,用于针对一轮与用户语音对话中的每次语音交互,采集用户输入的语音信号并生成语音输入;第一调用模块,用于通过语言处理系统对所述语音输入进行分析得到语音处理结果;第二调用模块,用于采用预先训练的概率神经网络,确定所述语音处理结果命中预设的各语言回复系统的概率;筛选模块,用于基于各所述概率筛选出目标语言回复系统;第三调用模块,用于采用所述目标语言回复系统生成所述语音处理结果对应的回复语句,并反馈至用户。9.根据权利要求8所述的装置,其特征在于,所述预设的各语言回复系统包括以下至少之二:基于匹配规则建立的第一语言回复系统、基于人工标注语料对预先构建的语言回复模型进行训练生成的第二语言回复系统以及基于深度学习网络建立的第三语言回复系统。10.一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-7任一项所述的预训练深度神经网络模型的语言回复方法的步骤。
技术总结
本发明公开了一种基于预训练深度神经网络模型的语音回复方案,属于智能硬件技术领域,所述方法包括:针对一轮与用户语音对话中的每次语音交互,采集用户输入的语音信号并生成语音输入;通过语言处理系统对所述语音输入进行分析得到语音处理结果;采用预先训练的概率神经网络,确定所述语音处理结果命中预设的各语言回复系统的概率;基于各所述概率筛选出目标语言回复系统;采用所述目标语言回复系统生成所述语音处理结果对应的回复语句,并反馈至用户。本申请提供的基于预训练深度神经网络模型的语音回复方案,可使得生成的回复语句更加准确、合理。合理。合理。
技术研发人员:吴新开 李永伟 霍向
受保护的技术使用者:北京洛必德科技有限公司
技术研发日:2023.05.23
技术公布日:2023/8/9

版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/