一种目标语言模型确定方法及装置与流程
未命名
08-18
阅读:172
评论:0
1.本发明涉及语音识别技术领域,具体为一种目标语言模型确定方法及装置。
背景技术:
2.随着语音识别技术的发展,语音识别技术开始广泛应用于车载场景中。当前业界使用频率最高的语音识别技术方案基于声学模型和语言模型融合的体系进行构建,语言模型(languagemode l)简单来说就是一串词序列的概率分布。具体来说,语言模型的作用是为一个长度为m的文本确定一个概率分布p,表示这段文本存在的可能性。
3.在面对不同的使用者时,每个人的音色和发声不同,存在发声不清的现象,因此在同样的发音时,语音识别系统通常会识别多个不同的版本,且识别效率慢,同时外界有声音时,也会将此声音录入,降低识别的精准性和效率。因此,本领域技术人员提供了一种目标语言模型确定方法及装置,以解决上述背景技术中提出的问题。
技术实现要素:
4.(一)解决的技术问题
5.针对现有技术的不足,本发明提供了一种目标语言模型确定方法及装置,本发明将单个用户的信息和音色储存在独立的子数据库内部,能快速且精准的对用户发出的语音进行识别确定。
6.(二)技术方案
7.为实现以上目的,本发明通过以下技术方案予以实现:一种目标语言模型确定方法及装置,包括中央处理器、语音获取模块、训练模块和数据库,中央处理器后端固定连接有转换模块,转换模块后端固定连接有提取模块,提取模块后端固定连接有确定模块,语音获取模块后端固定连接有语言识别模块和音色识别模块,语言识别模块和音色识别模块与中央处理器相连,提取模块与数据库固定连接,数据库与训练模块相连。
8.优选的,语音获取模块用于将用户发出的语音进行获取提取,语言识别模块对用户发出的语音种类进行识别,音色识别模块用于对用户发出的语音音色进行识别。
9.优选的,训练模块包括训练文件、音色提取和生成模块,训练文件为单个用户信息,如通讯录名称信息与其它信息,音色提取模块用于对单个用户的声音音色进行提取,生成模块用于将同一用户提取的信息和音色生成一个语言模型。
10.优选的,数据库包括至少两个子数据库,用于储存不同用户生成的语言模型,如同一个用户信息、音色生成的模型储存在单独的子数据库内部,另一个用户的语言模型储存在另一个独立的子数据库内部。
11.优选的,转换模块用于将用户发出的除中文外的语种进行翻译转换,并将其转换为文本信息,提取模块用于将数据库中的子数据库数据进行提取并比对。
12.优选的,确定模块最终确定出用于发出的语音信息。
13.一种目标语言模型确定方法,包括以下步骤:
14.s1.用户发出语音请求
15.用户通过发出语音唤醒语音识别系统;
16.s2.语言、音色识别
17.通过语言识别模块对用户发出的语言种类进行识别,通过音色识别模块对用户发出的音色进行识别;
18.s3.语言转换
19.将识别的语言种类转换为文本信息,并将其进行分类;
20.s4.数据提取
21.通过数据提取模块将数据库内储存的数据进行提取,其中根据分类的语言文本和数据库中其中一个子数据库进行比对;
22.s5.语音确定
23.语言和子数据库中的数据比对成功后,即确定用户发出的语音。
24.音色识别具体流程包括以下步骤:
25.s1.语音输入
26.用户发出语音,其中对语音内的音色进行提取;
27.s2.音色识别
28.将提取的声音进行音色识别,判断出是否为杂音,当识别不是杂音时,则传输给下一单元,当识别为杂音时,将结束整个语音识别系统;
29.s3.音色匹配
30.将识别成功的音色与数据库内的单个子数据库进行比对,匹配出最合适的子数据库。
31.工作原理:该目标语言模型确定方法及装置使用时,用户通过发出语音唤醒语音识别系统,通过语言识别模块对用户发出的语言种类进行识别,通过音色识别模块对用户发出的音色进行识别,其中音色识别时,首先对语音内的音色进行提取,然后将提取的声音进行音色识别,判断出是否为杂音,当识别不是杂音时,则传输给下一单元,当识别为杂音时,将结束整个语音识别系统,最后将识别成功的音色与数据库内的单个子数据库进行比对,匹配出最合适的子数据库,将识别的语言种类转换为文本信息,并将其进行分类,通过数据提取模块将数据库内储存的数据进行提取,其中根据分类的语言文本和数据库中其中一个子数据库进行比对,语言和子数据库中的数据比对成功后,即确定用户发出的语音。
32.(三)有益效果
33.本发明提供了一种目标语言模型确定方法及装置。具备以下有益效果:
34.1、本发明提供了一种目标语言模型确定方法及装置,本发明可根据不同音色的用户建立独立的子数据库,当不同用户发出语言时,可根据用户的音色对不同子数据中的用户信息进行提取,实现快速对用户的语音进行确定。
35.2、本发明提供了一种目标语言模型确定方法及装置,本发明的数据库包括多个子数据库,单个用户可将信息(如通讯录名称信息与其它信息)和声音的音色形成一个独立的模型,然后储存于单独的子数据库内部,将多个用户的声音模型进行分开存放,其一,可快速对一个用户发出的声音进行提取,其二,只能对上传音色和用户信息的用户进行使用,不会受到外界不同声音的影响。
附图说明
36.图1为本发明的目标语言模型确定方法流程图;
37.图2为本发明的目标语言模型确定装置的结构图;
38.图3为本发明的训练模块和数据库具体结构示意图;
39.图4为本发明的音色识别流程图。
具体实施方式
40.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
41.如图1-4所示,本发明实施例提供一种目标语言模型确定方法及装置,包括中央处理器、语音获取模块、训练模块和数据库,中央处理器后端固定连接有转换模块,转换模块后端固定连接有提取模块,提取模块后端固定连接有确定模块,语音获取模块后端固定连接有语言识别模块和音色识别模块,语言识别模块和音色识别模块与中央处理器相连,提取模块与数据库固定连接,数据库与训练模块相连。
42.语音获取模块用于将用户发出的语音进行获取提取,语言识别模块对用户发出的语音种类进行识别,音色识别模块用于对用户发出的语音音色进行识别,训练模块包括训练文件、音色提取和生成模块,训练文件为单个用户信息,如通讯录名称信息与其它信息,音色提取模块用于对单个用户的声音音色进行提取,生成模块用于将同一用户提取的信息和音色生成一个语言模型,数据库包括至少两个子数据库,用于储存不同用户生成的语言模型,如同一个用户信息、音色生成的模型储存在单独的子数据库内部,另一个用户的语言模型储存在另一个独立的子数据库内部,转换模块用于将用户发出的除中文外的语种进行翻译转换,并将其转换为文本信息,提取模块用于将数据库中的子数据库数据进行提取并比对,确定模块最终确定出用于发出的语音信息。
43.一种目标语言模型确定方法,包括以下步骤:
44.s1.用户发出语音请求
45.用户通过发出语音唤醒语音识别系统;
46.s2.语言、音色识别
47.通过语言识别模块对用户发出的语言种类进行识别,通过音色识别模块对用户发出的音色进行识别;
48.s3.语言转换
49.将识别的语言种类转换为文本信息,并将其进行分类;
50.s4.数据提取
51.通过数据提取模块将数据库内储存的数据进行提取,其中根据分类的语言文本和数据库中其中一个子数据库进行比对;
52.s5.语音确定
53.语言和子数据库中的数据比对成功后,即确定用户发出的语音。
54.音色识别具体流程包括以下步骤:
55.s1.语音输入
56.用户发出语音,其中对语音内的音色进行提取;
57.s2.音色识别
58.将提取的声音进行音色识别,判断出是否为杂音,当识别不是杂音时,则传输给下一单元,当识别为杂音时,将结束整个语音识别系统;
59.s3.音色匹配
60.将识别成功的音色与数据库内的单个子数据库进行比对,匹配出最合适的子数据库。
61.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
技术特征:
1.一种目标语言模型确定装置,包括中央处理器、语音获取模块、训练模块和数据库,其特征在于:中央处理器后端固定连接有转换模块,所述转换模块后端固定连接有提取模块,所述提取模块后端固定连接有确定模块,所述语音获取模块后端固定连接有语言识别模块和音色识别模块,所述语言识别模块和音色识别模块与中央处理器相连,所述提取模块与数据库固定连接,所述数据库与训练模块相连。2.根据权利要求1所述的一种目标语言模型确定方法及装置,其特征在于:所述语音获取模块用于将用户发出的语音进行获取提取,所述语言识别模块对用户发出的语音种类进行识别,所述音色识别模块用于对用户发出的语音音色进行识别。3.根据权利要求1所述的一种目标语言模型确定方法及装置,其特征在于:所述训练模块包括训练文件、音色提取和生成模块,所述训练文件为单个用户信息,如通讯录名称信息与其它信息,所述音色提取模块用于对单个用户的声音音色进行提取,所述生成模块用于将同一用户提取的信息和音色生成一个语言模型。4.根据权利要求1所述的一种目标语言模型确定方法及装置,其特征在于:所述所述数据库包括至少两个子数据库,用于储存不同用户生成的语言模型,如同一个用户信息、音色生成的模型储存在单独的子数据库内部,另一个用户的语言模型储存在另一个独立的子数据库内部。5.根据权利要求1所述的一种目标语言模型确定方法及装置,其特征在于:所述转换模块用于将用户发出的除中文外的语种进行翻译转换,并将其转换为文本信息,所述提取模块用于将数据库中的子数据库数据进行提取并比对。6.根据权利要求1所述的一种目标语言模型确定方法及装置,其特征在于:所述确定模块最终确定出用于发出的语音信息。7.根据权利要求1所述的一种目标语言模型确定方法,其特征在于:包括以下步骤:s1.用户发出语音请求用户通过发出语音唤醒语音识别系统;s2.语言、音色识别通过语言识别模块对用户发出的语言种类进行识别,通过音色识别模块对用户发出的音色进行识别;s3.语言转换将识别的语言种类转换为文本信息,并将其进行分类;s4.数据提取通过数据提取模块将数据库内储存的数据进行提取,其中根据分类的语言文本和数据库中其中一个子数据库进行比对;s5.语音确定语言和子数据库中的数据比对成功后,即确定用户发出的语音。8.根据权利要求1所述的一种目标语言模型确定方法,其特征在于:所述音色识别具体流程包括以下步骤:s1.语音输入用户发出语音,其中对语音内的音色进行提取;s2.音色识别
将提取的声音进行音色识别,判断出是否为杂音,当识别不是杂音时,则传输给下一单元,当识别为杂音时,将结束整个语音识别系统;s3.音色匹配将识别成功的音色与数据库内的单个子数据库进行比对,匹配出最合适的子数据库。
技术总结
本发明提供一种目标语言模型确定方法及装置,涉及语音识别技术领域。该目标语言模型确定装置,包括中央处理器、语音获取模块、训练模块和数据库,中央处理器后端固定连接有转换模块,转换模块后端固定连接有提取模块,提取模块后端固定连接有确定模块,语音获取模块后端固定连接有语言识别模块和音色识别模块,语言识别模块和音色识别模块与中央处理器相连,提取模块与数据库固定连接,数据库与训练模块相连。本发明将单个用户的信息和音色储存在独立的子数据库内部,能快速且精准的对用户发出的语音进行识别确定。的语音进行识别确定。的语音进行识别确定。
技术研发人员:魏子轩 徐媛媛 周剑 楚建霞
受保护的技术使用者:苏州科帕特信息科技有限公司
技术研发日:2023.05.23
技术公布日:2023/8/16
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
