一种标准发音的生成方法及系统
未命名
10-08
阅读:57
评论:0

1.本技术涉及音频生成的领域,尤其是涉及一种标准发音的生成方法及系统。
背景技术:
2.随着人口流动性的增大,不论是本地人走出自己的家乡,进入到其他地区进行工作和生活,还是游客去其他地方进行出游,都面临着不同地区的人员有着不同的语言的发音,不同区域之间的人进行交流时难以听懂对方的语言。
3.相关技术中,在解决不同地区人员交流的问题时,多使用方言转文字的方式作为不同地区人员交流时的沟通桥梁,但是这种交流方式效率低下,且无法体现用户的声音特征及情绪特征,使用户之间的语言交流缺乏情感交流。
4.因此,如何生成具有准确用户特征及情绪的标准发音,以提高不同区域间人员之间语言交流及情感交流的效率成为了亟待解决的问题。
技术实现要素:
5.为了生成具有准确用户特征及情绪的标准发音,以提高不同区域人员之间语言交流及情感交流的效率,本技术提供了一种标准发音的生成方法及系统。
6.第一方面,本技术提供了一种标准发音的生成方法,采用如下技术方案:
7.获取用户说话的语音内容信息、声音特征以及语音情绪信息;
8.建立语言词典以及语言对应网,获取各个方言的词语内容及其含义,并将其与标准发音的词语建立对应关系;
9.将获取的用户的语音内容信息进行断句,并将断句后的语音内容信息进行词语拆解,理解每个方言词语的内容含义,并基于所述语言词典找到对应的标准发音的词语,对获取的标准发音的词语进行排列,获取标准发音语句,对其进行语法修饰后进行输出;
10.对获取的用户的声音特征进行分析,获取用户说话时的声音的响度特征、音调特征以及音色特征,并基于该特征对获取的标准发音语句进行特征调整,使标准发音语句符合用户的声音特征;
11.对获取的用户的语音情绪信息进行分析获取用户的情绪标签,根据方言词语的语音信息,判断获取用户的言语情绪,获取用户语音信息中的语气词的种类以及各种类语气词的使用频率,判断获取用户的语气情绪,根据情绪标签、言语情绪以及语气情绪判断获取用户的情绪特征;
12.基于用户的声音特征、情绪特征,对标准发音语句进行修饰调整,获取当前情境下包含用户情绪的具有用户声音特征的标准发音语句。
13.通过采用上述技术方案,对用户的语音内容进行分析替换,获取标准发音的语句,对用户的声音特征进行分析,获取用户声音的响度特征、音调特征以及音色特征,并使用这些特征对标准发音语句进行修饰,对用户的情绪信息进行分析,获取用户当前的情绪,并分析判断不同词语所包含的情绪的起伏,并对具有用户声音特征的标准发音语句进行情绪修
饰,获得包含用户情绪的具有用户声音特征的标准发音语句,提高不同区域人员之间语言交流及情感交流的效率。
14.优选的,所述建立语言词典以及语言对应网,获取各个方言的词语内容及其含义,并将其与标准发音的词语建立对应关系的步骤,包括:
15.建立语言词典,获取各个地区的方言词语内容及含义,并输入至语言词典中;
16.所述语言词典中的词条解释包含每个词语的使用场景,以及在不同场景中同一词语的含义;
17.建立语言对应网,根据获取的语言词典中每个词语的内容及含义,与标准发音词语建立对应关系。
18.通过采用上述技术方案,建立语言词典和语言对应网,能够在词语分析的过程中快速判断词语的含义并找到对应的标准发音的词语,提高了词语分析的速度。
19.优选的,所述将获取的用户的语音内容信息进行断句,并将断句后的语音内容信息进行词语拆解,理解每个方言词语的内容含义,并基于所述语言词典找到对应的标准发音的词语,对获取的标准发音的词语进行排列,获取标准发音语句,对其进行语法修饰后进行输出的步骤,包括:
20.获取用户使用的方言的语法标准以及标准发音的语法标准;
21.基于语言词典,将获取的用户的语音内容进行断句,获取方言语句,并进行词语拆解,分析判断每个方言词语的内容含义;
22.基于语言对应网以及方言词语的内容含义,查询每个方言词语对应的标准发音的词语,并对获取到的标准发音的词语进行组句,获取标准发音的初始语句;
23.基于方言的语法标准,对方言语句进行语法分析,判断方言语句的语法结构,获取方言语句的方言语法特征;
24.根据方言语法特征,与标准发音的语法标准进行对比,获取语法调整策略,并根据语法调整策略对获取的标准发音的初始语句进行语法调整,获取标准发音语句,并进行输出。
25.通过采用上述技术方案,利用断句和词语拆解的方式,对用户的语音内容进行详细的拆分和理解,并通过对比方言语法和标准发音的语法的标准来判断标准发音语句的组成内容以及语法结构,并获取标准发音语句,提升了对标准发音语句的判断及生成的准确性。
26.优选的,所述对获取的用户的声音特征进行分析,获取用户说话时的声音的响度特征、音调特征以及音色特征,并基于该特征对获取的标准发音语句进行特征调整,使标准发音语句符合用户的声音特征的步骤,包括:
27.获取用户的声音特征,分析用户说话时声音的平均响度以及在使用不同词语时每个词语的响度,获取用户声音的响度特征;
28.根据用户的声音特征,分析用户说话时声音的平均音调高度以及在使用不同词语时每个词语的音调,获取用户声音的音调特征;
29.根据用户的声音特征,分析用户在说话时声音的音色质感,获取用户声音的音色特征;
30.根据获取的用户声音的响度特征、音调特征以及音色特征,对获取的标准发音语
句进行特征修饰,获取符合用户声音特征的标准发音语句。
31.通过采用上述技术方案,对用户的声音特征进行分析,获取其响度特征、音调特征以及音色特征,并结合至标准发音语句中,使得标准发音语句具有用户的声音特征,提高了标准发音对用户的适配性。
32.优选的,所述对获取的用户的语音情绪信息进行分析获取用户的情绪标签,根据方言词语的语音信息,判断获取用户的言语情绪,获取用户语音信息中的语气词的种类以及各种类语气词的使用频率,判断获取用户的语气情绪,根据情绪标签、言语情绪以及语气情绪判断获取用户的情绪特征的步骤,包括:
33.对获取的用户的语音情绪信息进行分析,判断获取用户当前基本的情绪标签;
34.对获取的方言词语的语音信息进行判断,获取方言词语在方言语句中的音量变化信息、音调变化信息以及音长变化信息,并根据该变化信息获取用户的言语情绪;
35.获取用户语音信息中的语气词种类和使用频率,并对其进行分类,获取语气词的语气特征,判断并获取语气特征中的语气情绪;
36.将情绪标签、言语情绪以及语气情绪进行融合,获取用户的情绪特征。
37.通过采用上述技术方案,对用户的语言情绪信息进行分析获取情绪标签,对用户方言语句中不同词语的音量变化、音调变化以及音长变化获取用户的言语情绪,对用户使用的语气词进行分类和频率计算,获取用户的语气情绪,融合情绪标签、言语情绪以及语气情绪获取用户的情绪特征,提高了对用户情绪判断的精确度。
38.优选的,所述基于用户的声音特征、情绪特征,对标准发音语句进行修饰调整,获取当前情境下包含用户情绪的具有用户声音特征的标准发音语句的步骤,包括:
39.对标准发音语句的响度、音调及音色进行整体调整,对标准发音语句中词语的音量、音调及音长进行细节处理,获取具有用户声音特征的标准发音语句;
40.将用户的言语情绪融合进入具有用户声音特征的标准发音语句中,并根据语气情绪向具有用户声音特征的标准发音语句中添加语气词,经过调整后获取当前情境下包含用户情绪的具有用户声音特征的标准发音语句。
41.通过采用上述技术方案,将用户的声音特征以及情绪特征融合进入标准发音语句中,得到包含用户情绪的具有用户声音特征的标准发音语句,提高了对使用方言的用户交流过程中的沟通和情感表达效率。
42.第二方面,本技术提供了一种标准发音的生成系统,采用如下技术方案:
43.一种标准发音的生成系统,包括:
44.语音收集模块:对用户说话时的语音内容进行采集,并输出语音内容信息、声音特征以及语音情绪信息;
45.语言词典对应网模块:解释方言词语的内容及含义,并将方言词语与标准发音的词语建立对应关系,提供查询依据;
46.内容分析模块:配置为与所述语音收集模块以及所述语言词典对应网模块数据连接,所述内容分析模块对获取的语音内容信息进行分析,判断语音内容信息中的词语的内容含义,并根据语言词典对应网提供的依据查找标准发音的词语;
47.声音分析模块:配置为与所述语音收集模块数据连接,所述声音分析模块获取所述语音收集模块的声音特征并进行分析,并将分析结果进行输出;
48.情绪分析模块:配置为与所述语音收集模块数据连接,所述情绪分析模块接收到所述语音收集模块的语音情绪信息并进行分析,并将分析结果进行输出;
49.标准发音语句模块:配置为与所述内容分析模块数据连接,所述标准发音语句模块接收到所述内容分析模块查找到的标准发音的词语后根据标准发音的语法进行语句的组合,并将组合结果进行输出;
50.整体融合模块:配置为与所述标准发音语句模块、所述声音分析模块以及所述情绪分析模块数据连接,所述整体融合模块接收所述标准发音语句模块的标准发音语句,将所述声音分析模块的声音特征的分析结果以及所述情绪分析模块的语音情绪信息分析结果进行融合,获取包含用户情绪的具有用户声音特征的标准发音语句并进行输出。
51.优选的,所述内容分析模块包括词语分析单元以及词语查找单元;
52.所述词语分析单元根据获取的语音内容信息进行断句并进行词语拆解,根据语言词典分析判断每个方言词语的内容含义;
53.所述词语查找单元根据获取的每个方言词语的内容含义,通过语言对应网查找对应的标准发音的词语,并进行输出。
54.通过采用过上述技术方案,词语分析单元对获取的语音内容进行断句和词语拆解并分析,利用词语查找单元寻找相对应的标准发音的词语,提升了内容分析模块的工作效率。
55.优选的,所述声音分析模块包括响度分析单元、音调分析单元以及音色分析单元;
56.所述响度分析单元根据接收到的声音特征,提取用户声音的平均响度以及方言语句中不同词语的不同响度,输出用户声音的响度特征;
57.所述音调分析单元根据接收到的声音特征,提取用户声音的平均音调以及方言语句中不同词语的不同音调,输出用户声音的音调特征;
58.所述音色分析单元根据接收到的声音特征,提取用户声音的音色信息,并输出音色特征。
59.优选的,所述情绪分析模块包括言语情绪分析单元和语气情绪分析单元;
60.所述言语情绪分析单元接收所述语音收集模块的语音情绪信息,对用户语音中所用的词语的音量变化、音调变化以及音长变化进行判断分析,获取用户的言语情绪,并进行输出;
61.所述语气情绪分析单元对用户语音中的语气词进行分析判断,获取用户的语气情绪,并进行输出。
62.综上所述,本技术包括以下至少一种有益技术效果:
63.1.对用户的语音内容进行分析替换,获取标准发音的语句,对用户的声音特征进行分析,获取用户声音的响度特征、音调特征以及音色特征,并使用这些特征对标准发音语句进行修饰,对用户的情绪信息进行分析,获取用户当前的情绪,并分析判断不同词语所包含的情绪的起伏,并对具有用户声音特征的标准发音语句进行情绪修饰,获得包含用户情绪的具有用户声音特征的标准发音语句,提高不同区域人员之间语言交流及情感交流的效率。
64.2.建立语言词典和语言对应网,能够在词语分析的过程中快速判断词语的含义并找到对应的标准发音的词语,提高了词语分析的速度。
65.3.将用户的声音特征以及情绪特征融合进入标准发音语句中,得到包含用户情绪的具有用户声音特征的标准发音语句,提高了对使用方言的用户交流过程中的沟通和情感表达效率。
附图说明
66.图1是本实施例一种标准发音的生成方法的流程示意图;
67.图2是本实施例一种标准发音的生成方法中s200的子步骤流程图;
68.图3是本实施例一种标准发音的生成方法中s300的子步骤流程图;
69.图4是本实施例一种标准发音的生成方法中s400的子步骤流程图;
70.图5是本实施例一种标准发音的生成方法中s500的子步骤流程图;
71.图6是本实施例一种标准发音的生成方法中s600的子步骤流程图;
72.图7是本实施例一种标准发音的生成系统的模块框图。
73.附图标记说明:1、语音收集模块;2、语言词典对应网模块;3、内容分析模块;4、声音分析模块;5、情绪分析模块;6、标准发音语句模块;7、整体融合模块。
具体实施方式
74.以下结合附图1-7对本技术作进一步详细说明。
75.本技术实施例公开了一种标准发音的生成方法及系统。
76.本实施例中,参照图1,一种标准发音的生成方法,包括以下步骤:
77.s100:获取用户说话的语音内容信息、声音特征以及语音情绪信息;
78.s200:建立语言词典以及语言对应网,获取各个方言的词语内容及其含义,并将其与标准发音的词语建立对应关系;
79.s300:将获取的用户的语音内容信息进行断句,并将断句后的语音内容信息进行词语拆解,理解每个方言词语的内容含义,并基于所述语言词典找到对应的标准发音的词语,对获取的标准发音的词语进行排列,获取标准发音语句,对其进行语法修饰后进行输出;
80.s400:对获取的用户的声音特征进行分析,获取用户说话时的声音的响度特征、音调特征以及音色特征,并基于该特征对获取的标准发音语句进行特征调整,使标准发音语句符合用户的声音特征;
81.s500:对获取的用户的语音情绪信息进行分析获取用户的情绪标签,根据方言词语的语音信息,判断获取用户的言语情绪,获取用户语音信息中的语气词的种类以及各种类语气词的使用频率,判断获取用户的语气情绪,根据情绪标签、言语情绪以及语气情绪判断获取用户的情绪特征;
82.s600:基于用户的声音特征、情绪特征,对标准发音语句进行修饰调整,获取当前情境下包含用户情绪的具有用户声音特征的标准发音语句。
83.运用中,当用户使用方言进行对话时,可以获取到用户的声音信息,对用户的语音信息进行断句和词语拆解,利用语言词典以及语言对应网判断用户的方言词语的含义以及对应的标准发音的词语,将获取的标准发音的词语进行组合获取标准发音语句,接着对用户的声音特征进行分析,根据用户的声音特征对标准发音语句进行修饰,获取含有用户声
音特征的标准发音语句,再对用户当前的语音情绪信息进行分析,判断当前用户的情绪,并针对不同的词语进行特别调整,获取含用户情绪的具有用户声音特征的标准发音语句。
84.参照图2,步骤s200中,建立语言词典以及语言对应网,获取各个方言的词语内容及其含义,并将其与标准发音的词语建立对应关系,包括以下子步骤:
85.s201:建立语言词典,获取各个地区的方言词语内容及含义,并输入至语言词典中;
86.s202:所述语言词典中的词条解释包含每个词语的使用场景,以及在不同场景中同一词语的含义;
87.s203:建立语言对应网,根据获取的语言词典中每个词语的内容及含义,与标准发音词语建立对应关系。
88.运用中,语言词典包含了各地区的方言词语的内容和含义,方便用户说话过程中对用户的方言词语进行内容和含义的查找,并通过语言对应网查找与方言词语对应的标准发音的词语。
89.参照图3,步骤s300中,将获取的用户的语音内容信息进行断句,并将断句后的语音内容信息进行词语拆解,理解每个方言词语的内容含义,并基于所述语言词典找到对应的标准发音的词语,对获取的标准发音的词语进行排列,获取标准发音语句,对其进行语法修饰后进行输出,包括以下子步骤:
90.s301:获取用户使用的方言的语法标准以及标准发音的语法标准;
91.s302:基于语言词典,将获取的用户的语音内容进行断句,获取方言语句,并进行词语拆解,分析判断每个方言词语的内容含义;
92.s303:基于语言对应网以及方言词语的内容含义,查询每个方言词语对应的标准发音的词语,并对获取到的标准发音的词语进行组句,获取标准发音的初始语句;
93.s304:基于方言的语法标准,对方言语句进行语法分析,判断方言语句的语法结构,获取方言语句的方言语法特征;
94.s305:根据方言语法特征,与标准发音的语法标准进行对比,获取语法调整策略,并根据语法调整策略对获取的标准发音的初始语句进行语法调整,获取标准发音语句,并进行输出。
95.运用中,根据用户使用的方言的方言语法,将用户的语音内容信息进行断句和词语拆解,经过语言词典的解释后利用语言对应网找到每个方言词语对应的标准发音的词语,并根据标准发音的语法重新组装成句。
96.参照图4,步骤s400中,对获取的用户的声音特征进行分析,获取用户说话时的声音的响度特征、音调特征以及音色特征,并基于该特征对获取的标准发音语句进行特征调整,使标准发音语句符合用户的声音特征,包括以下子步骤:
97.s401:获取用户的声音特征,分析用户说话时声音的平均响度以及在使用不同词语时每个词语的响度,获取用户声音的响度特征;
98.s402:根据用户的声音特征,分析用户说话时声音的平均音调高度以及在使用不同词语时每个词语的音调,获取用户声音的音调特征;
99.s403:根据用户的声音特征,分析用户在说话时声音的音色质感,获取用户声音的音色特征;
100.s404:根据获取的用户声音的响度特征、音调特征以及音色特征,对获取的标准发音语句进行特征修饰,获取符合用户声音特征的标准发音语句。
101.运用中,对用户的声音特征进行分析,并将语音内容信息中的每个词语运用过程中的响度、音调和音色进行进一步的详细分析,分别获取用户声音的响度特征、音调特征以及音色特征,利用获取的用户声音的响度特征、音调特征以及音色特征,对标准发音语句进行特征上的修改。
102.参照图5,步骤s500中,对获取的用户的语音情绪信息进行分析获取用户的情绪标签,根据方言词语的语音信息,判断获取用户的言语情绪,获取用户语音信息中的语气词的种类以及各种类语气词的使用频率,判断获取用户的语气情绪,根据情绪标签、言语情绪以及语气情绪判断获取用户的情绪特征,包括以下子步骤:
103.s501:对获取的用户的语音情绪信息进行分析,判断获取用户当前基本的情绪标签;
104.s502:对获取的方言词语的语音信息进行判断,获取方言词语在方言语句中的音量变化信息、音调变化信息以及音长变化信息,并根据该变化信息获取用户的言语情绪;
105.s503:获取用户语音信息中的语气词种类和使用频率,并对其进行分类,获取语气词的语气特征,判断并获取语气特征中的语气情绪;
106.s504:将情绪标签、言语情绪以及语气情绪进行融合,获取用户的情绪特征。
107.运用中,当用户在说话的时候,利用用户的语音情绪信息,判断用户当前的情绪状态,判断用户的基本情绪背景,获取情绪标签,根据用户的语音中用词的音量、音调和音长的变化,分析用户的言语情绪,当用户使用语气词时,对用户的语气词使用情况进行监控和分类,获取用户的语气情绪,综合分析后获取用户的情绪特征。
108.参照图6,步骤s600中,基于用户的声音特征、情绪特征,对标准发音语句进行修饰调整,获取当前情境下包含用户情绪的具有用户声音特征的标准发音语句,包括以下子步骤:
109.s601:对标准发音语句的响度、音调及音色进行整体调整,对标准发音语句中词语的音量、音调及音长进行细节处理,获取具有用户声音特征的标准发音语句;
110.s602:将用户的言语情绪融合进入具有用户声音特征的标准发音语句中,并根据语气情绪向具有用户声音特征的标准发音语句中添加语气词,经过调整后获取当前情境下包含用户情绪的具有用户声音特征的标准发音语句。
111.运用中,当用户使用方言说话的时候,对用户的方言进行标准发音转换,并根据用户的声音特征进行修饰,使得转换的标准发音语句像是用户自己说的话,并根据用户的情绪对词语的音量、音调等进行调整,使得标准发音语句包含情绪。
112.基于上述一种标准发音的生成方法实施例的描述,本发明还公开了一种标准发音的生成系统:
113.参照图7,一种标准发音的生成系统,包括:语音收集模块1、语言词典对应网模块2、内容分析模块3、声音分析模块4、情绪分析模块5、标准发音语句模块6以及整体融合模块7。
114.语音收集模块1:对用户说话时的声音内容进行采集,并输出语音内容信息、声音特征以及语言情绪信息。
115.语言词典对应网模块2:与语音收集模块1数据连接,对方言词语的内容及含义进行解释,并通过语言对应网查找方言词语对应的标准发音的词语,并进行输出。
116.内容分析模块3:与语音收集模块1以及语言词典对应网模块2数据连接,包括词语分析单元以及词语查找单元,词语分析单元接收到语音收集模块1传输的语音内容信息后,对语音内容信息进行断句和词语拆解,分析方言词语的含义并进行输出,词语查找单元接收到方言词语的含义后通过语言对应网查询方言词语对应的标准发音词语,并进行输出。
117.运用中,内容分析模块3接收到语音内容信息后,对语音内容信息进行拆解分析,并利用语言词典对应网模块2提供的语言词典和语言对应网进行方言词语的解释以及查询相对应的标准发音的词语并进行输出。
118.声音分析模块4:与语音收集模块1数据连接,包括响度分析单元、音调分析单元以及音色分析单元,响度分析单元分析用户声音的平均响度以及每个方言词语的单独响度,获取用户声音的响度特征,音调分析单元分析用户声音的平均音调以及每个方言词语的单独音调,获取用户声音的音调特征,音色分析单元分析用户的音色构成,获取用户声音的音色特征,并将获取到的响度特征、音调特征以及音色特征进行输出。
119.运用中,声音分析模块4接收到用户的声音特征后,对用户的声音特征进行拆解分析,获取用户的响度特征、音调特征以及音色特征并进行输出。
120.情绪分析模块5:与语音收集模块1数据连接,包括言语情绪分析单元和语气分析单元,言语情绪分析单元接收到语音情绪信息后,对用户语音中的词语的音量、音调以及音长变化进行判断分析,获取用户的言语情绪,语气分析单元对用户使用的语气词进行收集分类,并判断不同的语气词所代表的情绪内容,获取用户的语气情绪,并将所获取的言语情绪以及语气情绪进行输出。
121.运用中,情绪分析模块5对用户说话的声音进行分析,获取用户言语中的音量、音调以及音长的变化情况判断用户的言语情绪,利用用户说话过程中使用的语气词的数量和种类判断用户的语气情绪,并将言语情绪和语气情绪进行输出。
122.标准发音语句模块6:为与内容分析模块3数据连接,标准发音语句模块6接收到内容分析模块3查找到的标准发音的词语后根据标准发音的语法进行语句的组合,并将组合结果进行输出。
123.整体融合模块7:为与标准发音语句模块6、声音分析模块4以及情绪分析模块5数据连接,整体融合模块7接收标准发音语句模块6的标准发音语句,将声音分析模块4的声音特征的分析结果以及情绪分析模块5的语音情绪信息分析结果进行融合,获取包含用户情绪的具有用户声音特征的标准发音语句并进行输出。
124.运用中,整体融合模块7将所获取的用户的声音特征和情绪特征融合进入标准发音语句中,使得标准发音语句具有用户的声音特征,且能表达出用户的情绪。
125.本技术实施例一种标准发音的生成方法及系统的实施原理为:首先,语音收集模块1收集用户说话时的语音,并输出语音内容信息、声音特征以及语音情绪信息,建立语言词典和语言对应网,语言词典用于对方言中的词语进行解释,语言对应网用于查询经过解释的方言词语对应的标准发音的词语。
126.内容分析模块3根据接收到的语音内容信息,对用户的语音内容进行断句和词语拆解,通过语言词典查找每个方言词语的内容含义,并使用语言对应网查询标准发音所对
应的词语并进行输出;声音分析模块4接收用户的声音特征并进行分析,判断用户说话的时候的响度大小、音调高低以及音色情况,输出用户声音的响度特征、音调特征以及音色特征并进行输出;情绪分析模块5根据接收到的语音情绪信息分析用户说话过程中的言语情绪,并根据所使用的语气词的数量和种类判断用户的语气情绪,并进行输出。
127.标准发音语句模块6接收到内容分析模块3查询到的用户所使用的方言对应的标准发音的词语后,根据方言语法标准判断整句的含义,并根据标准发音语法标准对接收到的标准发音词语进行重新组合和修饰,获取到语法正确且句子流畅的标准发音的语句,并进行输出。
128.整体融合模块7接收标准发音的语句后,将用户声音的响度特征、音调特征和音色特征以及用户的言语情绪和语气情绪融合进入标准发音的语句中,调整标准发音语句中的响度,以及每个词语的音调和音色,使其具有用户的声音特征,最后调整标准发音语句中凸显情绪的词语的音调等信息,添加语气词,使标准发音语句能够表达用户的情绪。
129.以上均为本技术的较佳实施例,并非依此限制本技术的保护范围,故:凡依本技术的结构、形状、原理所做的等效变化,均应涵盖于本技术的保护范围之内。
技术特征:
1.一种标准发音的生成方法,其特征在于,包括以下步骤:获取用户说话的语音内容信息、声音特征以及语音情绪信息;建立语言词典以及语言对应网,获取各个方言的词语内容及其含义,并将其与标准发音的词语建立对应关系;将获取的用户的语音内容信息进行断句,并将断句后的语音内容信息进行词语拆解,理解每个方言词语的内容含义,并基于所述语言词典找到对应的标准发音的词语,对获取的标准发音的词语进行排列,获取标准发音语句,对其进行语法修饰后进行输出;对获取的用户的声音特征进行分析,获取用户说话时的声音的响度特征、音调特征以及音色特征,并基于该特征对获取的标准发音语句进行特征调整,使标准发音语句符合用户的声音特征;对获取的用户的语音情绪信息进行分析获取用户的情绪标签,根据方言词语的语音信息,判断获取用户的言语情绪,获取用户语音信息中的语气词的种类以及各种类语气词的使用频率,判断获取用户的语气情绪,根据情绪标签、言语情绪以及语气情绪判断获取用户的情绪特征;基于用户的声音特征、情绪特征,对标准发音语句进行修饰调整,获取当前情境下包含用户情绪的具有用户声音特征的标准发音语句。2.根据权利要求1所述的一种标准发音的生成方法,其特征在于,所述建立语言词典以及语言对应网,获取各个方言的词语内容及其含义,并将其与标准发音的词语建立对应关系的步骤,包括:建立语言词典,获取各个地区的方言词语内容及含义,并输入至语言词典中;所述语言词典中的词条解释包含每个词语的使用场景,以及在不同场景中同一词语的含义;建立语言对应网,根据获取的语言词典中每个词语的内容及含义,与标准发音词语建立对应关系。3.根据权利要求1所述的一种标准发音的生成方法,其特征在于,所述将获取的用户的语音内容信息进行断句,并将断句后的语音内容信息进行词语拆解,理解每个方言词语的内容含义,并基于所述语言词典找到对应的标准发音的词语,对获取的标准发音的词语进行排列,获取标准发音语句,对其进行语法修饰后进行输出的步骤,包括:获取用户使用的方言的语法标准以及标准发音的语法标准;基于语言词典,将获取的用户的语音内容进行断句,获取方言语句,并进行词语拆解,分析判断每个方言词语的内容含义;基于语言对应网以及方言词语的内容含义,查询每个方言词语对应的标准发音的词语,并对获取到的标准发音的词语进行组句,获取标准发音的初始语句;基于方言的语法标准,对方言语句进行语法分析,判断方言语句的语法结构,获取方言语句的方言语法特征;根据方言语法特征,与标准发音的语法标准进行对比,获取语法调整策略,并根据语法调整策略对获取的标准发音的初始语句进行语法调整,获取标准发音语句,并进行输出。4.根据权利要求1所述的一种标准发音的生成方法,其特征在于,所述对获取的用户的声音特征进行分析,获取用户说话时的声音的响度特征、音调特征以及音色特征,并基于该
特征对获取的标准发音语句进行特征调整,使标准发音语句符合用户的声音特征的步骤,包括:获取用户的声音特征,分析用户说话时声音的平均响度以及在使用不同词语时每个词语的响度,获取用户声音的响度特征;根据用户的声音特征,分析用户说话时声音的平均音调高度以及在使用不同词语时每个词语的音调,获取用户声音的音调特征;根据用户的声音特征,分析用户在说话时声音的音色质感,获取用户声音的音色特征;根据获取的用户声音的响度特征、音调特征以及音色特征,对获取的标准发音语句进行特征修饰,获取符合用户声音特征的标准发音语句。5.根据权利要求1所述的一种标准发音的生成方法,其特征在于,所述对获取的用户的语音情绪信息进行分析获取用户的情绪标签,根据方言词语的语音信息,判断获取用户的言语情绪,获取用户语音信息中的语气词的种类以及各种类语气词的使用频率,判断获取用户的语气情绪,根据情绪标签、言语情绪以及语气情绪判断获取用户的情绪特征的步骤,包括:对获取的用户的语音情绪信息进行分析,判断获取用户当前基本的情绪标签;对获取的方言词语的语音信息进行判断,获取方言词语在方言语句中的音量变化信息、音调变化信息以及音长变化信息,并根据该变化信息获取用户的言语情绪;获取用户语音信息中的语气词种类和使用频率,并对其进行分类,获取语气词的语气特征,判断并获取语气特征中的语气情绪;将情绪标签、言语情绪以及语气情绪进行融合,获取用户的情绪特征。6.根据权利要求1所述的一种标准发音的生成方法,其特征在于,所述基于用户的声音特征、情绪特征,对标准发音语句进行修饰调整,获取当前情境下包含用户情绪的具有用户声音特征的标准发音语句的步骤,包括:对标准发音语句的响度、音调及音色进行整体调整,对标准发音语句中词语的音量、音调及音长进行细节处理,获取具有用户声音特征的标准发音语句;将用户的言语情绪融合进入具有用户声音特征的标准发音语句中,并根据语气情绪向具有用户声音特征的标准发音语句中添加语气词,经过调整后获取当前情境下包含用户情绪的具有用户声音特征的标准发音语句。7.一种标准发音的生成系统,其特征在于,包括:语音收集模块(1):对用户说话时的语音内容进行采集,并输出语音内容信息、声音特征以及语音情绪信息;语言词典对应网模块(2):解释方言词语的内容及含义,并将方言词语与标准发音的词语建立对应关系,提供查询依据;内容分析模块(3):配置为与所述语音收集模块(1)以及所述语言词典对应网模块(2)数据连接,所述内容分析模块(3)对获取的语音内容信息进行分析,判断语音内容信息中的词语的内容含义,并根据语言词典对应网提供的依据查找标准发音的词语;声音分析模块(4):配置为与所述语音收集模块(1)数据连接,所述声音分析模块(4)获取所述语音收集模块(1)的声音特征并进行分析,并将分析结果进行输出;情绪分析模块(5):配置为与所述语音收集模块(1)数据连接,所述情绪分析模块(5)接
收到所述语音收集模块(1)的语音情绪信息并进行分析,并将分析结果进行输出;标准发音语句模块(6):配置为与所述内容分析模块(3)数据连接,所述标准发音语句模块(6)接收到所述内容分析模块(3)查找到的标准发音的词语后根据标准发音的语法进行语句的组合,并将组合结果进行输出;整体融合模块(7):配置为与所述标准发音语句模块(6)、所述声音分析模块(4)以及所述情绪分析模块(5)数据连接,所述整体融合模块(7)接收所述标准发音语句模块(6)的标准发音语句,将所述声音分析模块(4)的声音特征的分析结果以及所述情绪分析模块(5)的语音情绪信息分析结果进行融合,获取包含用户情绪的具有用户声音特征的标准发音语句并进行输出。8.根据权利要求7所述的一种标准发音的生成系统,其特征在于:所述内容分析模块(3)包括词语分析单元以及词语查找单元;所述词语分析单元根据获取的语音内容信息进行断句并进行词语拆解,根据语言词典分析判断每个方言词语的内容含义;所述词语查找单元根据获取的每个方言词语的内容含义,通过语言对应网查找对应的标准发音的词语,并进行输出。9.根据权利要求7所述的一种标准发音的生成系统,其特征在于:所述声音分析模块(4)包括响度分析单元、音调分析单元以及音色分析单元;所述响度分析单元根据接收到的声音特征,提取用户声音的平均响度以及方言语句中不同词语的不同响度,输出用户声音的响度特征;所述音调分析单元根据接收到的声音特征,提取用户声音的平均音调以及方言语句中不同词语的不同音调,输出用户声音的音调特征;所述音色分析单元根据接收到的声音特征,提取用户声音的音色信息,并输出音色特征。10.根据权利要求7所述的一种标准发音的生成系统,其特征在于:所述情绪分析模块(5)包括言语情绪分析单元和语气情绪分析单元;所述言语情绪分析单元接收所述语音收集模块(1)的语音情绪信息,对用户语音中所用的词语的音量变化、音调变化以及音长变化进行判断分析,获取用户的言语情绪,并进行输出;所述语气情绪分析单元对用户语音中的语气词进行分析判断,获取用户的语气情绪,并进行输出。
技术总结
本申请公开了一种标准发音的生成方法及系统,涉及音频生成的领域,尤其是涉及一种标准发音的生成方法及系统,其包括获取用户说话的语音内容信息、声音特征以及语音情绪信息;建立语言词典以及语言对应网;将获取的用户的语音内容信息进行断句和词语拆解,获取标准发音语句后进行输出;对获取的用户的声音特征进行分析,获取声音的响度特征、音调特征以及音色特征;对获取的用户的语音情绪信息进行分析获取用户的情绪标签,判断获取用户的言语情绪,判断获取用户的语气情绪;获取当前情境下包含用户情绪的具有用户声音特征的标准发音语句。本申请具有生成准确用户特征及情绪的标准发音,以提高不同区域间人员之间语言交流及情感交流的效率的效果。情感交流的效率的效果。情感交流的效率的效果。
技术研发人员:刘斌
受保护的技术使用者:齐鲁师范学院
技术研发日:2023.05.17
技术公布日:2023/10/6
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/