声纹鉴定报告生成方法、装置及计算机可读介质与流程

未命名 07-14 阅读:64 评论:0


1.本技术涉及声纹鉴定技术领域,更具体地,涉及一种声纹鉴定报告生成方法、装置及计算机可读介质。


背景技术:

2.当前,在声纹鉴定业务中,声纹鉴定报告一般由人工撰写,并严重依赖鉴定人员的专业知识和实战经验,使得实际业务中出具鉴定报告需要花费的时间长,质量参差不齐。


技术实现要素:

3.本技术提出了一种声纹鉴定报告生成方法、装置及计算机可读介质,以改善上述缺陷。
4.第一方面,本技术实施例提供了一种声纹鉴定报告生成方法,所述方法包括:基于预先获取的多个检材特征音段和多个样本特征音段,获取多个图谱信息,所述图谱信息包括语谱信息和频谱信息,用于表征所述检材特征音段和所述样本特征音段的声纹特征;生成每个所述图谱信息的描述信息,所述描述信息用于描述所述检材特征音段和所述样本特征音段的比对结果;基于自然语言处理模型,对多个所述描述信息进行统计分析,生成总结信息,所述总结信息用于评价检材语音和样本语音的同一性;基于预设的格式模板,根据所述图谱信息、所述描述信息及所述总结信息生成声纹鉴定报告。
5.第二方面,本技术实施例还提供了一种声纹识别装置,所述装置包括:图谱信息生成单元,描述信息生成单元,总结信息生成单元,鉴定报告生成单元。图谱信息生成单元,用于基于预先获取的多个检材特征音段和多个样本特征音段,获取多个图谱信息,所述图谱信息包括语谱信息和频谱信息,用于表征所述检材特征音段和所述样本特征音段的声纹特征;描述信息生成单元,用于生成每个所述图谱信息的描述信息,所述描述信息用于描述所述检材特征音段和所述样本特征音段的比对结果;总结信息生成单元,用于基于自然语言处理模型,对多个所述描述信息进行统计分析,生成总结信息,所述总结信息用于评价检材语音和样本语音的同一性;鉴定报告生成单元,用于基于预设的格式模板,根据所述图谱信息、所述描述信息及所述总结信息生成声纹鉴定报告。
6.第三方面,本技术实施例还提供了计算机可读介质,所述计算机可读介质存储有处理器可执行的程序代码,所述程序代码被所述处理器执行时使所述处理器执行上述方法。
7.本技术提供的声纹鉴定报告生成方法、装置及计算机可读介质,所述方法包括:基于预先获取的多个检材特征音段和多个样本特征音段,获取多个图谱信息,所述图谱信息包括语谱信息和频谱信息,用于表征所述检材特征音段和所述样本特征音段的声纹特征,然后,生成每个所述图谱信息的描述信息,所述描述信息用于描述所述检材特征音段和所述样本特征音段的比对结果,然后,基于自然语言处理模型,对多个所述描述信息进行统计分析,生成总结信息,所述总结信息用于评价检材语音和样本语音的同一性,最后,基于预
设的格式模板,根据所述图谱信息、所述描述信息及所述总结信息生成声纹鉴定报告。因此,本方法能够基于预先获取的检材特征音段和样本特征音段,自动获取表征检材和样本特征音段的声纹特征的图谱信息,描述检材和样本特征音段的比对结果的描述信息,和评价检材和样本语音同一性的总结信息,最后,基于一定的格式模板,将所述图谱信息、所述描述信息及所述总结信息整理得到声纹鉴定报告,也就是说,本方法能够基于检材语音和样本语音自动生成声纹鉴定报告,大大节约了人工撰写鉴定报告的人力和时间。
8.本技术实施例的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本技术实施例而了解。本技术实施例的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
9.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
10.图1示出了本技术一实施例提供的声纹鉴定报告生成方法的方法流程图。
11.图2示出了本技术另一实施例提供的声纹鉴定报告生成方法的方法流程图。
12.图3示出了本技术提供的训练获取声纹特征画像的方法流程图。
13.图4示出了本技术提供的由声纹特征画像估算第二声纹特征的方法流程图。
14.图5示出了本技术另一实施例提供的声纹鉴定报告生成方法的方法流程图。
15.图6示出了本技术提供的对声纹特征画像更新的方法流程图。
16.图7示出了本技术一实施例提供的声纹识别装置的单元框图。
17.图8示出了本技术一实施例提供的可穿戴设备的示意图。
18.图9示出了本技术实施例的存储单元的示意图。
具体实施方式
19.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
20.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
21.声纹鉴定,又称语音同一性鉴定,指通过比较、分析,对声像资料记载的语音的同一性问题所进行的科学判断,被广泛应用于司法实践中,通过对案件中的录音资料进行检验,来判断确认录音的身份信息。
22.在涉及语音同一性鉴定的法庭辩护中,呈交给法庭的书面材料主要包含语音同一性的检验记录和鉴定文书两个文档。这两个文档中附有大量图谱素材,同时包含对这些图谱素材进行阐述和论证的文字内容,以及关于语音同一性的鉴定结论。图谱素材可以源自声纹鉴定工作站,由工作站对检材语音和样本语音经过相关处理后提取得到,进一步转换成图片及表格的形式,但是,鉴定文书中的文字内容需要人工基于检验记录,对大量的图谱素材进行整理分析后撰写而成,这需要大量的专业知识和实战经验。实际法庭事务中出现的声纹鉴定报告,大多出自业内专家之手。
23.因此,为了克服上述缺陷,本技术实施例提供了一种声纹鉴定报告生成方法、装置及计算机可读介质,基于预先获取的多个检材特征音段和多个样本特征音段,获取多个图谱信息,所述图谱信息包括语谱信息和频谱信息,用于表征所述检材特征音段和所述样本特征音段的声纹特征,然后,生成每个所述图谱信息的描述信息,所述描述信息用于描述所述检材特征音段和所述样本特征音段的比对结果,然后,基于自然语言处理模型,对多个所述描述信息进行统计分析,生成总结信息,所述总结信息用于评价检材语音和样本语音的同一性,最后,基于预设的格式模板,根据所述图谱信息、所述描述信息及所述总结信息生成声纹鉴定报告。本技术实施例提供的声纹鉴定报告生成方法,通过基于检材语音和样本语音自动生成声纹鉴定报告,大大节约了人工撰写鉴定报告的人力和时间,为打击日益增长的电诈案件提供了便捷、高效的手段。
24.请参阅图1,图1示出了本技术实施例提供的一种声纹鉴定报告生成方法,具体地,该方法包括:s101至s104。
25.s101:基于预先获取的多个检材特征音段和多个样本特征音段,获取多个图谱信息,所述图谱信息包括语谱信息和频谱信息,用于表征所述检材特征音段和所述样本特征音段的声纹特征。
26.检材与样本:对于需要进行语音同一性鉴定的两个音频,将身份信息已经明确的音频称为样本,身份待定需要明确的称为检材。
27.作为一种实施方式,所述图谱信息包括语谱信息和频谱信息,具体地,所述语谱信息可以包括检材语音语谱图和样本语音语谱图,所述频谱信息可以包括频谱图及对频谱图进行测量后得到的数据表格,其中,语谱图的横坐标为时间,纵坐标为频率,坐标点反映了语音信号的能量;频谱图的横坐标为频率,纵坐标为振幅,坐标点反映了语音信号的频率和能量的关系;数据表格包括对频谱图进行测量后获得的特征参数数据。进一步地,所述语谱图包括所述检材语音和所述样本语音中完整音节的所有帧的共振峰频率数据,所述频谱图为所述检材特征音段和所述样本特征音段的光标选取帧的线性预测编码(linear predictive coding,lpc)频谱曲线,所述特征参数可以为共振峰中心频率、共振峰强度和共振峰带宽。
28.作为一种实施方式,所述图谱信息可以基于所述检材特征音段和样本特征音段,通过图谱算法获取并转化为图片或表格保存下来,具体地,所述图谱算法可以为傅里叶变换算法。
29.s102:生成每个所述图谱信息的描述信息,所述描述信息用于描述所述检材特征音段和所述样本特征音段的比对结果。
30.作为一种实施方式,所述生成每个所述图谱信息的描述信息,即基于所述检材语
音语谱图、所述样本语音语谱图、所述频谱图和所述数据表格,在进行检材特征音段和样本特征音段的声学特征比对后,生成相应的比对结果分析文字。具体地,所述描述信息可以包括共振峰轨迹走势比对结果的描述信息,和共振峰参数比对结果的描述信息。
31.作为一种实施方式,所述描述信息的生成方法,可以是基于比对结果,根据预先设定的规则生成描述信息。具体地,通过预先设定条件阈值,当比对结果达到条件阈值,就加入与条件相关的描述信息,比对结果符合什么样的阈值条件,就添加什么样的描述信息,例如,当获取到共振峰轨迹走势的比对结果,将该比对结果与设定的共振峰轨迹走势条件阈值做比较判断,得出共振峰轨迹走势是基本相同,还是基本不相同,若共振峰轨迹走势基本相同,进一步地,再将共振峰轨迹走势的比对结果与设定的共振峰轨迹走势相似度条件阈值做比较判断,从而获得共振峰轨迹走势是符合完全一致、基本一致或比较接近的相似等级中的哪个等级,最终基于上述结论,生成共振峰轨迹走势的描述信息。
32.作为一种实施方式,所述描述信息的生成方法,可以是通过预先获取的描述信息生成模型分析处理所述图谱信息来自动生成描述信息,其中,所述描述信息生成模型是基于历史案件库中大量的经过鉴定专家人工审定合格的鉴定报告作为训练数据,通过深度学习算法训练获取。
33.s103:基于自然语言处理模型,对多个所述描述信息进行统计分析,生成总结信息,所述总结信息用于评价检材语音和样本语音的同一性。
34.自然语言处理(natural language processing,nlp),是实现人与计算机之间用自然语言进行有效通信的一种方法,具体地,自然语言处理在计算机的支持下对语言信息进行定量化的研究,并提供可供人与计算机之间能共同使用的语言描写,使计算机既能理解自然语言文本的意义,也能以自然语言文本来表达给定的意图、思想等。
35.作为一种实施方式,所述生成总结信息,即基于所述描述信息,也即基于对所述检材特征音段和所述样本特征音段的比对结果的描述,分析判断语音同一性,也就是所述检材语音的身份信息与所述样本语音的身份信息是否为同一人,并基于同一性结论,对上述比对结果进一步做分析评价,并将同一性结论和比对结果的分析评价整合生成总结信息。
36.作为一种实施方式,所述总结信息的生成方法,可以是使用自然语音处理模型理解所述描述信息中的文字信息,对文字信息进行分析处理,再将分析结果使用自然语音处理算法输出合成文字,作为总结信息。
37.s104:基于预设的格式模板,根据所述图谱信息、所述描述信息及所述总结信息生成声纹鉴定报告。
38.因此,本技术实施例提供的声纹鉴定报告生成方法,能够基于预先获取的检材特征音段和样本特征音段,自动获取表征检材和样本特征音段的声纹特征的图谱信息,描述检材和样本特征音段的比对结果的描述信息,和评价检材和样本语音同一性的总结信息,最后,基于一定的格式模板,将所述图谱信息、所述描述信息及所述总结信息整理得到声纹鉴定报告,也就是说,本方法能够基于检材语音和样本语音自动生成声纹鉴定报告,大大节约了人工撰写鉴定报告的人力和时间。
39.作为一种实施方式,请参阅图2,图2示出了本技术实施例提供的在步骤s102中生成每个所述图谱信息的描述信息的方法,具体地,该方法包括:s201至s203。
40.s201:基于所述语谱信息,对所述检材特征音段和所述样本特征音段进行共振峰
轨迹比对,获取轨迹比对数据。
41.作为一种实施方式,所述轨迹比对数据可以根据共振峰轨迹的起始和终止点的频率相对大小,以及共振峰轨迹曲线斜率的变化来获取。具体地,根据所述语谱信息,即所述检材语音语谱图和所述样本语音语谱图,能够由算法自动生成共振峰轨迹,通过计算音节稳定段共振峰轨迹曲线的一阶及二阶导数(差分)来判断轨迹曲线的斜率变化,从而判断轨迹的走势。
42.s202:基于所述频谱信息,对所述检材特征音段和所述样本特征音段进行共振峰参数比对,获取参数比对数据。
43.作为一种实施方式,所述参数比对数据为根据所述频谱信息,即所述检材特征音段和所述样本特征音段的频谱曲线,通过共振峰估计算法或人工测量计算出的各共振峰参数,以及检材共振峰参数与样本共振峰参数之间的偏差数据。具体地,所述参数比对数据可以包括共振峰个数数据、共振峰中心频率数据、共振峰强度数据及共振峰带宽数据。
44.s203:由所述轨迹比对结果和所述参数比对结果,生成描述信息。
45.作为一种实施方式,请参阅图3,图3示出了本技术实施例提供的在步骤s203中由所述轨迹比对结果和所述参数比对结果生成描述信息的方法,具体地,该方法可以包括:s301至s304。
46.s301:基于所述轨迹比对数据,判断检材共振峰轨迹走势与样本共振峰轨迹走势的偏离程度是否大于预设阈值;
47.s302:若所述检材共振峰轨迹走势与所述样本共振峰轨迹走势的偏离程度大于预设阈值,生成共振峰轨迹走势描述信息。
48.作为一种实施方式,可以基于所述一、二阶导数特征,判定共振峰轨迹走势呈上升或下降的趋势以及上凸或上凹的形态,由于一阶导数为正表示呈上升趋势,一阶导数为负表示呈下降趋势;二阶导数为正表示呈上凸形态,二阶导数为负表示呈上凹形态,那么,例如,当一阶导数为正且大于预设上升阈值时,表示共振峰轨迹走势呈上升趋势,生成的共振峰轨迹走势描述信息为:共振峰呈上升趋势,且,进一步地,可以增设描述阈值,当一阶导数为正且大于预设上升阈值后,进一步将一阶导数与描述阈值比较,从而获取上升趋势的不同趋势等级,如轻微上升、大幅上升等。作为一种实施方式,下降、上凸及上凹轨迹走势描述信息的生成可以参考前述实施方式,此处不再赘述。
49.作为一种实施方式,所述预设阈值为针对音节稳定段平滑共振峰轨迹曲线的一、二阶导数特征设定的阈值。具体地,例如,若所述检材共振峰的一阶导数与所述检样本共振峰的一阶导数的差值大于所述预设阈值,则表示所述检材共振峰的上升趋势与所述样本共振峰的上升趋势有较大差异,从而基于差异结论,生成共振峰轨迹走势描述信息。作为一种实施方式,下降、上凸及上凹轨迹走势描述信息的生成可以参考前述实施方式,此处不再赘述。
50.s303:若所述检材共振峰轨迹走势与所述样本共振峰轨迹走势的偏离程度小于或等于预设阈值,基于预设的轨迹相似度阈值,生成共振峰轨迹相似度描述信息。
51.作为一种实施方式,若所述检材共振峰轨迹走势与所述样本共振峰轨迹走势的偏离程度小于或等于预设阈值,则表示所述检材共振峰轨迹走势与所述样本共振峰轨迹走势比较相似。那么,进一步地,所述轨迹相似度阈值用于判断所述检材共振峰轨迹走势与所述
样本共振峰轨迹走势的相似程度,如可以基于所述轨迹相似度阈值,分为完全一致,基本一致,比较接近等不同的级别,并生成对应的共振峰轨迹相似度描述信息。
52.s304:基于预设的参数偏差阈值,根据所述参数比对数据,生成共振峰参数相似度描述信息。
53.作为一种实施方式,对于每个共振峰参数,都在合理参数偏差阈值范围内设定不同的偏差区间,最终根据实际参数偏差大小将共振峰参数的符合度分为完全一致、基本一致、比较接近等不同等级,来进行分类描述,进一步地,超出合理偏差阈值范围则可描述为存在较大偏差。具体地,例如,将四个共振峰的偏差均小于最大合理偏差15%的情形设定为完全一致,有一个共振峰的偏差大于最大合理偏差90%的情形设定为比较接近,其他情形设定为基本一致。
54.作为一种实施方式,对于高次共振峰(f3、f4)偏差方向不一致的情形,增加对于中心频率间隔偏差的描述,并设定对应的参数偏差阈值。
55.基于比对结果,根据预先设定的规则生成描述信息的方式虽然在程序层面更易于实现,但此种描述信息的生成方式也具有其弱点,发明人在使用中发现,基于预设阈值对所述检材特征音段和所述样本特征音段的比对结果进行评价和文字生成,使整个评价结果过于依赖于人工设定的阈值,且无法根据不同案件的不同情形,及时地做出评价标准的更改,描述信息过于死板。
56.作为一种实施方式,请参阅图4,图4示出了本技术实施例提供的另一种在步骤s102中生成每个所述图谱信息的描述信息的方法,具体地,该方法可以包括:s401至s402。
57.s401:基于多份鉴定报告中的声纹特征数据和声纹特征描述文本,训练获取描述信息生成模型;
58.s402:将所述图谱信息输入所述描述信息生成模型,生成描述信息。
59.作为一种实施方式,所述鉴定报告可以来自于网络服务器中的大量案例的由人工出具的完善声纹鉴定报告,基于大量鉴定报告中的声纹特征数据和声纹特征描述文本,通过深度学习算法,训练获取描述信息生成模型,再利用所述描述信息生成模型,自动生成对所述图谱信息的描述信息,所述描述信息生成模型在不断的学习迭代中,持续更新着对大量图谱信息的评价标准,使得生成的描述信息更加灵活多变,从而适应不同案件,提高后续对同一性评判的准确度。
60.作为一种实施方式,请参阅图5,图5示出了示出了本技术实施例提供的一种在步骤s103中基于自然语言处理模型,对多个所述描述信息进行统计分析,生成总结信息的方法,具体地,该方法包括:s501至s503。
61.s501:在多个所述描述信息中查找满足预设标准的描述信息,作为关键描述信息,并统计所述关键描述信息中符合点信息和差异点信息的占比比重。
62.作为一种实施方式,所述预设标准指描述信息对于最终得出检材与样本是否为同一人的结论,有没有起到起主导作用。作为一种实施方式,在共振峰特征描述中,诸如共振峰个数、共振峰走势、共振峰中心频率、高次共振峰的频率间隔等,可以作为关键描述信息,进一步地,对关键描述信息的判断可基于相关行业标准进行定量描述。
63.s502:基于所述自然语言处理模型,根据所述占比比重,生成声纹同一性总结信息;
64.s503:基于所述自然语言处理模型,对不符合所述声纹同一性结论的所述关键描述信息,生成分析总结信息。
65.作为一种实施方式,所述根据所述占比比重生成声纹同一性总结信息的方法,可以为参考预设的同一性阈值,若所述符合点比重超过所述同一性阈值,则判断检材与样本为同一人,反之则判断不是,并基于判断结论生成声纹同一性总结信息。
66.作为一种实施方式,对于所述关键描述信息包含的符合点和差异点中与所述声纹同一性总结信息不相符的次要因素,再结合语音的上下文语境以及录音环境进行描述,生成分析总结信息,例如,可能出现不符合同一人特征的音素的低次共振峰具有一致性,这是相同发音的共性,属于非本质性符合,或符合同一人特征的音素的共振峰强度和带宽具有一定的差异,这是由于录音设备和环境不同造成的,属于非本质性差异。
67.请参阅图6,图6示出了本技术实施例提供的一种声纹鉴定报告生成方法,具体地,该方法包括:s601至s606。
68.s601:基于预先获取的检材语音和样本语音,获取检材文字信息和样本文字信息,其中,所述检材文字信息包括检材音素信息和检材字词信息,所述样本文字信息包括样本音素信息和样本字词信息。
69.作为一种实施方式,所述检材语音和样本语音的获取方法为,先通过录音采集等手段获取检材录音和样本录音,再通过语音质量检测算法计算录音的各项质量信息,如有效时长、信噪比、混响时间、截幅比例等,筛选出符合特定质量条件的语音,作为所述检材语音和样本语音。
70.作为一种实施方式,所述文字信息的获取方法为,采用自动语音识别技术将所述检材语音和所述样本语音转换成文字信息,具体地,所述文字信息包含音素(英语的音标、汉语的拼音)和字词信息(英语的单词、汉语的单字),进一步地,所述字词信息还包含对应音频数据的时间戳(文字片段在音频数据中的起始和结束时间)。
71.s602:在所述检材语音和所述样本语音中查找满足预设条件的音段,作为检材特征音段和样本特征音段,其中,所述预设条件为所述检材音素信息与所述样本音素信息相同,且所述检材字词信息与所述样本字词信息相同。
72.作为一种实施方式,所述检材特征音段和所述样本特征音段的获取方法为,基于预设条件在所述检材语音和所述样本语音中查找满足条件的音段,所述预设条件为所述检材音素信息与所述样本音素信息相同,且所述检材字词信息与所述样本字词信息相同,从而实现特征音段的自动选择。
73.s603:基于预先获取的多个检材特征音段和多个样本特征音段,获取多个图谱信息,所述图谱信息包括语谱信息和频谱信息,用于表征所述检材特征音段和所述样本特征音段的声纹特征;
74.s604:生成每个所述图谱信息的描述信息,所述描述信息用于描述所述检材特征音段和所述样本特征音段的比对结果;
75.s605:基于自然语言处理模型,对多个所述描述信息进行统计分析,生成总结信息,所述总结信息用于评价检材语音和样本语音的同一性;
76.s606:基于预设的格式模板,根据所述图谱信息、所述描述信息及所述总结信息生成声纹鉴定报告。
77.其中,所述步骤s603至步骤s606的实施方式可以参考前述实施例,在此不在赘述。
78.参阅图7,图7示出了本技术实施例提供的一种声纹鉴定报告生成方法,具体地,该方法包括:s701至s705。
79.s701:基于预先获取的多个检材特征音段和多个样本特征音段,获取多个图谱信息,所述图谱信息包括语谱信息和频谱信息,用于表征所述检材特征音段和所述样本特征音段的声纹特征;
80.s702:生成每个所述图谱信息的描述信息,所述描述信息用于描述所述检材特征音段和所述样本特征音段的比对结果;
81.s703:基于自然语言处理模型,对多个所述描述信息进行统计分析,生成总结信息,所述总结信息用于评价检材语音和样本语音的同一性;
82.s704:基于预设的格式模板,根据所述图谱信息、所述描述信息及所述总结信息生成声纹鉴定报告。
83.其中,所述步骤s701和步骤s704的实施方式可以参考前述实施例,在此不在赘述。
84.s705:基于多份鉴定报告中的声纹特征描述文本和鉴定结论文本,优化所述自然语言处理模型。
85.作为一种实施方式,所述基于多份鉴定报告中的声纹特征描述文本和鉴定结论文本,优化所述自然语言处理模型,其中,所述鉴定报告可以来自于网络服务器中的大量案例的由人工出具的完善声纹鉴定报告,通过学习算法,不断更新迭代所述自然语言处理模型,降低最终生成的总结信息的错误率,使语句更通顺、符合自然人的阅读习惯。
86.请参阅图8,其示出了本技术实施例提供的一种声纹鉴定报告生成装置800的结构框,该装置可以包括图谱信息生成单元801、描述信息生成单元802、总结信息生成单元803和鉴定报告生成单元804。
87.图谱信息生成单元801,用于基于预先获取的多个检材特征音段和多个样本特征音段,获取多个图谱信息,所述图谱信息包括语谱信息和频谱信息,用于表征所述检材特征音段和所述样本特征音段的声纹特征;
88.描述信息生成单元802,用于生成每个所述图谱信息的描述信息,所述描述信息用于描述所述检材特征音段和所述样本特征音段的比对结果;
89.总结信息生成单元803,用于基于自然语言处理模型,对多个所述描述信息进行统计分析,生成总结信息,所述总结信息用于评价检材语音和样本语音的同一性;
90.鉴定报告生成单元804,用于基于预设的格式模板,根据所述图谱信息、所述描述信息及所述总结信息生成声纹鉴定报告。
91.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
92.在本技术所提供的几个实施例中,单元相互之间的耦合可以是电性,机械或其它形式的耦合。
93.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
94.请参考图9,其示出了本技术实施例提供的一种计算机可读存储介质的结构框图。
该计算机可读介质900中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
95.计算机可读存储介质900可以是诸如闪存、eeprom(电可擦除可编程只读存储器)、eprom、硬盘或者rom之类的电子存储器。可选地,计算机可读存储介质900包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质900具有执行上述方法中的任何方法在步骤的程序代码910的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码910可以例如以适当形式进行压缩。
96.最后应说明的是:以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。

技术特征:
1.一种声纹鉴定报告生成方法,其特征在于,包括:基于预先获取的多个检材特征音段和多个样本特征音段,获取多个图谱信息,所述图谱信息包括语谱信息和频谱信息,用于表征所述检材特征音段和所述样本特征音段的声纹特征;生成每个所述图谱信息的描述信息,所述描述信息用于描述所述检材特征音段和所述样本特征音段的比对结果;基于自然语言处理模型,对多个所述描述信息进行统计分析,生成总结信息,所述总结信息用于评价检材语音和样本语音的同一性;基于预设的格式模板,根据所述图谱信息、所述描述信息及所述总结信息生成声纹鉴定报告。2.根据权利要求1所述的方法,其特征在于,所述生成每个所述图谱信息的描述信息,包括:基于所述语谱信息,对所述检材特征音段和所述样本特征音段进行共振峰轨迹比对,获取轨迹比对数据;基于所述频谱信息,对所述检材特征音段和所述样本特征音段进行共振峰参数比对,获取参数比对数据;由所述轨迹比对数据和所述参数比对数据,生成描述信息。3.根据权利要求2所述的方法,其特征在于,所述由所述轨迹比对数据和所述参数比对数据,生成描述信息,包括:基于所述轨迹比对数据,判断检材共振峰轨迹走势与样本共振峰轨迹走势的偏离程度是否大于预设阈值;若所述检材共振峰轨迹走势与所述样本共振峰轨迹走势的偏离程度大于预设阈值,生成共振峰轨迹走势描述信息;若所述检材共振峰轨迹走势与所述样本共振峰轨迹走势的偏离程度小于或等于预设阈值,基于预设的轨迹相似度阈值,生成共振峰轨迹相似度描述信息。4.根据权利要求2所述的方法,其特征在于,所述由所述轨迹比对数据和所述参数比对数据,生成描述信息,包括:基于预设的参数偏差阈值,根据所述参数比对数据,生成共振峰参数相似度描述信息。5.根据权利要求1所述的方法,其特征在于,所述生成每个所述图谱信息的描述信息,包括:基于多份鉴定报告中的声纹特征数据和声纹特征描述文本,训练获取描述信息生成模型;将所述图谱信息输入所述描述信息生成模型,生成描述信息。6.根据权利要求1所述的方法,其特征在于,所述基于自然语言处理模型,对多个所述描述信息进行统计分析,生成总结信息,包括:在多个所述描述信息中查找满足预设标准的描述信息,作为关键描述信息,并统计所述关键描述信息中符合点信息和差异点信息的占比比重;基于所述自然语言处理模型,根据所述占比比重,生成声纹同一性总结信息;基于所述自然语言处理模型,对不符合所述声纹同一性结论的所述关键描述信息,生
成分析总结信息。7.根据权利要求1所述的方法,其特征在于,在所述基于预先获取的多个检材特征音段和多个样本特征音段,获取多个图谱信息之前,所述方法还包括:基于预先获取的检材语音和样本语音,获取检材文字信息和样本文字信息,其中,所述检材文字信息包括检材音素信息和检材字词信息,所述样本文字信息包括样本音素信息和样本字词信息;在所述检材语音和所述样本语音中查找满足预设条件的音段,作为检材特征音段和样本特征音段,其中,所述预设条件为所述检材音素信息与所述样本音素信息相同,且所述检材字词信息与所述样本字词信息相同。8.根据权利要求1所述的方法,其特征在于,在基于预设的格式模板,根据所述图谱信息、所述描述信息及所述总结信息生成声纹鉴定报告之后,所述方法还包括:基于多份鉴定报告中的声纹特征描述文本和鉴定结论文本,优化所述自然语言处理模型。9.一种声纹鉴定报告生成装置,其特征在于,包括图谱信息生成单元,描述信息生成单元,总结信息生成单元,鉴定报告生成单元;所述图谱信息生成单元用于基于预先获取的多个检材特征音段和多个样本特征音段,获取多个图谱信息,所述图谱信息包括语谱信息和频谱信息,用于表征所述检材特征音段和所述样本特征音段的声纹特征;所述描述信息生成单元用于生成每个所述图谱信息的描述信息,所述描述信息用于描述所述检材特征音段和所述样本特征音段的比对结果;所述总结信息生成单元用于基于自然语言处理模型,对多个所述描述信息进行统计分析,生成总结信息,所述总结信息用于评价检材语音和样本语音的同一性;所述鉴定报告生成单元用于基于预设的格式模板,根据所述图谱信息、所述描述信息及所述总结信息生成声纹鉴定报告。10.一种计算机可读介质,其特征在于,所述计算机可读介质存储有处理器可执行的程序代码,所述程序代码被所述处理器执行时使所述处理器执行权利要求1-8任一项所述方法。

技术总结
本申请公开了一种声纹鉴定报告生成方法、装置及计算机可读介质,涉及声纹鉴定技术领域,方法包括:基于预先获取的多个检材特征音段和多个样本特征音段,获取多个图谱信息;生成每个所述图谱信息的描述信息;基于自然语言处理模型,对多个所述描述信息进行统计分析,生成总结信息;基于预设的格式模板,根据所述图谱信息、所述描述信息及所述总结信息生成声纹鉴定报告。因此,本方法能够基于检材语音和样本语音自动生成声纹鉴定报告,大大节约了人工撰写鉴定报告的人力和时间。工撰写鉴定报告的人力和时间。工撰写鉴定报告的人力和时间。


技术研发人员:丁俊豪 陈东鹏 李亚桐 范恒胜
受保护的技术使用者:深圳市声扬科技有限公司
技术研发日:2023.03.08
技术公布日:2023/7/13
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐