一种均匀线阵波场合成方法、装置和存储介质与流程
未命名
08-07
阅读:82
评论:0

1.本发明属于音频技术领域,涉及均匀线阵波场合成方法、装置和存储介质,应用于均匀线阵列扬声器,使均匀扬声器线阵还原2d声场。
背景技术:
2.3d音频技术一直是多媒体领域的一个热门研究内容。早在1934年,steinberg和snow就提出了“声音幕帘”概念,并开展了针对三维音频的初步研究。“声音幕帘”概念指的是:如果能在一个面上用大量麦克风(传声器)组成一个紧密网格(即面麦克风网格阵列),就可以采集到原始声源的方位信息和声场形状。根据惠更斯原理,只要能用同样结构的面扬声器网格阵列,就可以重建出原始声源的方位和声场形状,这就是声场物理重建技术的雏形。从20世纪80年代末开始,麦克风阵列采集技术的实现与发展推动了物理声场重建技术的发展,其中最著名的是基于球谐分解的声重放技术和波场合成(wave field synthesis,wfs)两大技术,但由于基于球谐分解的声重放技术对于重放所需要的扬声器阵列排布有着比较苛刻的要求:一般的球谐分解声场重构技术要求扬声器必须环绕并构成球型分布以获得扬声器驱动信号球谐分解分量,并且最好的听音效果在球心处获得,扬声器与听音者的排布如下图所示。上述的两个特点使得基于球谐分解的声重放技术,对场地要求较高,并且更适合单人聆听,大大限制了球谐分解声重放技术的应用范围。
3.波场合成(wfs)的物理原理可以回朔到huygens原理。1993年荷兰代尔夫特理工大学的berkhout提出将kirchhoff-helmholtz积分中的封闭区域简化成一个平面,使用有限等间隔排布的环状扬声器阵列可以实现在水平面重建合成的声场。1995年,marinusm.boone研究团队提出了基于线阵列的波场合成技术,使用线扬声器阵列可以重建二维声场,并在1999和2004年继续将其扩展到和面扬声器阵列重建二维声场的情况。由于波场合成技术中核心思想是通过线积分替代体积分的物理重构方法,所以波场合成技术对扬声器的排布要求较为自由,在满足空间分辨率的情况下,近乎可以随意摆放,并且其重放范围较球谐分解广得多。
4.基于wfs的众多优点,使得它在行业中有着非常广泛的应用。其中大致可分为两种:
5.(1)在线波场合成:通过实时获得音源的位置信息,进行wfs运算,通常用于现场演播。
6.(2)离线波场合成:通过预先设置的音源信息,预先离线wfs渲染完成后进行演播,通常用于影视作品。
7.在线波场合成技术由于属于实时的创作演算过程,要求音乐/语音信号,连续不断流。其处理流程大致如图1。
8.如图1,每个声音源对象对应一个音频流,每个音频流在其内部分帧进行信号处理,每一帧帧长根据实际场景不同而不同,但在确定场景中,通常是一致的。每个音频流对应的帧经过波场合成算法后产生对应的扬声器的驱动信号。所以对应在n个源对象与m个扬
声器的情况下,需要进行mn次波场合成算法。对应的波场合成算法对着阵列形状的不同各有不同,通常阵列形状复杂,对应的运算量通常较阵列简单的运算量高。线阵列扬声器阵列重建二维声场,这是在现实场景中,如话剧,演讲中十分常用的一个场景,当扬声器阵列简化成均匀分布的线阵列并且听音者处在一个平面时,缩减垂直方向上的扬声器并不影响扬声器与听众所在平面的波阵面,离散形的瑞利第一型积分可大大简化,是一种较为简单的波场合成阵列形式,其大致排列可由图2表示。
9.在图2的线阵列情况下,每个扬声器的驱动方程如下:
[0010][0011]
上式是线阵列还原2d声场的基本驱动公式。其主要算法为频域算法。在进行计算时需要先将驱动信号通过傅立叶变换转到频域,在频域运算完后反变换回时域取实部。上述的表达式为每一个扬声器都要经过上述的运算,上述运算随着扬声器数量的增加或虚拟声源数的增加会迅速上升。目前很多运行上述线阵列波场合成的设备,都需要专门的硬件来支持运算。
[0012]
驱动函数目前在运算时存在如下的问题:转频域会带来谱泄漏的问题,要想降低谱泄漏,那么窗函数需要取较长的长度,对于音频重放频率20hz~20000hz这样的范围来说,要降低低频的谱泄漏,那么窗的长度需要达到0.25s。较长的窗延迟会使得整个音频延迟增加,对于在线的波场合成来说,这样高的延时是不可接受的。若降低窗的长度,则在低频部分会造成较大的信号失真。
技术实现要素:
[0013]
本发明的目的是要提供一种均匀线阵波场合成方法,解决了如何减小波场合成时的失真和延时问题。
[0014]
为达到上述目的,本发明采用的技术方案是:
[0015]
本发明提供了一种均匀线阵波场合成方法,应用于均匀线阵列扬声器,包括接收音频信息并经过信号处理后给扬声器提供驱动信号以输出声音,信号处理是通过时域fir滤波等效运算形成线阵列wfs频域算法的近似。
[0016]
优选地,通过频率抽样法对频率进行归一处理。
[0017]
优选地,将eq调音参数合并入时域fir滤波等效运算以对音频信息进行eq调音。
[0018]
还提供一种均匀线阵波场合成装置,应用于均匀线阵列扬声器,包括信号处理单元,信号处理单元接收音频信息并经过信号处理后给扬声器提供驱动信号以输出声音,信号处理单元中的信号处理是通过时域fir滤波等效运算形成线阵列wfs频域算法的近似。
[0019]
还提供一种均匀线阵波场合成存储介质,其上存储有计算机程序,该程序被处理器执行时包括以下步骤:接收音频信息并经过信号处理后给扬声器提供驱动信号以输出声音,信号处理是通过时域fir滤波等效运算形成线阵列wfs频域算法的近似。
[0020]
由于上述技术方案运用,本发明与现有技术相比具有下列优点:
[0021]
本发明的均匀线阵波场合成方法、装置和存储介质,由于音频信号处理是通过时域fir滤波等效运算形成线阵列wfs频域算法的近似,因此避免了时域和频域的转换,进而避免了信号截断带来的频谱泄漏问题,从而使信号失真大大降低,尤其是低频信号。同时,
由于避免了时域和频域的转换,因此不需要为了减少频谱泄漏而采用较长的帧长度,使得信号的实时性提高。
附图说明
[0022]
后文将参照附图以示例性而非限制性的方式详细描述本发明的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:
[0023]
图1是常见的波场合成技术的创作演算过程;
[0024]
图2是均匀分布的扬声器线阵列示意图;
[0025]
图3是未采用本发明方法的波场合成流程图;
[0026]
图4是本发明的波场合成示意图。
具体实施方式
[0027]
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0028]
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0029]
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
[0030]
本发明针对上述均匀扬声器线阵列在线还原2d声场的问题,给出上述驱动函数(或1)的简化方法,降低重放的失真,提高系统的实时性。
[0031]
上述的驱动函数,在给定的位置下:
[0032]
(一)gn(θn,ω),此项为扬声器的指向性修正,可视作常数(后表示为1/a);
[0033]
(二)确定的位置,可视作常数(后表示为b2);
[0034]
(三)确定的位置,可视作常数(后表示为c)。
[0035]
分别以1/a、b2、c代替上述的三个常数项,上述的驱动函数可化简为:
[0036][0037]
对上述的表达式求幅频与相频响应可得:
[0038]
[0039][0040]
其中k为波数,正比于频率。由式4可知,在均匀线阵列的前提下,系统为线性相位系统。所以可以使用构造fir滤波器的方法对上述系统进行简化。并且由于fir滤波器的引入,可以方便通过窗函数法、或者其他fir滤波器的设计方法,调节系统的频率响应函数。此处需要说明:若构造的频率响应函数满足上述式3的分布,则为线阵列wfs算法的一种时域近似。
[0041]
在wfs算法中通常需要对扬声器频率响应进行归一处理以获得最好的控制效果,在fir等效中能够很方便得通过频率抽样法对频率进行归一处理。除此之外,也可以将一些eq调音参数合并入时域fir滤波等效运算以对音频信息进行eq调音处理,可以在此处统一合入传递函数进行修改,降低整体运算。
[0042]
对于某一个确定的通道(或声音对象)对某个确定的输出通道,算法未采用此方法的整体流程如图3。
[0043]
整体的频域运算,由于需要取窗后转频域运算,此时涉及信号完美重建原理,对窗函数的选择,并且信号交叠有着严格的要求。上述步骤的运算描述如下:
[0044]
1、根据信号完美重建的原理,选取窗函数类型以及fft窗移的长度对信号进行截短,获得加窗后的时域信号;
[0045]
2、快速傅立叶变换转到频域;
[0046]
3、在频域根据驱动信号公式对信号进行处理;
[0047]
4、快速傅立叶逆变换取实部转到时域;
[0048]
5、根据信号完美重构原理交叠相加获得重构信号。
[0049]
上述运算存在多处取窗,时频变换等操作,运算量较大。采取本发明方法后,可简化为图4。
[0050]
只需要一步时域滤波就可以完成,大大简化了运算。
[0051]
利用上述方法还可以单独制成一个存储介质,将上述方法(主要是算法)写入计算机程序中,该程序存储于该存储介质中,当该程序被处理器执行时,利用程序实现上述的步骤,从而对接收到的音频信息进行实时处理,实时生成对扬声器阵列的驱动信号。
[0052]
利用上述方法还可以制成一个装置,包括一个信号处理单元,信号处理单元专门用于对音频信号进行处理,对接收到的音频信息并经过信号处理后给扬声器提供驱动信号以输出声音,信号处理单元中的信号处理是通过时域fir滤波等效运算形成线阵列wfs频域算法的近似,也就是上述的方法。
[0053]
本发明中,利用时域fir滤波等效运算形成线阵列wfs频域算法的近似,避免了时域和频域之间的转换,直接在时域中进行信号处理,在使用本方法后:
[0054]
1、由于避免了时频转换,进而避免了信号截断带来的频谱泄漏问题。信号失真大大降低,尤其是低频信号。由于fir运算是线性运算,信号失真在此方法下为0,所以提高了信号的保真度。同样也是由于时频转换带来的另一个优点,由于原先需要减少谱泄漏所以需要较长的帧长度,使得信号的实时性降低。原先方法存在着实时性与信号失真不可兼得的困境。但是通过时域fir滤波等效运算很好地解决了该问题。
[0055]
2、本方法简化了运算,虽然大的帧长度在频域下可以将复杂度转到nlogn量级,但
fir运算的tap数可以更小,如时频运算的帧长取典型值为4096个点,但fir方法由于是sinc插值,256或512个点可获得接近效果,并且系统更加鲁棒。实测可以在非专门的硬件上即可支持8输入16输出的矩阵式映射,并且维持10ms以内的系统延时。
[0056]
上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围,凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。
技术特征:
1.一种均匀线阵波场合成方法,应用于均匀线阵列扬声器,包括接收音频信息并经过信号处理后给扬声器提供驱动信号以输出声音,其特征在于,信号处理是通过时域fir滤波等效运算形成线阵列wfs频域算法的近似。2.根据权利要求1所述的均匀线阵波场合成方法,其特征在于:通过频率抽样法对频率进行归一处理。3.根据权利要求1所述的均匀线阵波场合成方法,其特征在于:将eq调音参数合并入时域fir滤波等效运算以对音频信息进行eq调音。4.一种均匀线阵波场合成装置,应用于均匀线阵列扬声器,包括信号处理单元,信号处理单元接收音频信息并经过信号处理后给扬声器提供驱动信号以输出声音,其特征在于,信号处理单元中的信号处理是通过时域fir滤波等效运算形成线阵列wfs频域算法的近似。5.一种均匀线阵波场合成存储介质,其上存储有计算机程序,该程序被处理器执行时包括以下步骤:接收音频信息并经过信号处理后给扬声器提供驱动信号以输出声音,其特征在于,信号处理是通过时域fir滤波等效运算形成线阵列wfs频域算法的近似。
技术总结
本发明涉及一种均匀线阵波场合成方法,应用于均匀线阵列扬声器,包括接收音频信息并经过信号处理后给扬声器提供驱动信号以输出声音,信号处理是通过时域FIR滤波等效运算形成线阵列WFS频域算法的近似。由于音频信号处理是通过时域FIR滤波等效运算形成线阵列WFS频域算法的近似,因此避免了时域和频域的转换,进而避免了信号截断带来的频谱泄漏问题,从而使信号失真大大降低,尤其是低频信号。同时,由于避免了时域和频域的转换,因此不需要为了减少频谱泄漏而采用较长的帧长度,使得信号的实时性提高。时性提高。时性提高。
技术研发人员:张胜 卢明辉
受保护的技术使用者:苏州声学产业技术研究院有限公司
技术研发日:2023.04.18
技术公布日:2023/8/5
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/