?

多通路空間聲的前方四揚聲器局域Ambisonics信號饋給法?

2024-02-29 10:58謝菠蓀
應用聲學 2024年1期
關鍵詞:仰角局域揚聲器

張 馳 謝菠蓀

(華南理工大學物理與光電學院 聲學研究所 廣州 510641)

0 引言

為了適應高質量視頻、聲頻重放的要求,目前家用多通聲正在從水平環繞聲向空間環繞聲發展,由面向通路的系統結構向面向目標的系統結構發展??臻g環繞聲增加了垂直方向的聲音信息,改善了空間感知效果。而面向目標的系統結構相當靈活,可采用多種不同的揚聲器布置和信號饋給進行重放,適應于不同的實際應用。國際標準化委員會和國際電工委員會(ISO/IEC)已經制定了面向目標的空間聲標準MPEG-H3D[1],推薦了一些參考的揚聲器布置,如9.1 通路、11.1 通路、22.2 通路布置,也推薦了一些信號饋給法,如基于振幅矢量的信號饋給法(Vector base amplitude panning,VBAP)、全局Ambisonics饋給法等。

多通路聲的重放聲場和感知效果是由揚聲器布置與信號饋給所決定的(對非消聲室的重放環境,還和聽音室(重放房間)的聲學特性有關,但本文略去這問題)。因而多通路空間環繞聲的揚聲器布置和信號饋給的設計取決于期望的重放聲場和聽覺感知效果。目前的多通路空間環繞聲主要是用于伴隨視頻的重放,并且聽覺的空間分辨率也是非均勻的。因而大多數多通路空間環繞聲(包括國際標準的推薦)都采用了前方相對密集,側向、后方和上方相對稀疏的揚聲器布置。特別是多通路空間環繞聲的重要目標之一是產生與視頻配合的前方水平與垂直方向的聽覺定位效果,因而大多數的揚聲器布置(如9.1 通路布置)包括了水平面(或略低于水平面)的左前、右前,以及高仰角的左前上、右前上的揚聲器[2],該4個揚聲器布置在投影幕的周邊。

為了在投影幕范圍內產生不同的水平和垂直方向的虛擬源,可以利用上述4 個揚聲器設計各種的信號饋給法。分立-對是最簡單的信號饋給法[3]。它將信號饋給一對相鄰的揚聲器,通過改變兩揚聲器信號的相對幅度(通路聲級差)而產生揚聲器之間的虛擬源,但不能產生4 個揚聲器所包圍的中間區域的虛擬源。VBAP 是分立-信號饋給法的推廣[4]。它是根據目標虛擬源的方向,在4 個揚聲器中選用其中的3 個組成包圍目標方向的球面三角形,并采用矢量合成的法則得到揚聲器信號的振幅。VBAP 信號饋給相對簡單,但不能同時精確產生合成定位所需的雙耳時間差(Interaural time difference,ITD)及其隨頭部轉動的動態變化因素[3]。只有在揚聲器之間的張角較小的情況下,VBAP 才能近似產生適當的合成定位因素,在揚聲器布置的范圍內得到較好的定位效果。

全局Ambisonics 是另一種常用的信號饋給法[5-6]。它采用聲場空間諧波展開的方法(在三維空間就是球諧函數展開),逐階逼近目標重放聲場。全局Ambisonics 的優點是可以根據需要,靈活地選取合適的重放階數與揚聲器數量,其重放效果和復雜性都隨階數而增加。根據Shannon-Nyquest空間采樣理論[3],空間全局L階的Ambisonics需要(L+1)2個獨立信號通路,以及M≥(L+1)2個揚聲器重放。全局Ambisonics 對空間不同方向的聲音信號按等同的精度處理,因而更適合于空間均勻的揚聲器布置。當應用于空間非均勻的揚聲器布置時,很容易引起信號饋給的穩定性問題。

最近研究也提出了一種局域Ambisonics 的信號饋給法[7],它也是采用聲場空間諧波展開的方法,但只將信號饋給目標虛擬源方向附近空間區域的揚聲器而不是所有揚聲器重放。例如,利用布置在前方中垂面的3 個揚聲器和局域Ambisonics 的信號饋給法即可產生揚聲器之間的虛擬源。

當然,也可以采用頭相關傳輸函數(Head related transfer function,HRTF)和虛擬聽覺傳輸信號處理的方法,利用上述4 個揚聲器布置產生前空間范圍的虛擬源[8]。但受其物理原理的限制,這種方法的聽音區域較窄,主要適用于多媒體計算機的聲音重放。

由于在相關的標準中,空間環繞聲的信號饋給是靈活和開放的。本文將研究一種利用上述前方四揚聲器產生投影幕范圍內水平和垂直虛擬源的局域Ambisonics信號饋給方法,以改善伴隨視頻的多通路空間環繞聲的重放效果。

1 四揚聲器局域Ambisonics信號饋給

本文采用以頭中心為坐標原點的逆時針坐標系統??臻g中的任意一點可用(r,θ,?) 表示,其中,0 ≤r<+∞表示到原點(頭中心)的距離;-180?<θ≤180?和-90?≤?≤90?分別表示方位角和仰角。?為-90?、0?、90?分別表示正下方、水平面和正上方;在水平面θ為-90?、0?、90?、180?分別表示右方、前方、左方和后方。

如圖1 所示,4 個揚聲器布置在以頭中心為原點、半徑為r0的球面上,其位置為水平面左前方和右前方,高仰角的左前上方和右前上方4個方向。其中水平面左前方和右前方揚聲器的方位角和仰角分別為

左前上和右前上方揚聲器的方位角和仰角分別為

Ambisonics 是一種典型的多通路聲信號饋給法[3,5-6],它通過對重放聲場和目標聲場進行球諧函數展開,在一定的階數內相匹配,即可得出各揚聲器的饋給信號值。傳統的全局Ambisonics需要將信號饋給所有揚聲器,主要適用于全空間均勻揚聲器布置的情況。對全空間非均勻揚聲器布置的情況,全局Ambisonics信號饋給容易出現穩定性問題。而局域Ambisonics 只是將信號饋給空間的部分揚聲器,如圖1的4個揚聲器,避免了穩定性問題。

對位于空間方向?S=(θS,?S)、距離r=rS的目標點聲源,當rS位于遠場距離時,坐標原點附近的聲壓可近似為入射平面波。把平面波的振幅歸一化為單位值,并適當選擇平面波的初相位,在頭部尺度大小的區域內,任意場點(r,?)=(r,θ,?)的自由場頻域聲壓為

其中,f是頻率,k是波數,??=?S-?是聲源與場點之間的方向夾角。式(3)可用實值球諧函數展開為

其中,jl(kr)是l階球貝塞爾函數,(?)是l階m度歸一化實值球諧函數:

對于圖1 的揚聲器布置,在頭部尺度大小的區域內,任意場點(r,?)=(r,θ,?)的聲壓為4 個揚聲器所產生的頻域聲壓的疊加。當揚聲器位于遠場距離時,可對揚聲器產生的聲壓作平面波近似,得到

其中,??i=?i-?是第i個揚聲器與場點之間方向的夾角,?i是第i個揚聲器的方向,Ai是第i個揚聲器的信號振幅。將式(4)同樣按照實值球諧函數展開可得:

令局域Ambisonics 重放在頭部尺度大小的區域內產生的聲場與目標聲場相匹配,即式(8)與式(4)相等,并截斷到一階球諧函數的展開式,可得到4個揚聲器信號振幅滿足以下方程:

將式(1)、式(2)給出的揚聲器方向和式(5)代入式(9)后,得到4個揚聲器的信號振幅所滿足的線性(矩陣)方程:

Y不是滿秩矩陣,所以獨立線性方程的數目少于未知數的數目,方程存在無限多組精確解。取其中的偽逆解:

因而得到4個揚聲器的信號振幅為

式(13)的信號振幅滿足公式(9)中第一式給出的幅度歸一化關系,即所有4 個信號的振幅之和為單位值,與目標虛擬源的方向無關。由于重放中感知虛擬源的方向是由各揚聲器信號的相對振幅決定,將式(13)的4 個信號振幅同時乘以一個公共因子Atotal不會改變重放感知虛擬源的方向。因而4 個揚聲器的信號振幅也可以取為

這時4個揚聲器信號的功率之和等于單位值:

式(13)和式(14)分別是四揚聲器重放時采用恒定振幅歸一化和恒定功率歸一化的一階局域Ambisonics信號饋給法。

圖2為根據式(13)給出的目標聲源方向在水平面?S=0?和?S=30?的信號饋給曲線。由圖2 可以看出,4 個信號并不同相,總存在1~2 個反相信號,這與全局Ambisonics信號的基本特征一致。

圖2 不同仰角下局域Ambisonics 的四揚聲器信號幅度Fig.2 The local Ambisonics mixing functions at different elevation plane of four loudspeakers

值得注意的是,由于局域Ambisonics方法求解信號的過程中使用了偽逆矩陣的方法,按照數值分析原理,可以用條件數表示偽逆計算對于誤差的敏感程度。通過計算矩陣Y的條件數,Cond[Y]=∞,且對偽逆解的誤差進行分析可以發現,隨著目標聲源的方向逐漸偏離正前方,偽逆解的誤差逐漸變大。故使用該方法,并不能在全空間產生準確的虛擬源,而只能在前方的四揚聲器布置內和周圍的局域空間內產生較為準確的虛擬源。這一點在第4 節的實驗中也可以充分看出,隨著重放區域偏離揚聲器布置區域,重放的效果是逐漸變差的。

另外,對L階Ambisonics,系統能夠準確重構目標聲場的上限頻率fmax和重構區域半徑rmax之間滿足如下關系[3]:

其中,c=340 m/s為聲速。當取重構區域半徑rmax相當于平均頭部半徑,即rmax=0.0875 m,由此可以得到一階局域Ambisonics 信號饋給重構聲場的上限頻率約為0.6 kHz,這與普通的兩通路立體聲的情況(0.6~0.7 kHz)相當。

2 虛擬源定位分析

為了評估上述信號饋給法的效果,需要對重放產生的定位因素進行分析。聽覺方向定位是多種因素綜合作用的結果[9],其中低頻(1.5 kHz 以下)的ITD、高頻(大約4 kHz 以上)的雙耳聲級差(Interaural level difference,ILD)是側向定位的主要因素;動態因素(頭部轉動引起的雙耳聲壓的改變,特別是低頻ITD 的改變)和耳廓散射產生的高頻(5~6 kHz 以上)譜因素提供了聲源前后和垂直定位的信息。但是由于這里涉及的四揚聲器布置和一階局域Ambisonics 信號饋給并不能在高頻的范圍內精確重構目標聲場,因而也不能精確重構高頻的聽覺方向定位信息。但由于不同聽覺定位因素所提供的信息是有冗余的[3,10-11],低頻ITD 及其隨頭部轉動的變化對側向及垂直定位起主導作用,準確重構低頻雙耳聲壓及定位因素將可得到一定的虛擬源定位效果。普通的立體聲和多通路聲就是基于這心理聲學原理而設計的。因而這里主要對重放產生低頻ITD及其動態變化進行分析。

2.1 基于簡化頭部模型的分析

在低頻的情況下,可以略去頭部的散射和陰影作用,將雙耳簡化成自由空間內相距2a的兩個點。對方向為(θS,?S)的遠場聲源,可以計算出ITD 及其隨頭部轉動的變化率作為(θS,?S)的函數。對于多揚聲器重放,假設M個揚聲器布置在環繞傾聽者的遠場球面上,令第i個揚聲器的方向為(θi,?i),其信號振幅為Ai。則合成虛擬源的感知方向(θI,?I)可通過對比M揚聲器重放與單聲源產生的ITD 和及其動態變化得出[12]。

通過對比ITD可得

通過對比頭部繞上下軸轉動引起的ITD 變化可得

通過對比頭部繞前后軸轉動引起的ITD 變化可得

將式(1)、式(2)和式(13)代入式(17)~式(19),可以得到式(17)~式(19)產生自洽的結果,即感知虛擬源方向為

因而四揚聲器布置與一階局域Ambisonics 信號饋給產生的虛擬源方向與目標方向一致。當然,這里簡化模型的分析結果只在f<0.7 kHz 的低頻才是有效的。如前所述,局域Ambisonics 信號饋給中有部分揚聲器信號是反相的(圖2)。正是由于該部分的反相信號,使得式(17)~式(19)產生自洽的結果,從而產生較為理想的虛擬源定位效果[3]。相反,在傳統的VBAP 信號饋給中各揚聲器信號都是同相的,式(17)~式(19)不能產生自洽的結果[3-4]。

同時,式(20)也表明,該信號饋給不但可以產生揚聲器布置區域之內的虛擬源,同時可以產生揚聲器布置區域之外以外(如30?<θS<90?,30?

2.2 基于HRTF的分析

更精確的分析應該考慮頭部陰影的作用,也就是采用HRTF 模型進行分析。對于方向為(θS,?S)的遠場聲源,雙耳頻域聲壓可由式(21)計算:

其中,Hα(θS,?S,f)代表遠場聲源的HRTF,下標α=L、α=R分別表示左和右耳;f代表頻率;P0代表頭移開后在原頭中心處的自由場頻域聲壓。

對于局域Ambisonics 重放,雙耳聲壓是4 個揚聲器產生聲壓的線性疊加:

其中,Hα(θi,?i,f)代表第i個揚聲器到左或右耳的HRTF,Ai為式(13)求出的揚聲器信號振幅。

通過求得的雙耳聲壓,就可以計算出ITD。有多種不同的ITD定義及計算方法[13]。在低頻下,雙耳聲壓相延時差是聲源方向定位的一個主要因素。但利用HRTF 計算出的雙耳聲壓相延時差是和頻率有關的,計算和分析相對復雜。所以這里采用基于雙耳聲壓互相關法定義的ITD來分析,該方法計算得到的是一定頻帶范圍的“平均”ITD,它與頻率無關。在頻域,雙耳聲壓的歸一化互相關系數為

ITD 定義為ΨLR(τ)最大值對應的τ:

由于ITD 是低頻定位因素,故式(23)對頻率的積分上限為1.5 kHz。與2.1 節類似,為了分析動態定位因素,還需要利用HRTF 計算出頭部轉動后雙耳聲壓及ITD的變化,具體方法和步驟如下:

(1) 給定的目標聲源方向(θS,?S),通過式(21)和式(22)分別計算出單聲源和局域Ambisonics 重放產生的雙耳聲壓;然后分別計算出兩者的ITD并進行對比分析。

(2) 頭部繞垂直或前后軸旋轉一個小角度?θ或?γ后,分別計算出目標聲源和所有揚聲器相對頭部的新方向,利用式(21)和式(22)分別重新計算出新的雙耳聲壓,進一步計算出新的ITD。與頭部轉動前的ITD 比較得到ITD 的差值?ITD,即動態定位因素。再將目標聲源和重放產生的?ITD進行對比,則可以判斷重放虛擬源方向與目標聲源的方向是否一致。

上述分析中,所使用的HRTF 是通過邊界元方法計算得到的無軀干但包含耳廓的KEMAR 人工頭(DB-060/061)的遠場HRTF[14]。HRTF 的頻率分辨率為50 Hz,角度分辨率為1?。

圖3 給出了ITD 隨目標聲源方位角變化的規律。圖3(a)和圖3(b)分別為?S=0?水平面和?S=30?仰角面情況。從圖中可以看出,水平面和?S=30?仰角面的情況是類似的。在-30?~30?方位角的范圍內,局域Ambisonics重放的ITD與實際聲源的情況是一致的;在此范圍之外,隨著方位角的增加,局域Ambisonics重放的ITD與實際聲源情況的差異逐漸增大。這說明在揚聲器布置的方位角范圍內,局域Ambisonics重放可以得到準確的方位角定位效果;而在揚聲器布置方位角范圍之外,感知方位角會向揚聲器的方向(±30?)漂移。

圖3 中心傾聽位置的ITD 隨方位角的變化規律Fig.3 The ITD for the actual source and local Ambisonics with four loudspeakers arranged at different elevation plane

為了分析頭部轉動引起的動態因素,圖4給出了頭部繞上下軸順時針轉動一個小角度(?θ=10?)后,在中垂面和θS=30?垂直面,局域Ambisonics 重放和目標聲源產生的?ITD 隨仰角的變化規律。圖5 給出了頭部繞前后軸順時針轉動一個小角度(?γ=10?)后,在θS=0?中垂面和θS=30?垂直面,局域Ambisonics 重放和實際聲源產生的?ITD 隨仰角的變化規律??梢钥闯?,局域Ambisonics 重放虛和目標聲源產生的?ITD 隨仰角變化的趨勢是一致的,但定量變化上有所差異。隨著仰角的升高,對于頭部繞上下軸轉動,局域Ambisonics 重放和實際聲源的?ITD 的差異基本不變或略有減少;而對于頭部繞前后軸轉動,局域Ambisonics 重放和實際聲源的?ITD 的差異逐漸增大;且在不同的垂直面下有著相同的變化趨勢。

圖4 頭部繞上下軸轉動?θ=10?后ITD 的變化Fig.4 The ?ITD after head rotation ?θ=10?for the actual source and local Ambisonics panning with four loudspeakers arranged

圖5 頭部繞前后軸轉動?γ=10?導致的ITD 變化Fig.5 The ?ITD after head tilting ?γ=10?for the actual source and local Ambisonics panning with four loudspeakers arranged

總體上,在四揚聲器布置的范圍之內,局域Ambisonics 信號饋給可以產生定量上和目標虛擬源一致的ITD;同時也能產生定性上和目標虛擬源一致的隨頭部轉動的動態ITD變化趨勢。但本節分析的結果和上面3.1 小節的分析結果有所不同。首先,四揚聲器重放和局域Ambisonics信號饋給只能在0.6 kHz 以下的頻率范圍準確重構雙耳聲壓,需要利用心理聲學原理產生虛擬源。其次,3.1 小節分析是基于簡化的頭部模型,只適用于0.7 kHz 以下的低頻近似。本小節采用HRTF 模型進行分析,并且將ITD 及其動態變化的分析拓展到它們對定位起主要作用的頻率范圍(1.5 kHz 以下)。并且系統產生不同方向虛擬源的能力還同控制雙耳聲壓的代價有關[15]。因而最終的結果應該由實驗驗證。

3 心理聲學實驗驗證

3.1 實驗設計

為了驗證局域Ambisonics 信號饋給的實際定位性能,進行了虛擬源定位心理聲學實驗。實驗是在聽音室(重放房間)內進行。聽音室的混響時間為0.15 s,本底噪聲不大于30 dB(A)?;诒緦嶒炇掖罱ǖ亩嗤房臻g聲重放系統平臺,按照第2 節的方法,揚聲器布置在半徑為1.45 m 的球面上,其方向由式(1)和式(2)給出。實驗系統的照片如圖6所示。

圖6 揚聲器布置Fig.6 Arrangement of loudspeakers

目標聲源方向分布在6 個仰角(緯度面),即?S分別為0?、15?、30?、45?、60?、90?,每個仰角(?S=90?除外)包括11 個方位角的方向,即θS分別為0?、±15?、±30?、±45?、±60?、±90?。因此共有56 個空間方向,分布在前上半球面空間,包括揚聲器布置之內和之外的區域。實驗中選取了3 種信號,分別是全頻帶粉噪聲、1.5 kHz低通濾波粉紅噪聲和管弦樂信號(選自J.Strauss 的藍色多瑙河)。每一段信號的時長為10 s,頭中心位置的重放聲壓級約為75 dB(A)。

實驗開始前,調整座椅高度,確保受試者的頭中心與揚聲器所在弧面的球心重合,并且面向正前方。在固定揚聲器的支架上,水平方向與垂直方向每隔5?都標有標示,以方便受試者進行方向的讀數。在實驗時,受試者每進行一次方向判斷,都會有專門的記錄員對數據進行記錄。

由于實驗設計的目標聲源的方向較多、信號較長,為了避免單組實驗時長過長而導致定位的誤差較大,在實驗中,受試者對每個方向的虛擬源只進行單次判斷。同時為了保證實驗結果的可靠性與實驗條件的一致性,需在每組實驗中選取10個方向增加額外的兩次判斷(因而這10個方向共有3 次重復判斷)。只有受試者對這10 個方向的虛擬源的感知具有良好的重復性,該次實驗才會判斷結果有效。每名受試者將進行56+2×10=76 次虛擬源方向的判斷。這76 個信號將會隨機順序播放給受試者進行判斷。

共有8名受試者(5 男3 女)參加實驗,他們均為聲學專業研究生,雙耳聽力正常,且有一定的心理聲學實驗經驗。在正式的實驗開始前,將會對每個受試者進行訓練。受試者可以重復傾聽某方向的信號,直至有明確的方向判斷為止。每個受試者的實驗分為3 組,在3 天內完成,每一組實驗選取不同的信號用于虛擬源方向的判斷。

3.2 實驗數據的統計方法

由于實驗數據為三維方向數據,故將用平均無符號方向偏差來反映感知方向的偏差情況。平均無符號方向偏差表示的是感知方向與目標方向在空間上的平均偏差,其計算公式為

其中,N為某種條件下所有受試者的總定位判斷次數,dS和dI(n)分別是目標虛擬源方向和第n個實際感知判斷方向,“·”表示矢量的內積。

由于受試者的感知方向是三維球型數據,故為了進一步分析數據的離散特性,將對8 名受試者的數據做Kent 分布和Fisher 分布檢驗。Kent 分布和Fisher分布是兩種球型數據的分布。當數據服從Kent 分布時,表現為受試者對某目標聲源方向的感知值在仰角和方位角上的方差沒有明顯差異;當數據服從Fisher 分布時,表現為受試者對某目標聲源方向的感知值在仰角或方位角上的方差更大[16]。為了更好地展示出不同方向數據的分布,這里用Leong等[16]提出的球型數據圖示法來展示。

3.3 實驗結果與分析

在分析實驗數據之前,首先要對所有受試者數據的重復性進行檢驗。將8名受試者,10個方向的3次重復數據的平均無符號偏差,與單次的實驗結果進行Wilcoxon符號秩檢驗。經檢驗,在顯著性水平α=0.05的情況下,兩者并無明顯差異,說明受試者的感知方向重復性較好。

圖7 給出的是3 種信號的感知方向的角度統計結果分布圖。由于目標方向較多,且?S=60?的高仰角數據方差較大,為了使圖像清晰易懂,左列畫出的是目標方向滿足|θS| ≤45?且|?S| ≤45?的分布圖,右列畫出的是目標方向滿足|θS| >45?的分布圖。從圖7中可以看出:

圖7 局域Ambisonics 對3 種不同信號的定位統計結果Fig.7 Statistics for three different signals for local Ambisonics

(1) 當目標聲源的仰角和方位角均小于45?時,定位的效果較好,感知方向與目標方向的誤差較??;當方位角或仰角大于45?時,定位誤差較大,且感知方向不再隨著目標方向而變化。從數據中可以看出,受試者能感知到的最大方位角θI在±50?附近,能感知到的最大仰角在45?附近。這和3.2 節采用HRTF分析的結果是一致的。

(2) 受試者對低通信號的定位精度較差,而另外兩種信號的定位精度相差不大。具體表現在受試者對低通信號的仰角定位效果更差,而對音樂信號和全頻帶粉噪聲在方位角和仰角上的定位效果相近。這可能是信號帶寬的原因,由于1.5 kHz低通信號只包含低頻定位因素,所以即使是實際聲源,其定位精度也較差。

(3) 在揚聲器布置區域范圍內,對大多數虛擬源方位角和仰角的定位方差沒有明顯差別,而在揚聲器布置范圍外,對仰角的定位方差大于對方位角的定位方差,即受試者對仰角的定位效果要劣于方位角的定位效果。一方面是由于聽覺對垂直方向的分辨率低于水平方向的分辨率,另一方面,也說明了局域Ambisonics 重放時對于垂直方向的重放效果劣于水平方向的重放效果。

(4) 在揚聲器布置的范圍外,由第3 節基于HRTF 模型的分析中可以看出,當方位角大于30?時,ITD 隨著方位角的增大逐漸趨于一個穩定值;而當仰角大于30?時,頭部繞垂直軸轉動引起的?ITD隨仰角的變化率沒有明顯變化。這種情況下,感知虛擬源最多只能到略超出揚聲器布置的范圍,且總體的方差較大。

圖8 為不同仰角下,感知方位角和式(25)定義的方向偏差隨目標聲源方位角的變化規律。從圖8中可以看出,在不同的維度面,方向偏差隨方位角的變化趨勢是一致的,感知誤差會隨著方位角的變大而變大。而且,隨著仰角的增大,感知誤差也會逐漸變大。當目標方位角或目標仰角較大(大于45?)時,方向誤差快速增大,定位效果大幅下降。其中,當方位角為±90?時,甚至會出現誤差過大從而使受試者感覺無法定位的現象。故局域Ambisonics方法重放虛擬源,僅能夠在揚聲器布置范圍內和略超出揚聲器布置范圍產生虛擬源。但這已經能滿足伴隨圖像重放的實際要求了。

圖8 3 種信號不同仰角面的方向偏差和感知方位角Fig.8 Directional deviation and perceived azimuth of different elevation planes for three different signals

3.4 討論

在上面的實驗中,低通信號定位的效果不如其他兩種寬頻帶信號。事實上,對真實單聲源,頭部轉動引起的低頻動態因素(ITD)和耳廓等生理結構引起的高頻譜因素是垂直定位的兩個因素。一方面,兩個因素的協同作用能增強垂直定位;另一方面,兩個因素提供的信息有一定的冗余,當其中一個因素缺失時,只靠另一個因素也能在一定程度上進行垂直定位[10],這是多通路聲產生垂直定位的心理聲學基礎。

對本文涉及的空間聲重放,信號處理設計產生了期望的低頻動態定位因素。但由于重放實驗是在有一定反射的聽音室內進行(這是ITU 標準的規定[17],為了模擬實際家用重放的情況),聽音室的低頻反射對重放產生低頻動態定位因素多少是有一定影響的。對重放低通濾波信號,雙耳聲壓只包含(受到反射影響)低頻動態定位因素。而對于重放寬頻帶信號,雙耳聲壓同時包含低頻動態定位因素和高頻譜因素帶來的信息。雖然重放所產生的高頻譜信息并不能和目標聲源的情況一致。但由于實驗是采用布置在水平左前、右前、30?仰角左前上、右前上4個揚聲器重放的,揚聲器之間的垂直仰角與目標仰角差異不大。因此揚聲器本身提供了一種粗略的目標垂直定位譜信息(至少排除了虛擬源在正上方或后方的錯誤譜信息),它與低頻動態定位因素協同作用的結果,將在一定程度上改善寬帶信號的合成垂直定位。

將本文的局域Ambisonics 信號饋給與現有的信號饋給方法對比是有益的。理論和實驗結果[18]表明,現有的全局Ambisonics信號饋給能同時精確產生合成定位所需的ITD 及其隨頭部轉動的動態變化因素,因而能產生全空間(包括前方垂直方向)的定位效果。但全局Ambisonics信號饋給需要全空間相對均勻的揚聲器布置,和伴隨視頻重放的揚聲器布置并不匹配。

如前面引言部分所述,在揚聲器布置之間的張角比較大的情況下,現有的VBAP 信號饋給不能同時精確產生ITD 及其隨頭部轉動的動態變化因素,其重放虛擬源定位應該是有不足的,且存在對頭部轉動的穩定性問題。過去已有不少實驗對VBAP 的垂直定位特性進行了實驗的研究,Wendt等[19]討論了在不同揚聲器布置下使用VBAP信號饋給法,發現重放時改變目標仰角,感知到的方位角也會產生偏移;Baumgartner等[20]討論了在與本文相同的揚聲器布置下,使用VBAP 信號饋給重放前方聲源,發現低仰角時重放的感知精度較高,與局域Ambisonics重放的感知精度類似,高仰角時感知精度大幅下降,劣于局域Ambisonics重放的感知精度。

為了對比局域Ambisonics 信號饋給法與VBAP 信號饋給法的重放效果,補充了VBAP 信號饋給法的實驗。在上述相同的聽音室內,使用相同的式(1)、式(2)揚聲器布置,選取全頻帶粉紅噪聲信號進行定位實驗。定位實驗的條件、受試者、統計方法同前。目標聲源方向選擇為揚聲器布置范圍內的15 個方向,即5 個方位角θS分別為0?、±15?、±30?,每個方位角上3 個仰角?S分別為0?、15?、30?。因為理論和實驗結果都表明,VBAP 主要產生仰角方向的失真,為簡單起見,這里只給出仰角定位的結果。圖9 對比了不同方位角下的局域Ambisonic和VBAP的平均感知仰角和標準差隨目標聲源仰角的變化規律。從圖9中可以看出,使用局域Ambisonics 重放方法和VBAP 重放方法的定位效果是類似的,與相同目標方向的局域Ambisonics相比較,僅在揚聲器布置方向上VBAP 重放方法明顯優于局域Ambisonics 重放方法(對實驗結果進行方差分析可證明這點)。這是由于參考ITU 建議[2],實驗選取的4 個揚聲器布置的張角不大,VBAP 的誤差不算特別明顯,且聽覺對垂直方向定位的分辨率較低,故在揚聲器布置范圍內,VBAP 導致的仰角誤差在聽覺上不一定能分辨出。而目標聲源方向與重放揚聲器方向重合時,VBAP 僅由該方向的單一揚聲器發聲,故定位效果較好。但依據VBAP 的理論[3],只有重放虛擬源方向在選取的3 個揚聲器范圍內才能計算出揚聲器信號的解,故使用VBAP只能產生重放揚聲器布置范圍內的虛擬源。而本文所用的局域Ambisonics 重放方法可以在方位角和仰角上均略超出揚聲器布置方向下重放準確的虛擬源,由此可見,在局域Ambisonics 方法的垂直虛擬源效果是不劣于甚至略優于現有的VBAP 方法。并且現有的空間聲標準中[1],原始信號有可能是以空間諧波(Ambisonics)的形式給出的,因而只有采用全局或局域Ambisonics的信號饋給,而全局Ambisonics 信號饋給是不大適合非均勻的揚聲器布置的。這種情況下局域Ambisonics信號饋給應該是一種選擇。

圖9 兩種重放方法不同垂直面的方向偏差和感知仰角Fig.9 Directional deviation and perceived azimuth of different elevation planes for two different methods

本文的揚聲器布置是選取的國際標準給出的9.1 通路的參考揚聲器布置的前方4 個揚聲器,這是出于對定位穩定性及其他性能的綜合考慮。但在實際應用中,揚聲器的布置相對靈活,不同的揚聲器布置和不同的信號饋給對頭部平移的穩定性會產生不同的影響,如何根據聽覺感知和實際需要適當設計揚聲器布置與信號饋給是一個非常有意義且值得進一步研究的問題。此外,實際應用中使用的揚聲器的指向性也會影響聽覺方向定位,并且會影響重放音色,如何利用揚聲器指向性的實現局域目標聲場控制也是一個值得進一步研究的問題。

4 結論

一些典型的多通路空間環繞聲(如9.1 通路聲)包括了前方了水平面(或略低于水平面)的左前、右前,以及高仰角的左前上、右前上的揚聲器布置。利用這4 個揚聲器布置,一階局域Ambisonics 信號饋給方法可以產生合適的低頻ITD 及其隨頭部轉動的動態變化,從而在揚聲器布置的范圍內,甚至在略超出揚聲器布置的范圍內產生不同方位角和仰角的虛擬源。因而本文的方法可作為空間環繞聲重放的一種可選擇信號饋給法。

猜你喜歡
仰角局域揚聲器
薄如紙張的揚聲器
Focal&Naim同框發布1000系列嵌入式揚聲器及全新Uniti Atmos流媒體一體機
用銳角三角函數解決仰角、俯角問題
大地震 正式發布Cinenova系列揚聲器
局域積分散列最近鄰查找算法
自制手機揚聲器
分段三次Hermite插值計算GNSS系統衛星仰角
PET成像的高分辨率快速局域重建算法的建立
基于局域波法和LSSVM的短期負荷預測
基于非正交變換的局域波束空時自適應處理
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合