基于頻點影響的頻域盲源分離排序算法

2024-03-25 02:04張奇,肖瑛

大連民族大學學報 2024年1期

張奇,肖瑛

(大連民族大學信息與通信工程學院,遼寧大連 116605)

盲源分離是在未知源信號和傳輸信道參數的情況下,從觀測信號中恢復源信號的信號處理技術[1]。在實際信號處理中,由于傳輸延遲、干擾等情況的影響,接收端采集到的信號不是簡單的線性混合信號,而是復雜的卷積混合形式。卷積混合信號的盲源分離,在語音識別[2]、圖形信號處理[3]、頻譜檢測[4]、醫學信號處理[5]等多個領域都具有實際應用價值。

目前,解決卷積混合盲源分離分時域和頻域兩種方法。時域方法的主要核心是在時域找到一個分離濾波器[6],它的濾波階數與混合濾波器階數相同或更大,當濾波器階數過大時,時域方法會存在復雜的卷積運算。頻域方法是利用短時傅里葉變換(Short-time Fourier transform, STFT)將信號進行時頻轉換,并利用目前成熟的獨立分量分析(Independent Component Analysis, ICA)等[7]算法進行頻域盲源分離得到解混信號,因此頻域方法在卷積混合形式中扮演著重要角色。頻域方法操作簡單、易于實現,但ICA算法引入了幅度歧義性和排序歧義性[8],頻域方法的準則主要取決于信號頻點排序的準確性,故在進行反傅里葉變換之前,必須解決各頻點估計信號的歧義性問題,其中排序歧義性問題更為重要。

當前有多種解決排序歧義性問題的方法。Ikram等[9]利用信號間頻譜相位信息,估計各頻點波達方向角(DOA)來確認源信號,再以此為特征進行獨立分量聚類,確定所對應的信號源,這種算法需明確源信號的實際位置和環境,屬于半盲算法。Murata等[10]利用頻點的幅度相關度排序,依據相鄰頻點的頻譜幅度具有很高的相關性對頻點依次排序,但該性能不穩定、魯棒性差,某一頻點排序不準確將影響信號其他頻點的準確性。隨后薄祥雷等[11]演變出的IF-Murata算法提高了幅度相關性算法的頻點相關性,但依然存在著性能不穩定的缺點。

針對以上排序算法的不足,本文提出了基于頻點影響的改進頻點排序算法。該算法通過權重系數控制分離矩陣的一致性,保持頻點之間的相關性,并將得到的分離矩陣作為頻點排序的依據;再利用影響因子控制頻距和頻質對頻點排序的影響;最后找到一組相關性最大的頻點排列順序,解決排序歧義性問題,提高算法的穩定性和分離效果。

1 卷積混合的頻域盲源分離

假設有N個統計獨立的源信號si(t),i=1,2,…,N,卷積混合后傳感器接收到M個混合信號xj(t),則線性卷積混合模型可以表示為

(1)

式中:rk為時延參數;hij(k)表示為第i個源信號到第j個傳感器的混合濾波器參數;k為FIR濾波器的階數。當k>1時,為卷積混合模型,其線性卷積形式可以表示為

X(t)=H*S(t) 。

(2)

式中:S(t)=[s1(t),s2(t),…,sN(t)]T為源信號向量;混合信號向量為X(t)=[x1(t),x2(t),…,xM(t)]T;H是M×N的濾波器混合矩陣。

將式(2)兩邊進行時頻變換,得到各個信號的頻域混合模型:

X(f,τ)=H(f)S(f,τ) 。

(3)

式中:f為頻點;τ為幀序號;S(f,τ)=[s1(f,τ),…,sN(f,τ)]T和X(f,τ)=[x1(f,τ),…,xM(f,τ)]T分別為傅里葉變換后頻帶f上的第τ幀的源信號和觀測信號。

由此可得,頻域盲源分離的解混模型為

Y(f,τ)=W(f)X(f,τ) 。

(4)

本文通過聯合對角化方法[12]對信號各頻點進行分離,得到的分離信號需要解決幅度歧義性和排序歧義性問題。對于幅度歧義性可利用分離矩陣歸一化[13]得到解決。

(5)

其中Ws(f)為消除幅度歧義性的結果。排序歧義性的消除方法將在第2節進行敘述。

2 改進的幅值相關性排序算法

2.1 幅度相關性排序法

幅度相關性排序的含義是指同一信號相鄰頻點的相關性要比不同信號相鄰頻點的相關性要強,利用這一點可實現各頻點分離信號的重新排序。相鄰頻點相關系數定義如下:

(6)

式中:α和β為兩個實數向量;E(·)表示求均值;σα和σβ為方差。

Murata等人對于排序信號的頻點,以部分領域范圍內|f-g|≤L的信號作參考,找到以相鄰頻點幅度相關度之和的最大一組排列,作為該頻點的正確排列方式,目標函數如下:

(7)

經仿真實驗得到,Murata算法并不能有效分離復雜信號,主要是因該算法以權重對待各鄰近頻點所得的幅值相關性,沒有考慮頻點信號的質量和可靠性,如以質量差的頻點作為參考,將影響到整個頻點排序的準確性。

當頻點的距離逐漸增大時,同源信號不同頻點之間的相關性逐漸減小,可能就會出現同一源信號比不同源信號的相關性還要小。在頻域中計算頻點間的相關性得到如圖1。圖1(a)表示同源信號頻點之間的相關性,圖1(b)表示不為同一源信號頻點之間的相關性,圖1(c)表示同一源信號與不為同一源信號頻點之間的差值?？梢钥吹?存在著同一源信號比不同源信號頻點間相關性要小的現象,而這些不可靠頻點的存在,有可能引發頻點排序錯誤的現象。

(a) 同源信號頻點相關性

2.2 IF-Murata排序法

IF-Murata算法在Murata算法的目標函數上加入了影響頻點分離質量和頻點距離的影響因子η,根據不同頻點觀測信號特征設定不同的影響因子,來提高頻點排序的正確率。該算法原理是當不同信號之間的相關度大于同一信號的相關度時,頻點的距離大,而此時頻點間的距離與η成反比;而當分離子信號排序因分離質量差的頻點影響越小時,頻點間的距離和η成正比。為方便表述,以兩路源信號為例,IF-Murata排序法的目標函數可以表示為

(8)

(9)

(10)

(11)

圖2 不同δ值的信噪比

綜上,可以得到關于影響因子η的排序公式:

(12)

(13)

雖然IF-Murata算法可在一定程度上提高頻點排序的正確率,但是該排序法僅通過控制影響因子抑制頻點距離過大或分離質量較低的頻點,得到的信號分離效果并不理想。

2.3 基于頻點影響的排序算法

根據以上闡述可以得到,Murata和IF-Murata的排序算法,都未考慮到頻點行列式的連續性[14]對頻點排序的重要作用。

在分離矩陣行列式的均值與幅度|det(W(f))|相差較大的情況下,表明行列式的差異大,連續性較差,使頻點間的相關性下滑。衡量分離矩陣行列式連續性的差值為

(14)

(15)

卷積混合信號排序單個相鄰頻點存在干擾的情況下,將導致信號的順序歧義性,故應考慮頻點的界限范圍,范圍過長將增大算法的復雜度、分離性能下降,會出現同一源信號相鄰頻點幅值相關性大于不同源信號的幅值相關性不成立的現象,因此界限范圍的表達式為

μ2(g)=|g-f| 。

(16)

其式(16)表示為已排序頻點g對未排序頻點f的影響。其頻點間距越大則μ2(g)-1越小,減小了頻距對信號排序的作用,故μ2(g)與權重系數為反比關系。

從以上分析可以得到,已排序頻點g對待排序頻點f的權重系數為

(17)

式(17)中可以得出需要考慮兩個界限范圍,分別是分離矩陣行列式的均值界限范圍L1和頻點排序相鄰頻點的界限范圍L2。

圖3 分離矩陣行列式界限范圍不同時平滑差值

以兩路語音信號為例,利用源信號卷積混合后的混合信號來確定L2的值。設定L1為18時,取L2的不同值,可以得到L2變換值的分離信號信噪比如圖4。從圖4中可以得到,1≤L2≤9時分離信號信噪比不穩定;L2高于9時分離信號信噪比逐漸平穩。

圖4 幅度相關性界限范圍不同時分離信號信噪比

基于實驗結果設定14≤L2≤18,據以上所述,設定權重系數的函數為

(18)

綜上,關于權重系數的目標函數為

(19)

經以上分析,本文結合IF-Murata法的影響因子進一步對Murata法改進,得到頻點影響的排序算法,實現分離效果更優的卷積混合信號盲源分離,本文改進的算法叫做FR-Murata算法。該算法原理是利用權重系數κ對頻點和分離矩陣行列式的限制,再利用影響因子η對頻點距離和頻點分離質量的控制,提高算法的穩定性和分離信號排序的準確性。

對于多源多路混合信號模型,將式(13)求兩信號相關度改為求兩兩組合相關度的平均值,則本文算法的目標函數為

(20)

(21)

為檢驗本文頻點的排序順序,采用不同算法對語音信號進行分離,再利用下式(22)判定排序是否正確,若頻點排序正確置為0;否則置為1,如圖5。Murata算法各頻點得到的分離信號M-y(f,τ)與源信號s(f,τ)相關分析的曲線圖如圖5a,同理可得分離信號FR-y(f,τ)與源信號s(f,τ)的相關分析曲線圖5b。

(a)Murata算法頻點排序 (b)FR-Murata算法頻點排序

cor(y1(f,τ),s1(f,τ))≥cor(y2(f,τ),s1(f,τ)) 。

(22)

對比圖5各頻點排序的結果可以看出,圖5a中一部分的頻點相關性較高,而一部分的頻點出現了不相關現象,是因頻點排序時以錯誤頻點為依據,導致后面頻點連續出錯。加入影響因子和權重系數的FR-Murata算法是以可靠頻點為依據對頻點排序,保證了各頻點的相似性,因此,該方法排序正確率高,使分離信號有較高的準確性和穩定性。

3 仿真實驗與分析

3.1 實驗設置

為了檢驗在室內環境下信號的分離效果,利用模擬工具箱創造一個人為可控的真實室內環境[15]如圖6。圖6中描述了實驗中的房間大小、聲源位置和傳感器位置。實驗使用三路不同的純凈語音,每組語音分別為英文男音、英文女音和中文男音。其中,傳感器的采樣頻率為16 kHz;墻壁的反射系數為0.5;因實驗環境存在一定的噪聲干擾,故本文未再添加其他噪聲。為了簡潔,此處只顯示出一組傳感器得到的室內盲分離結果。

圖6 模擬房間分布圖

3.2 實驗仿真

卷積混合盲源分離的目的在于恢復出輸出順序正確的分離信號。三路源信號時域波形圖如圖7a;三路混合信號時域波形圖如圖7b;Murata算法輸出的時域信號波形圖如圖7c; FR-Murata算法輸出的時域信號波形圖如圖7d。從圖7c可以看出,Murata算法得到的估計信號有較多的毛刺,并且能明顯聽到雜音的存在。本文FR-Murata算法得到的時域信號波形圖7d相比圖7c更貼近源信號,毛刺較少,主觀上更易區分。

(a)源信號時域波形

3.3 分離結果評估

由于信號波形不能準確分析分離結果,本文利用相似系數和盲源分離工具箱[16](Blind Source Separation Evaluation,BSS-EVAL)的三個性能指標進行分析。

相似系數的數學表達式為

(23)

對比Murata算法的計算數據,可以看出FR-Murata算法的相似系數平均提升了約0.1,表明本文算法具有較高的估計精度。

盲源分離工具箱是將分離信號y(t)分解為式(24)所示的幾個部分,其中eartif(t)表示由算法產生的人造誤差;starget(t)表示正確的估計信號;einterf(t)表示估計信號中不屬于源信號但屬于觀測信號的一部分,這是因其他源信號造成的干擾誤差。

y(t)=starget(t)+einterf(t)+eartif(t) 。

(24)

因此可以得到三個性能參數,分別為源信號干擾比(Source-to-Interference Ratio,SIR);系統誤差比(Source-to-Artifacts Ratio,SAR);源信號失真比(Source-to-Distortion Ratio,SDR);其數學表達式如下:

(25)

(26)

(27)

為了與FR-Murata算法做比較,同時對傳統Murata算法和改進的IF-Murata算法進行性能分析。語音信號卷積混合盲源分離的性能參數對比圖如圖8。從圖8中可以看出,本文FR-Murata算法在SIR,SDR,SAR上相較于其他兩種算法均有較大的提升。其中,本文算法在SIR上比Murata算法最高提升約6.1 dB,SDR最高提升約5.8 dB,SAR最高提升約3.9 dB,充分驗證了在室內混響環境下本文FR-Murata算法具有較好的分離性能和魯棒性。

(a) 語音信號SAR性能對比

4 結語

頻域卷積盲源分離算法須解決不同頻點的排序歧義性問題。針對排序問題,本文結合IF-Murata排序法的影響因子,提出了改進的FR-Murata頻域卷積混合盲源分離排序法。算法中同時引入了權重系數和影響因子,考慮了頻距和頻質的影響,以及分離矩陣行列式的連續性,使頻點以可靠頻點為依據處于更準確的位置,從而提高了算法的穩定性和分離信號精度。仿真實驗結果中,FR-Murata算法的相似系數與傳統Murata算法相比平均提高了約0.1,在SIR、SDR、SAR的分離性能上均有大幅度的提升,表明了算法的有效性。