?

基于組稀疏卡爾曼濾波的多步軌跡預測方法

2023-12-28 06:41張鑫海
空軍工程大學學報 2023年6期
關鍵詞:卡爾曼濾波步長軌跡

王 娜,羅 亮,彭 錕,張鑫海

(1.天津工業大學控制科學與工程學院,天津,300387;2.天津市電氣裝備智能控制重點實驗室,天津,300387;3.微光機電系統技術教育部重點實驗室(天津大學),天津,300072)

多步軌跡預測即利用運動目標的歷史軌跡信息構建預測模型,并輸出該模型對運動目標未來多個時刻的軌跡估計值。目前的研究以模型法和深度學習為主,前者一般利用卡爾曼濾波及其改進為基礎來構建預測模型。如文獻[1]提出的基于傳統卡爾曼濾波(Kalman filtering,KF) 的飛行軌跡預測方法。相比傳統卡爾曼濾波,擴展卡爾曼濾波能夠有效處理非線性模型的估計,如文獻[2]基于擴展卡爾曼濾波(extended Kalman filtering,EKF)實現對不確定情況下的無人駕駛車輛的軌跡預測;文獻[3]基于擴展卡爾曼濾波方法和差分自回歸滑動平均模型對上海中心大廈實測加速度幅值數據的實時變化趨勢進行預測。相比前兩類濾波方法,文獻[4]所提的多項式卡爾曼濾波方法能夠有效針對信息缺失、非線性、多機動情況,過程較為簡單,計算效率高,機動自適應較強,但通常易受模型誤差和數據噪聲影響,對于復雜的運動目標軌跡預測精度不高。上述卡爾曼濾波方法主要基于單模型法,所構建的運動模型存在數據處理難度大及預測精度低等問題,對此文獻[5]提出改進的交互式多模型軌跡預測算法。此外,上述卡爾曼濾波類方法由于只能輸出一步預測的估計值,故難以單獨應用于多步預測中。

與傳統模型法基于參數構建的思想不同,神經網絡基于數據驅動實現自主學習,對于數據特性考慮較為全面,可以實現復雜非線性時間序列的準確、多步預測。淺層學習神經網絡中,文獻[6]在BP神經網絡基礎上,引入雙三角函數變換思想,實現對船舶軌跡的精確預測;文獻[7]利用改進的狼群算法優化徑向基神經網絡學習過程,實現對無人艇動態障礙物的航行軌跡預測。深度學習方法不依賴運動目標的機理特性,數據容易獲得,且可利用歷史數據進行中長期軌跡預測,預測時間長且精度較高,故得到廣泛應用。如文獻[8]利用長短時記憶網絡(long short-term memory,LSTM)與一維卷積神經網絡(one-dimensional convolutional neural network,1DCNN)結合,實現對導彈軌跡的預測。文獻[9]利用門控循環單元網絡(gated recurrent unit,GRU)進行飛機軌跡預測,與傳統的循環神經網絡(recurrent neural network,RNN)和反向傳播網絡(back propagation,BP)相比,預測性能更優。文獻[10]引入雙向傳播機制和Mogrifier數據耦合模塊,改進傳統GRU網絡,使其預測性能進一步提高。綜上所述,神經網絡類方法能夠較充分繼承歷史信息,更適合處理時間序列的預測,但其內部參數較多,訓練耗時,且隨著時間序列的數量級增加,很容易出現梯度消失和梯度爆炸問題。

此外,神經網絡自身的結構和參數的確定受人為因素影響而缺乏客觀依據,因而導致預測誤差偏大,泛化能力較差。相比神經網絡,稀疏編碼(sparse coding,SC)能以少量的輸入特征矩陣與稀疏向量的加權和形式對原始輸出數據矩陣進行重構,無需人為調節參數,計算過程簡單,效率較高[11]。但稀疏編碼直接用于多步預測時,求解稀疏向量時計算量較大,為此,組稀疏編碼(group sparse coding,GSC)把輸入和輸出的系數矩陣以對角矩陣形式表示,僅通過一次計算即可輸出多個稀疏向量,有效降低了計算量,簡化了多步預測的計算過程[12]。目前稀疏編碼類方法通常用于結構健康檢測和圖像處理等領域,而在軌跡預測領域的應用較少,如文獻[13]針對Lamb波邊界反射引起的碼間串擾問題,采用移不變稀疏編碼方法進行信息恢復,提出了基于Lamb波的數據傳輸與缺陷檢測同步實現方法;文獻[14]針對在小樣本人臉表情數據庫上識別模型過擬合問題,提出基于特征優選和字典優化的組稀疏表示分類方法。

綜上所述,本文將組稀疏編碼[15]與卡爾曼濾波結合,提出了一種基于組稀疏卡爾曼濾波的多步軌跡預測方法(multi-step trajectory prediction method via group sparse Kalman filtering,MSTPM-GSKF)。

1 超前T步軌跡預測問題描述

(1)

2 GSC的基本原理

2.1 SC基本原理

給定軌跡序列Xg,稀疏編碼是以稀疏向量α和輸入特征矩陣D乘積的線性組合表示對應的輸出特征矩陣X[16],即:

(2)

式中:X=[x1,x2,…,xp]T,xi為X中第i個軌跡點,i=1,2,…,p,p為軌跡點個數;D=[d1,d2,…,dM],di=[xi1,xi2,…,xip]T為D中的第i個列向量,i=1,2,…,M,M為D中列向量集合的個數,xij為di中第j個軌跡點,j=1,2,…,p;α=[α1,α2,…,αM]T為稀疏向量,αi為α中第i個稀疏系數,i=1,2,…,M。

稀疏編碼中,給定輸入特征矩陣D,稀疏向量α直接影響著輸出特征矩陣X的精確性,因此對它的求解尤為重要,一般通過松弛算法轉化為優化問題求解[17]:

(3)

式中:λ為懲罰參數。

對于α的求解,傳統最小二乘(least square,LS)算法過程較簡單,但LS對于輸入多重共線性及輸入變量數大于數據個數等特殊情況,難以獲得穩定解[18],且求解效率較低。對此,最小角回歸算法(least angle regression,LAR)在誤差平方和函數中加入1范數,可以遞階地獲得重要輸入變量,提高特征選擇的準確性,有效改善上述問題,故本文采用LAR方法求解[15]。

LAR算法的基本思想如下:首先根據余弦相似度函數計算每個輸入特征向量與輸出特征向量的相關性,根據最大相關性值獲得對應的輸入特征向量,然后計算所有剩余的輸入特征向量與當前殘差向量的相關系數,從中篩選出絕對值最大的相關系數,選擇其對應的輸入特征向量,并將其與第一個獲得的輸入特征向量組合,獲取其角平分線,并在該角平分線方向繼續選擇輸入,直至所有輸入被選擇完畢,其原理如下:

圖1 最小角回歸原理

Step7計算搜索步長

2.2 GSC基本原理

組稀疏編碼是將多個輸入特征矩陣和輸出特征矩陣排列成對角矩陣形式的線性組合,從而對輸出特征矩陣進行稀疏表示的過程[12]:

(4)

式中:Di為第i個輸入特征矩陣;Xi為Di對應的輸出特征矩陣;αi為對應的第i個稀疏向量,i=1,2,…,J,J為輸入或輸出特征矩陣的個數。

3 IKF基本原理

(5)

式中:F為狀態轉移矩陣;k為迭代次數。

一步預測協方差陣P(k/k-1)為:

P(k/k-1)=FP(k/k-1)FT+Q

(6)

Q為過程協方差陣,則卡爾曼增益矩陣K(k)為:

(7)

其中H為觀測矩陣,S(k)為:

(8)

最后協方差陣P(k/k)更新為:

P(k/k)=[In-K(k+1)H]P(k/k-1)

(9)

(10)

其中V(k)為殘差,即:

(11)

當得到k時刻預測誤差與k-1時刻殘差的比例關系后,可利用V(k-1)對預測值進行修正,故本文進行以下改進:

1)將式(7)的S(k)-1替換為S(k-1)-1,獲得式(12):

(12)

2)把式(10)中V(k)替換為V(k-1),獲得式(13):

(13)

將式(13)替換式(10),并將式(12)置于式(7)之后,其余步驟同原基本卡爾曼濾波算法。

上述改進的優點在于,在原KF算法中,式(10)的結果是對當前狀態的最優估計,而改進后,用式(13)得到的結果為目標狀態修正后的超前一步預測值,該結果相比前者更加符合狀態預測的意義。

4 MSTPM-GSKF算法描述

針對多步軌跡預測問題,本文提出一種基于組稀疏卡爾曼濾波的多步軌跡預測方法MSTPM-GSKF,首先利用組稀疏編碼直接輸出多步預測結果,避免了迭代多步中預測誤差的累計,及繁瑣的調參以及模型訓練過程,然后與IKF結合,修正其預測值,輸出最終的預測結果,具體過程如下:

首先為方便起見,僅考慮單維坐標系的情況,給定該坐標系下的m個輸入數據,建立超前T步預測模型,如圖2所示。

圖2 基于GSC的超前T步預測基本原理

圖2的具體過程如下:首先,利用窗口長度為m,滑動步長為1的滑動窗口根據不同的預測時間間隔t,將h-t個軌跡數據劃分為多個軌跡序列,其序列個數為p=h-t-m+1,進而按時間順序進行排列,構成對應的輸入特征矩陣Dt:

(14)

其次,根據輸入數據進行時間間隔為t的時間延遲,構建對應的輸出特征向量Xt:

Xt=[xm+t,xm+1+t,…,xh]T

(15)

再次,利用所構建的T個Xt及Dt進行組稀疏編碼,并將所求解的稀疏向量αt按順序排列,構成系數矩陣A:

A=[a1,a2,…,aT]T

(16)

由卡爾曼濾波的計算過程可發現,當輸入數據為m×1的列向量時,其輸出也應為m×1的列向量,故其狀態轉移矩陣F應為m×m的方陣,且當預測步長為T時,為保證輸入輸出數據個數一致,即預測步長最大為T=m,因此,本節對于狀態轉移矩陣的建立如下。

對于單步預測,即預測步長T=1時,狀態轉移矩陣A為:

(17)

對于兩步預測,即預測步長T=2時,狀態轉移矩陣A為:

(18)

(19)

綜上所述,基于MSTPM-GSKF的多步軌跡預測方法如下:

Step1采集機動目標在單維坐標系下的h個歷史軌跡數據Xg={x1,x2,…,xh}。

Step2針對不同預測時間間隔t,構建輸入特征矩陣Dt及其相應的輸出特征向量Xt。

Step3利用GSC求解稀疏向量αt,構成系數矩陣A,建立T步預測模型。

圖3 基于MSTPM-GSKF的多步軌跡預測流程圖

5 仿真研究

本文利用X-Y-Z三維坐標系下的非線性函數軌跡驗證所提方法對機動目標軌跡預測的有效性,其參數方程如下:

(20)

其中0≤t≤10π,時間點數量為1 000個,時間間隔為0.01π,坐標單位為m,取前800個數據點作為訓練集來構建預測模型,后200個數據點作為測試集來輸出預測結果。分別在X、Y、Z方向上,對每一維的軌跡進行多步預測,最后組成三維空間的預測軌跡。

預測誤差指標采用均方根誤差(root mean square error,RMSE):

(21)

表1 m=2~8時MSTPM-GSKF的單步預測誤差比較

由表1可知,在軌跡點個數m=6時軌跡預測的均方根誤差最低,為0.003 3 m。當m=7和8時,隨著輸入軌跡點的增加,預測的均方根誤差均保持不變,仍為0.003 3 m,故可以確定,當m=6作為系統輸入較適宜。

輸入個數為6時,將預測步長從1增加到6,獲得軌跡的預測均方根誤差如表2所示。

表2 m=6時MSTPM-GSKF方法的多步預測誤差比較

由表2可知,在預測步長均勻增加下,所提方法的預測RMSE也隨之增加,如步長T=1增加到T=2時,預測誤差由3.3 mm增加到5.1 mm,增加了1.8 mm。步長T=2增加到T=3時,預測誤差增加了1.9 mm,而且隨著預測步長的增加,預測誤差逐漸增加,在T=4時,誤差精度為10-3m,之后隨輸入個數增加,預測誤差逐漸增加,但仍保持在10-2m左右。因此,預測步長為4是預測誤差變化趨勢的重要轉折點,但為便于和LSTM等其他神經網絡方法作仿真比較,這里取預測步長T=m=6。

為驗證m=6,T=6時所提方法的魯棒性,對測試數據集依次添加1~100 dB信噪比的高斯白噪聲,輸出的軌跡預測誤差曲線如圖4所示。

圖4 MSTPM-GSKF方法在不同信噪比下的軌跡預測誤差

由圖4可知,隨著信噪比的增加,MSTPM-GSKF方法的軌跡預測誤差逐漸降低,當取信噪比為1 dB時,預測誤差最大,為1 846 mm;信噪比為20 dB時預測誤差為284 mm,誤差曲線開始變得平緩,在信噪比為40 dB時預測誤差為52 mm,誤差曲線進一步平緩;之后,信噪比在60~100 dB范圍內,預測誤差曲線進入穩定狀態,預測誤差的值基本不變,為16 mm左右,體現出本方法在由低到高的信噪比變化下,具有較強的魯棒性,而且收斂速度較快。

為進一步驗證所提方法的有效性,設m=6,T=6下,將GSC、BP、LSTM和所提MSTPM-GSKF在X、Y、Z單軸及整體預測RMSE進行比較,見表3,BP和LSTM網絡的學習率η取0.1,訓練次數取500。

表3 BP、LSTM、GSC和MSTPM-GSKF在X、Y、Z軸及整體預測誤差的比較 單位:m

表3可見,和其他3種方法相比,所提MSTPM-GSKF方法預測誤差均為最小,在X、Y、Z軸的RMSE分別為1.6 mm、4.1 mm、15.2 mm,預測精度最高為10-3m,最低為10-2m,而GSC方法的預測精度最高和最低均為10-2m,BP網絡的預測精度最高為10-2m,最低為10-1m,LSTM網絡的預測精度最高為10-2m,最低為10-1m。通過上述比較可知,所提方法在單軸和三維坐標系下的預測精度均較高,顯示出它的有效性。

分析原因,這是因為BP和LSTM神經網絡中,內部采用tanh和sigmoid激活函數,待調參數較多,如神經元個數、學習率、批次等,而訓練結果的準確性直接受參數的影響,當某次訓練時這些參數選取不當而導致訓練結果不佳時,只能試湊選取新的參數進行下一次訓練。這種試湊選擇的主觀性易導致訓練結果不穩定,甚至會難以收斂。

而GSC只需要計算稀疏向量的系數α即可確定最終輸出結果,α采用最小角回歸算法估計求解,一般給定初值后,通過簡單的計算,即可獲得穩定的全局解,避免了BP和LSTM中由于初值選取和試湊選擇的主觀性而易于陷入局部極值的情況,確保了結果的準確性,因此預測誤差較小。所提MSTPM-GSKF方法在預測中,利用IKF的修正過程對GSC的預測結果進行誤差補償,因此預測精度高于GSC,在上述方法中預測性能最好。

結合本文第4節關于所提MSTPM-GSKF方法的穩定和收斂性證明,作進一步的仿真驗證,在輸入個數為6,預測步長為6時,獲得BP、LSTM、GSC和MSTPM-GSKF的三維軌跡預測結果,受輸入個數選取所限,實際軌跡點取198個,見圖5。

圖5 BP、LSTM、GSC和MSTPM-GSKF在198個軌跡點下的三維軌跡預測誤差

由圖5可知不同方法在每個軌跡點的預測誤差均具有一定波動性,其中LSTM的波動性最大,BP次之,然后是GSC方法,所提MSTPM-GSKF方法的波動性最小,說明它具有較高穩定性。

此外,本文為進一步加強穩定性的驗證,采用均值和方差指標來評價上述方法的預測穩定性,各方法的指標比較見表4。

表4 GSC、LSTM、GRU和MSTPM-GSKF方法軌跡預測誤差的均值和方差比較

由表4可知,所提MSTPM-GSKF方法的均值為0.013 3 m,方差為0.000 07 m2,遠遠低于其他3種方法,具有較高的穩定性。

X-Y-Z三維坐標系下,上述4種方法的預測軌跡和實際軌跡的對比如圖6所示。

圖6 BP、LSTM、GSC和MSTPM-GSKF的三維軌跡多步預測結果比較

由圖6可知,在機動性較強的實際點(0.312 9,0.987 7,2)處,BP法預測值為(0.338 2,1.096 7,2.081 0),距該點距離為0.138 1 m;LSTM法預測值為(0.372 9,0.998 5,1.953 7),距該點距離為0.076 6;GSC預測為(0.366 1,0.978 7,1.987 8),距該點距離為0.055 4。而本文所提方法MSTPM-GSKF的預測結果為(0.314 5,0.993 6,2.023 5),距該點距離僅為0.024 3 m,在3種方法中預測誤差最小,對于具有較強機動性運動目標的適應能力較好,故預測性能最好。

6 結語

本文首先利用LAR算法一次直接求解稀疏編碼方法中的稀疏系數,并且結合卡爾曼濾波一次學習多步預測過程,然后利用改進卡爾曼濾波來修正預測結果,確保其精確性,形成了基于組稀疏卡爾曼濾波的多步軌跡預測方法,最后通過與傳統淺層、深度學習神經網絡和組稀疏編碼方法的仿真比較,驗證了所提方法的有效性。

本方法不僅在建模時避免了人為因素對模型結構的影響,而且在預測中,當待預測目標的運動特性與所用訓練數據的特性相差較大時,BP和LSTM依然根據此訓練模型進行預測,參數失配會導致較大的預測誤差,而本方法利用改進卡爾曼濾波對組稀疏編碼的預測值進行了動態修正,有效減小了建模誤差產生的影響。因此對于機動目標的運動軌跡具有較強的預測性能。

猜你喜歡
卡爾曼濾波步長軌跡
基于Armijo搜索步長的BFGS與DFP擬牛頓法的比較研究
軌跡
軌跡
軌跡
基于遞推更新卡爾曼濾波的磁偶極子目標跟蹤
進化的軌跡(一)——進化,無盡的適應
基于模糊卡爾曼濾波算法的動力電池SOC估計
基于擴展卡爾曼濾波的PMSM無位置傳感器控制
基于逐維改進的自適應步長布谷鳥搜索算法
一種新型光伏系統MPPT變步長滯環比較P&O法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合