?

彈群分布式一致誤差約束自適應最優協同攔截方法

2023-10-07 01:48劉大衛孫景亮龍騰何鏡王曉悅
兵工學報 2023年9期
關鍵詞:制導系統制導機動

劉大衛, 孫景亮, 龍騰, 何鏡, 王曉悅,2

(1.中國兵器科學研究院, 北京 100089; 2.北京理工大學 宇航學院, 北京 100081;3.北京理工大學重慶創新中心, 重慶 401120)

0 引言

隨著現代科技的飛速發展,無人機、巡航導彈等具備飛行速度快、機動能力強等特點的先進飛行器給攔截制導系統帶來了巨大技術挑戰。傳統的一對一攔截制導方式已難以滿足低成本、全方位、飽和攻擊能力需求,一定程度上降低了攔截制導系統對機動目標的攔截概率[1]。協同攔截制導能夠通過彈間信息交互、戰術配合,完成對機動目標的飽和同時或者序貫攻擊,對降低機動目標的攔截脫靶量、提升動態環境下制導系統的魯棒性和可靠性,具有重要的理論和工程價值。

現有協同制導方式主要包括隱式協同制導和顯式協同制導兩類。隱式協同制導主要通過預先設定協同變量(攻擊時間、攻擊角度等)以及各發導彈獨立控制的方式進行。該協同制導方式不存在彈間的信息交互與配合,本質上屬于一對一單彈制導[2]。顯式協同制導主要通過彈間信息的交互與協調,實現協同變量的協調一致,達到同時攻擊或者序貫攻擊的協同目的。因此,顯式協同制導方式得到了國內外學者的廣泛關注與青睞,并取得了較好的研究成果。

針對顯式協同制導,文獻[3]針對地面靜止目標提出了導彈剩余時間一致的分布式協同制導律。文獻[4]考慮艦炮制導彈藥的協同攻擊問題,通過設計擴張狀態觀測器,提出了非奇異終端滑模自適應控制器,實現了有限時間內艦炮趨同攻擊,提升了對機動目標的協同制導性能。進一步,為了避免剩余時間估計誤差對協同制導精度的影響,文獻[5]考慮機動目標協同攔截制導問題,將導彈與目標之間的相對距離設計為協同變量,并基于多智能體一致性理論,設計了有限時間一致收斂的分布式預設性能協同制導律,實現了多彈對機動目標的協同打擊??傊?近年來針對靜止/機動目標的多彈協同制導方法已取得了較好的研究成果[6-8]。但現有大部分方法均關注于閉環系統的穩定性和協調變量的一致性問題,對協同制導最優性缺乏考慮,降低了協同制導性能。

基于此,最優協同制導以及微分博弈協同制導問題得到部分學者的關注[9-12]。例如,文獻[9]將協同制導問題描述為考慮模型不確定的線性多智能體微分博弈問題,基于領航-跟隨協同控制理論,通過對標稱模型進行納什均衡解的解析計算,獲得近似最優的協同制導律。但上述方法均采用線性化假設,基于線性二次調節器理論進行推導。在考慮目標大機動特性時,該類方法通常難以滿足小擾動線性化假設,降低了對機動目標的打擊概率。另一方面,由于復雜戰場環境以及目標機動干擾導致的協同制導系統模型部分未知問題,進一步降低了協同制導性能。因此,考慮目標機動特性,研究模型部分未知條件下非線性最優協同制導方法,對提升系統魯棒性、降低協同制導脫靶量,具有重要工程價值。但非線性最優協同制導律的設計通常涉及耦合偏微分哈密頓-雅可比-貝爾曼(HJB)方程的求解??紤]該HJB方程通常難以獲得其解析解,限制了非線性最優協同制導律的設計。

自適應動態規劃(ADP)技術作為一種類腦智能控制方法,近年來通過與反步控制方法相結合,已被應用于非線性最優協同控制/微分博弈問題的求解[12-14],并展現出較大的發展潛力。在ADP攔截制導領域,文獻[15-17]研究了攔截制導系統模型部分未知、過載飽和以及狀態、輸出限制等約束條件下的攔截制導問題,通過將ADP技術融入反步控制設計中,實現了對機動目標的攔截。但上述研究僅針對一對一攔截制導問題,難以滿足多彈協同一致收斂攔截制導需求。文獻[18]考慮未知機動目標的協同攔截制導問題,設計了分布式自適應反步最優制導律,實現了過載飽和約束下視線角協同一致攔截制導。上述研究均將非線性制導控制問題通過反步法設計思想轉化為等效最優制導控制問題,采用ADP技術實現了全局最優制導控制。但在虛擬控制量的設計過程中并未考慮控制量的最優化問題?;诖?文獻[19-21]在反步控制設計架構下,考慮輸入、狀態約束,通過構建執行-評價網絡,在線逼近了最優虛擬和實際控制量。然而,上述結果僅適用于單個非線性系統的最優控制問題,尚不能滿足非線性協同最優控制問題的求解??紤]協同制導問題中目標機動干擾導致的模型部分未知、輸出約束受限等問題,如何借鑒該設計思想實現對非線性協同制導律的在線求解,估計非線性模型未知干擾,補償約束受限影響,提升協同制導問題的魯棒性和可靠性,仍有待進一步深入研究與探討。

本文將ADP技術與反步法有機融合,構建“前饋補償+反饋優化”的復合協同制導架構,研究目標未知機動下分布式一致誤差約束的協同攔截制導問題。主要創新點為:

1)設計了統一障礙Lyapunov函數非線性約束映射機制,放松了對傳統方法誤差約束存在性的限制,提升了攔截制導系統的魯棒性;

2)設計了線性反饋增強的非線性自適應最優攔截制導律,實現了虛擬控制量的最優在線迭代求解,提升了誤差一致收斂速率。

1 多彈協同制導建模

1.1 協同攔截制導問題描述

考慮發導彈協同攔截一個機動目標的情形,在二維平面上,其協同攔截制導幾何關系如圖1所示。圖1中,Oxy為平面直角坐標系,M1,M2,…,MN表示N發導彈,T表示機動目標,vi、αi、θi分別表示第i發導彈的飛行速度、航跡角和視線角,i=1,…,N,ri為第i發導彈與目標在視線方向的相對距離,ui為第i發導彈垂直于速度方向的控制輸入,vT、β分別表示目標的飛行速度和航跡角,uT表示目標垂直于速度方向的控制輸入。假設所有導彈與目標的飛行速度均為常值,且各導彈之間主要依靠拓撲網絡進行通信,即第i發導彈只能與其鄰域內的導彈進行通信。

圖1 多彈協同制導幾何關系

協同攔截相對運動學關系為

(1)

(2)

(3)

基于以上分析可知,所設計分布式協同攔截制導律需滿足以下3個條件:

1)保證所有導彈最終能夠擊中目標,即ri→0 m;

(4)

基于式(4),多導彈協同制導問題就可以轉化為非線性多智能系統的協同控制問題。本文主要通過設計分布式自適應最優控制律,保證系統中狀態變量xi一致收斂于0,從而實現多彈協同制導。

導彈與目標自動駕駛儀均為如下1階動態系統:

第i發導彈質心運動方程為

(5)

式中:(xMi,yMi)表示導彈的位置坐標信息;ai表示導彈側向加速度;τMi為第i發導彈的自動駕駛儀時間常數,τMi=0.1 s。

目標質心運動方程為

(6)

式中:(xt,yT)表示機動目標位置坐標信息;aT為目標側向加速度;τT表示目標自動駕駛儀時間常數,τT=0.1 s。

由式(1)可知,當導彈接近目標即ri→0 m時,非線性動力學趨于無窮大。此時,非線性協同攔截制導系統式(4)不可控。但考慮到實際攔截制導系統中由于測量設備的物理限制,總是存在一個彈-目最小距離ε0。當攔截制導脫靶量滿足ri≤ε0時制導過程結束,之后導彈將以慣性力飛向目標,實現攔截。此外,由式(4)可知,當|αi-θi|=0°,|β-θi|=0°時,攔截制導系統輸入矩陣為零,目標機動輸入矩陣也為零,此時攔截制導系統已不再滿足可控性條件,無法為其設計協同攔截制導律。因此,本文設計的協同攔截制導律的可行域范圍可定義為

(7)

考慮來襲機動目標的物理特性以及推力限制,基于式(4),給出如下普遍性假設條件:機動目標垂直于速度方向的控制輸入uT是有界的,即存在一個未知正常數ζv>0,使得不等式|uT|≤ζv成立。

1.2 圖論知識

1.3 協同攔截制導問題轉化

基于式(4),多彈協同攔截制導問題可描述為一類由N個跟隨者和1個領導者組成的嚴格反饋非線性多智能體系統的協同控制問題,其中每發導彈均可看作是一個獨立可控的智能體:

(8)

通過對上述協同攔截制導問題的描述,制導律的設計可轉化為設計分布式控制律,抑制系統式(8)的輸出信號違背約束,從而保證系統的閉環穩定性。

考慮協同攔截制導系統實際物理特性,結合式(4),可知gi,q(·)=[0,sin(αi-θi)]T,顯然,gi,q(·)為有界矩陣。此外,rd(t)為參考軌跡,在本文中表示領彈輸出的彈-目攔截軌跡,因此必然為連續可導的光滑信號?;诖?本文可給出如下假設[22]:

1.4 統一障礙Lyapunov函數設計

為有效補償輸出約束,設計如下障礙Lyapunov函數(BLF):

(9)

傳統形式VCBLF[23]為

(10)

(11)

(12)

2 分布式自適應最優控制器設計

通過定義如下動態誤差面,構建前饋補償+反饋優化的復合控制架構:

(13)

式中:λi,q為1階濾波器輸出信號。濾波器設計如下:

(14)

基于復合控制架構,分布式控制律設計如下。

2.1 設計虛擬控制輸入

對誤差動態面zi,1求導,整理可得

(15)

(16)

式中:Θi,q∈RL×m為觀測器理想權值;Φi,q(zi,q)∈RL為激勵函數,L為神經元個數;ζi,q為觀測誤差,‖ζi,q‖≤ζi,qM,ζi,qM>0。

因此,式(15)可轉化為

(17)

定義Lyapunov函數為

(18)

對式(18)求1階導數,通過不等式變換,可得

(19)

(20)

(21)

式中:li,1>0為可調節參數。

將式(20)、式(21)代入式(19),整理可得

(22)

(23)

(24)

式中:γi,q,q=1,…,ni為預先給定的參數。

(25)

基于最優控制理論,定義哈密頓函數為

(26)

(27)

且相應的HJB方程為

(28)

(29)

式中:Wi,1∈RLi,1為理想權值;σi,1(zi,1)∈RLi,1為激勵函數;εi,1為評價網絡逼近誤差。

進一步考慮理想權值Wi,1未知,采用估計值代替:

(30)

因此,估計的虛擬反饋控制律可表述為

(31)

相應估計的HJB方程變化為

Hi,1(zi,1,i,2,i,1)=



(32)

基于梯度下降法,考慮閉環系統穩定性,設計評價網絡權值自適應更新律為

(33)

基于上述設計,定義式(34)所示Lyapunov函數,分析zi,1子系統的穩定性:

(34)

對式(34)求1階導數,可得

(35)

(36)

(37)

基于式(36)、式(37),式(35)可整理為

(38)

(39)

此時,式(39)可變換為

(40)

式中:λmin(Mi,1)表示矩陣Mi,1的最小特征值。

2.2 設計虛擬控制輸入

(41)

(42)

式中:li,q>0、ρi,q>0均為設計參數。

同理,第q步的估計虛擬反饋控制律i,q+1和評價網絡權值自適應更新律分別設計為

i,q+1=

(43)

(44)

此外,考慮zi,q子系統閉環穩定性證明過程與zi,1子系統相似,省略詳細推導過程,可得Lyapunov函數的1階導數形式為

(45)

2.3 設計實際控制輸入ui

(46)

(47)

式中:li,ni>0、ρi,ni>0為設計參數。

(48)

(49)

同理,經理論推導,可得zi,ni子系統的Lyapunov函數1階導數形式為

(50)

3 系統穩定性分析

基于第2節每個子系統的理論分析與虛擬和實際控制輸入設計,給出如下定理。

定理1針對非線性多智能體系統式(8),設計前饋控制輸入式(46),自適應權值更新律為式(47);同時設計估計的反饋控制輸入為式(48),評價網絡權值更新律設計為式(49)。通過選擇設計參數,可保證閉環系統協同一致誤差有界,且輸出信號滿足約束條件,同時能夠最小化給定的性能指標。

證明選擇Lyapunov函數為

(51)

(52)

(53)

基于式(53),式(52)可變換為

(54)

(55)

(56)

由式(55)、式(56)可知,通過調整設計參數li,min、C1i,k、C2i,k和ki,k,可保證μi和λi,min(Mi)足夠大且κi足夠小,從而保證閉環信號收斂域縮小,實現協同跟蹤誤差的最終收斂。然而,在控制律設計中需要選取的主要參數較多,如li,q、γi,q、ki,q、ηi,q、C1i,k、C2i,k等,其中li,q和ki,q為反饋增益系數,較大的li,q和ki,q可保證系統響應速度加快,同時也導致較大的過載要求。γi,q主要用于權衡收斂誤差和控制輸入,一般可選取為1。ηi,q為學習率,取值范圍為ηi,q∈(0,1)。C1i,k、C2i,k為評價網絡權值更新律參數,為保證矩陣Mi,q正定,通常選取較大的C2i,k和較小的C1i,k。

4 數值仿真

假設目標機動形式為正弦蛇形機動[28],可表述為aT=100sin(2t)m/s2??紤]由1發領彈M0和2發從彈M1、M2對目標進行協同攔截。其中,3發導彈在攔截過程中可進行信息交互,其通信拓撲結構如圖2所示。

圖2 彈間信息交互拓撲圖

各彈初始位置和初始航跡角信息如表1所示。

表1 彈-目初始參數

領彈采用比例導引法給出彈-目相對距離參考軌跡,作為從彈1和從彈2的期望輸出軌跡。從彈和目標的速度分別為:vi=600 m/s,vT=400 m/s。

對于從彈1,設計參數選取為:前饋輸入中,l1,1=200,l1,2=1 000,ρ1,1=0.8,ρ1,2=0.4,Σ1,1=I,Σ1,2=0.05I;反饋輸入中,γ1,1=γ1,2=1,k1,1=0.2,k1,2=20,η1,1=η1,2=0.5,C11,1=120·[1,1,1,1]T,C21,1=8I,C11,2=10·[1,1,1,1]T,C21,2=0.2I。

對于從彈2,設計參數選取為前饋輸入中,l2,1=50,l2,2=1 000,ρ2,1=2,ρ2,2=0.08,Σ2,1=Σ2,2=I;反饋輸入中,γ2,1=γ2,2=1,k2,1=0.5,k2,2=120,η2,1=η2,2=0.5,C12,1=20·[1,1,1,1]T,C22,1=2I,C21,2=200·[1,1,1,1]T,C22,2=0.05I。

仿真結果如圖3~圖6所示。圖3給出了3發導彈協同攔截機動目標的軌跡,可直觀看到3發導彈在不同初始位置上,經過協同調整,完成了對蛇形機動目標的同時攔截。由于從彈1和從彈2的初始位置相較于領彈距離目標初始位置更近,在勻速飛行狀態下,攔截時間更短。因此,為了保證3發導彈同時攔截,2發從彈均通過增加航程的方式調整軌跡,達到彈間協同的目的。圖4給出了各彈與目標的相對距離變化曲線,可直觀地理解對彈-目剩余距離的調整。

圖3 多彈協同攔截軌跡

圖4 彈-目相對距離

具體脫靶量和攔截時間參數見表2。從表2中可知,3發導彈均能夠實現對目標的攔截制導,且三者之間的攔截時間最大誤差為0.01 s,能夠滿足同時打擊性能要求。當然,也可通過調整設計參數,在犧牲一致性的前提下降低攔截制導精度。圖5給出了彈-目相對速率曲線??紤]從彈1和從彈2的初始位置距離目標較近,在導彈速度恒定的前提下,為了實現3發導彈的同時攔截,從彈1和從彈2均通過繞路的方式增加航程。此時,由于從彈1只接收領彈的輸出信號,而從彈2同時接收領彈和從彈1的輸出信號,2發從彈通過信息交互,協調彈-目相對距離,導致在制導開始的大約0.8 s內,彈-目相對速率發生了較大抖振,但隨后快速收斂并保持相對穩定的負值,表明導彈始終朝目標方向抵近。圖6 給出了從彈的視線角速率變化曲線。由圖6可以看出,各彈的視線角速率在經過制導初始階段的抖振后,始終維持在0 rad/s附近直到制導結束時刻,其呈現發散狀態。圖7給出了分布式一致鄰域誤差曲線,表明誤差能夠始終滿足輸出約束要求。

表2 協同制導性能

圖5 彈-目相對速率

圖6 視線角速率曲線

圖7 一致鄰域誤差曲線

從上述分析結果可知,本文方法能夠實現對蛇形機動目標的同時攔截,并滿足攔截制導性能需求,同時能夠保證系統分布式一致鄰域誤差信號滿足其約束限制,驗證了本文設計方法的有效性。

5 結論

本文針對機動目標的協同攔截制導問題,通過構建前饋補償+反饋優化復合制導控制架構,將ADP技術融入反步法過程中,實現了對虛擬控制輸入的優化設計,并繼承了反步法對輸出約束、未知干擾補償等問題的處理思想。得出以下主要結論:

1)本文設計的自適應最優協同攔截制導律能夠實現對蛇形機動目標的同時攔截制導,且攔截精度滿足性能要求,攔截時間一致性誤差可降低到0.01 s。

2)本文設計的自適應最優協同攔截制導律能夠從理論上保證了對存在或不存在輸出約束問題的協同一致問題處理的有效性,并兼顧了反步法和最優控制方法的優勢。

3)本文工作能夠為非線性自適應最優協同攔截制導方法研究提供借鑒思想。但考慮相關理論方法尚不完備,文中僅驗證了該方法的有效性,其魯棒性和適用性還有待進一步深入探討。

4)下一步工作的重點是進一步考慮多樣化目標機動未知特性,完善和優化算法,探索該方法的適用條件和能力邊界。

猜你喜歡
制導系統制導機動
裝載機動臂的疲勞壽命計算
12萬畝機動地不再“流浪”
機動三輪車的昨天、今天和明天
基于Simulink的導彈制導系統設計
基于MPSC和CPN制導方法的協同制導律
基于在線軌跡迭代的自適應再入制導
功能優先的制導系統伺服結構拓撲優化設計
帶有攻擊角約束的無抖振滑模制導律設計
雙源信號深組合導航在新一代運載火箭制導系統中應用初探
復合制導方式確保精確入軌
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合