?

拒止環境下基于“忠誠僚機”的護航策略

2021-06-09 01:16田磊趙啟倫董希旺李清東呂金虎任章
北京航空航天大學學報 2021年5期
關鍵詞:時變僚機觀測器

田磊,趙啟倫,董希旺,4,*,李清東,呂金虎,4,任章,4

(1.北京航空航天大學 自動化科學與電氣工程學院,北京100083;2.北京航空航天大學 飛行器控制一體化技術國防科技重點實驗室,北京100083;3.北京電子工程總體研究所,北京100854; 4.北京航空航天大學 大數據科學與腦機智能高精尖創新中心,北京100083)

美軍為提高在拒止環境下的作戰能力,提出了分布式協同作戰的理念。拒止環境是美軍對強對抗環境的別稱,具有強電磁干擾、強對抗博弈等特點,而拒止環境勢必造成單體作戰效能的減弱,進而分布式協同作戰理念廣受關注?!爸艺\僚機”計劃是美軍為應對強對抗博弈環境而提出的新型作戰樣式,由少量高價值有人平臺和大量低成本無人平臺組成,是分布式協同作戰的重要組成部分。而編隊跟蹤控制技術為實現拒止環境下的“忠誠僚機”計劃提供了有力的技術支撐?,F有的編隊跟蹤控制方法主要分為集中式和分布式2種。集中式控制方法存在中心節點,對通信帶寬要求高,抗干擾能力差;分布式控制方法通過局部有限鄰居智能體之間的交互實現具體的任務,對通信帶寬要求低,具備良好的抗干擾能力和可擴展能力[1]。

隨著一致性理論的發展,近年來在分布式編隊控制領域涌現出豐碩的研究成果。Dong[2]和He[3]等分別研究了連續時間和離散時間條件下的編隊控制問題。Wang等[4]給出了一種單個智能體不依賴通信拓撲全局信息的編隊控制方法。Hua等[5]研究了系統存在不確定參數及未知擾動情況下的時變編隊控制問題。隨著研究的深入,研究者們將如何控制整個編隊的移動納入研究的重點,進而衍生出編隊跟蹤控制問題。Dong等[6]研究了二階多智能體系統的編隊跟蹤控制問題,并將其成功應用到無人機編隊飛行中。Yu等[7]基于擴張狀態觀測器理論構造分布式的控制協議,解決了多移動機器人系統的編隊跟蹤控制問題。Dong[8]和Yu[9]等分別研究了存在多個領導者情況下線性和非線性多智能體系統時變編隊跟蹤控制問題。Su等[10]給出了隨機采樣機制下多智能體系統內部同時存在通信延遲和多個領導者時編隊跟蹤控制問題的解決方案。Hua等[11-12]進一步將多智能體系統由同構模型擴展到異構模型,研究了異構多智能體系統的時變編隊跟蹤控制問題。為使編隊跟蹤能夠在有限時間內完成,Hua等[13]還研究了高階同構系統存在不匹配擾動情況下有限時間時變編隊跟蹤控制問題。更進一步,Duan等[14]研究了高階異構多智能體系統的有限時間編隊跟蹤控制問題。

綜上所述,有關時變編隊跟蹤控制的研究成果十分豐富,但需要指出的是,上述文獻并沒有對時變編隊隊形進行明確定義,僅用一個時變函數來概括性表示編隊偏移量,也沒有對時變編隊的應用性進行研究,而且該信息實際為全局信息在上述文獻中為隱含全局信息。本文提出了一種基于集群系統分布式時變編隊跟蹤控制方法的護航策略,并考慮了拒止環境對通信拓撲的影響,是編隊跟蹤控制方法的一種典型實戰應用。本文的創新點主要有:①基于分布式時變編隊控制理論,結合應用背景和工程意義,給出了一種能夠“忠誠僚機”的護航策略控制方法;②考慮長機-僚機系統存在外部擾動且長機存在大機動的情況,構造分布式觀測器對敵方來襲導彈的方位角進行估計,進而結合觀測器理論、自適應控制理論、滑??刂评碚撛O計了分布式控制器,擺脫了對敵方來襲導彈方位角、通信拓撲結構及未知擾動上界等全局信息的依賴;③考慮在拒止環境下,復雜電磁干擾帶來通信時斷時續,導致長機與僚機及僚機與僚機之間的通信拓撲存在切換,進而在上述分布式觀測器和控制器中加入通信拓撲切換信息,并根據Lyapunov理論給出了長機-僚機閉環系統的穩定性證明。

1 圖論知識和問題描述

1.1 圖論知識

1.2 問題描述

本文研究的系統模型為長機-僚機模型,包含1個長機和N個僚機。由于不同類型的飛行器近似線性化后的模型不盡相同,不失一般性,長機的模型定義為

僚機的模型定義為

式中:A、B為模型近似線性化后的系統矩陣;y1(t),yp(t)∈Rn為狀態量;u1(t),up(t)∈Rm為控制輸入量;dp(t)∈Rm為未知擾動量;p=2,3,…,1+N。

注釋1大多數空中飛行器在其工作點附近一般都可以近似線性化處理。例如,田磊等[15]給出了旋翼飛機近似線性化處理后的模型,Wang等[16]給出了固定翼飛機近似線性化處理后的模型。因此,上述長機和僚機定義模型的應用性較為廣泛。

假設1在圖G所表征的通信拓撲中,長機與某個僚機之間如果存在連接,則連接關系是從長機指向僚機的單向連接,而僚機之間的連接均為雙向連接。當有多枚敵方導彈來襲時,僚機被分為多個小組,且不同小組之間不存在通信,整個通信拓撲包含一棵以長機為根節點的生成樹。

如果假設1成立,當有M枚敵方導彈來襲時,圖G的拉普拉斯矩陣可寫為如下形式:

通過分析拉普拉斯矩陣的形式可知,對角塊矩陣Lg(g=1,2,…,M)為正定實對稱矩陣[17]。令Ldiag=diag{Lg,g=1,2,…,M}。

假設2圖G所表征的通信拓撲關系在某段固定時間間隔(定義為駐留時間τ)內保持不變,該段時間間隔的最小值定義為最小駐留時間,用τmin表示。定義t0=0為初始時刻,tσ+1(σ=0,1,2,…)為切換時刻,則駐留時間τσ=tσ+1-tσ≥τmin,在[tσ,tσ+1)時間間隔內的拉普拉斯矩陣記為Lσ。

假設3長機的控制輸入和僚機的未知擾動是有界的,但是其界限的具體數值是未知的,即滿足u1(t)1≤η1、dp(t)1≤η2,η1、η2為未知正實數。

注釋2在實際系統中,控制輸入量和未知擾動量通常是有界的,但是其界限值通常不容易獲取,因此假設2是合理的。

假設4長機上含有探測設備,能夠探測出敵方來襲導彈的方位角γg(t)(g=1,2,…,M)。

注釋3通常情況下,長機是價值較大需要保護的己方個體,長機上裝有探測裝置,可探測出來襲導彈的方位角。

引理1[15]對于任意正定實對稱矩陣H∈RM×M(M=1,2,…),下列不等式關系成立:

式中:λmin(H)為矩陣H的最小特征值。

引理2[15]對于任意正定實對稱矩陣H1,H2∈RM×M和任意向量x∈RM(M=1,2,…),下列不等式關系成立:

式中:λmax(H1H2-1)為矩陣H1H2-1的最大特征值。

定義1對于任意有界初始狀態,如果以下關系式成立,且該關系式中設計的時變編隊函數能夠使僚機一直處于長機和敵方來襲導彈的視線軸上,則稱本文提出的基于拒止環境下的時變編隊跟蹤控制方法的護航策略能夠實現。

式中:p=2,3,…,1+N;hp(t)為設計的時變編隊函數。

2 控制協議設計和系統穩定性分析

本節根據本文所提出的護航策略給出時變編隊函數的設計方法,同時考慮拒止環境帶來的影響,構造能夠實現切換通信拓撲關系的分布式時變編隊跟蹤控制協議。不僅如此,設計協議時結合自適應控制理論,解決系統的外部擾動和通信拓撲全局信息不易獲取的問題。通過Lyapunov理論對閉環系統的穩定性進行證明。

不失一般性,通過圖1(二維橫側向XOY平面內)可直觀地理解本文所提出的護航策略。

圖1 護航策略示意圖Fig.1 Schematic diagram of escort strategy

根據圖1中給出的策略可知,二維平面內的時變編隊函數可設計如下:

設計對γˉg(t)的分布式觀測器:

基于上述觀測器,構造分布式自適應控制協議如下:

式中:sgn(·)表示標準符號函數;αp(t)為自適應增益;hp(t)為時變編隊函數,其在OX軸和OY軸方向分別設計為式(7)中對應的函數,其他待確定參數由算法1確定,具體步驟如下:

步驟2根據下列Riccati方程計算正定實對稱矩陣Q:

式中:μ為可選取的正實數,滿足μ≤ˉκ;P為可選取的正定實對稱矩陣。

步驟3根據公式K=-BTQ計算增益矩陣K。

步驟4選取βp∈(0,+∞),βp為可調參數,可根據系統其他參數綜合選取,從而避免過慢的響應速度或過高的控制增益。

證明首先證明分布式觀測器(9)的收斂性。

由式(9)可知

式中:t∈[tσ,tσ+1),σ=0,1,2,…。

對Vˉg(t)求導可得

由式(14)可得

因為系統的通信拓撲在tσ(σ=1,2,…)時刻發生切換,由引理2可得

根據式(15)和式(17)可以推出

運用遞歸方法可得

根據t-t0=t-tσ+tσ-tσ-1+…+t1-t0≥t-tσ+στmin可以推出

由lnε-μτmin<0和μ≤可得0,進而可知,等價于0,由于,而為非奇異矩,因此觀測器(9)是收斂的。

接下來證明在控制協議(10)下,本文所提出的拒止環境下基于時變編隊跟蹤控制方法的護航策略可以實現。對于所有僚機,將式(10)代入式(2)中可得

令zp(t)=yp(t)-hp(t)-y1(t),同時定義z1(t)=0,可以推出

根據算法1中的步驟1及式(8)和式(10)可知,Bvp(t)-˙hp(t)+Ahp(t)=0,因此式(22)可寫為陣,可得

可得

令z(t)=[z2(t),z3(t),…,z1+N(t)]T,u(t)=1?u1(t),d(t)=[d2(t),d3(t),…,d1+N(t)]T,同時令α(t)=diag{α2(t),α3(t),…,α1+N(t)},其中1為元素全部為1的列向量,則式(24)可寫為如下形式:

考慮Lyapunov函數如下:

式中:χ為可選取的正常數;t∈[tσ,tσ+1),σ=0,1,2,…。

對V(t)求導并由K=-BTQ可得

因為

且根據δTsgn(δ)=δ1可得

所以式(27)可化為

進一步分析可得

同時分析可知

因此可以推出以下關系式成立:

根據引理1可知

選取足夠大的χ滿足:χ>max{η1+η2,

1/(2λmin(Lσdiag))},并 根據算 法1中 的 步 驟2可得

由式(36)可以推出

因為系統的通信拓撲在tσ(σ=1,2,…)時刻發生切換,由引理2可得

因為ξ(t)是連續的,因此以下關系式成立:V(tσ)≤εV)+(1-ε)ξ(tσ) (39)

由式(37)可推出

結合式(37)和式(39)可得

進而根據式(40)和式(41)可以推出

同理可以得到以下關系式:

因此可將式(42)進一步化為

更進一步運用遞歸方法可得

式中:

現對V*(t)進行分析,運用分部積分法可得

接下來分2種情況討論:

3 數值仿真

仿真中模仿敵方導彈來襲場景,為更好地驗證本文所提出的護航策略,想定如下:在拒止環境下,我方1架空中預警機通過預警雷達探測到3枚敵方來襲導彈的方位角,在進行機動規避時同步釋放6架小型無人機擔任“忠誠僚機”,引導這些小型無人機處于敵方來襲導彈的視線軸上。為模擬拒止環境給通信帶來的不利影響,我方預警機與小型無人機采用分布式通信方式,每種通信拓撲結構只能維持極短的時間,時變拓撲的切換過程如圖2所示,每次切換后的通信拓撲在G1、G2、G3中隨機選取。為簡化仿真計算,仿真僅考慮XOY橫側向平面內的質點運動,并采用文獻[15]中的模型進行仿真驗證,即經過近似線性化處理后,模型的系統矩陣為

圖2 拒止環境下的通信拓撲關系Fig.2 Communication topologies in denial environment

圖3 分布式觀測器的估計誤差Fig.3 Estimate error of distributed observer

圖4 無人機自適應增益曲線Fig.4 Curves of adaptive gains for UAVs

圖5 整個護航過程圖例Fig.5 Legend of whole escort process

圖6 護航誤差曲線Fig.6 Curves of escort error

4 結束語

本文提出了一種基于“忠誠僚機”的護航策略,該策略主要采用分布式時變編隊跟蹤控制的相關方法,設計控制協議時結合了觀測器理論、自適應控制理論、滑??刂评碚摰?,通過理論推導和仿真計算驗證了該策略能夠實現拒止環境下長機-僚機系統通信受到干擾時僚機對長機的護航作用,具有良好的工程應用意義。

猜你喜歡
時變僚機觀測器
優化反饋補償閉環定子磁鏈觀測器
含干擾項的非線性廣義系統執行器故障估計*
基于觀測器的非脆弱控制研究及其在混沌系統中的應用*
忠誠僚機
你不是一個人在戰斗
|直接引語和間接引語|
基于馬爾可夫時變模型的流量數據挖掘
基于滑模觀測器的無傳感器PMSM仿真
基于時變Copula的股票市場相關性分析
基于時變Copula的股票市場相關性分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合