?

海上無人系統時間協同航跡規劃

2022-09-06 08:42尹逢川梁曉龍陶浩侯岳奇齊鐸吳賢寧
中國艦船研究 2022年4期
關鍵詞:航跡成功率起點

尹逢川,梁曉龍*,陶浩,侯岳奇,齊鐸,吳賢寧

1 空軍工程大學 空管領航學院,陜西 西安 710051

2 中國艦船研究設計中心,湖北 武漢 430064

0 引 言

自美軍于2011 年提出空海一體戰以來,隨著多域戰(multi-domain battle)、多域作戰(multidomain operation)等作戰概念的遞進演變,當前作戰環境已不再局限于單一作戰域,而是逐步向跨域協同、多域融合過渡。近年來,不斷發展的無人裝備與跨域協同概念相結合,一種新型的作戰概念—海上無人系統作戰應運而生。然而,制約海上無人系統形成作戰能力的關鍵技術,如通信自組網、協同態勢感知、任務分配、航跡規劃、編隊控制、虛擬測試等還需要進一步發展。

海上無人系統是指由海上無人駕駛、可通過遙控操作或自主行動的機動載具或航行器,以及完成任務所必須的有效載荷和支持組件共同組成的系統,主要包括無人機(unmanned aerial vehicle,UAV)、無人艇(unmanned surface vehicle,USV)和無人水下航行器(unmanned underwater vehicle,UUV)[1]。針對海上無人系統跨域分布的特點,協同航跡規劃是其中一項重要的關鍵技術。海上作戰環境復雜,海上無人系統從出發點到達目標區域需穿越敵方雷達、聲吶網、水雷區等威脅區,但受限于自身的航速和所使用的燃油,需要在任務實施前規劃出一條能夠滿足所有約束條件的最優航跡,從而提高執行任務的效率。

同構無人集群的路徑規劃問題涉及高維的等式和不等式約束,以及時空協同的要求。近年來,為了解決這個問題,有學者研究了各種路徑規劃算法,包括集中避碰規則和時間調整策略[2-5]。算法主要分為2 類:一類為傳統方法,例如廣義的Tau 理論[6]、動態規劃[7]、人工勢場法[8]等;另一類是基于種群的進化算法,例如粒子群優化(PSO)算法[9-10]、遺傳算法(GA)[11]、螢火蟲算法(FA)[12]等。但這些方法多側重于避障,較少考慮集群內的時空協同。為了解決需要同時到達的航跡規劃問題,Liu 等[13]提出了4D 航跡規劃方法,即在三維中加入時間維度,為解決帶有強時間約束的多UAV 航跡規劃問題提供了新的思路,但卻沒有考慮航跡點數量對規劃成功率的影響。黃書召等[14]在其仿真結果中展示了航跡點數量對航跡規劃成功率的影響,但未針對產生該影響的原因做出解釋。

與同構多無人系統之間的協同航跡規劃研究相比,針對異構多無人系統協同航跡規劃研究的報道較少。在復雜環境下,侯岳奇等[15]量化了對空海等各類障礙和威脅并建立二維數學模型,然后在眾多內外約束下,使用差分進化(DE)算法完成了由UAV 和USV 構成的異構集群的協同航跡規劃。Wu[16]提出了一種UAV 和UUV 協同搜索跟蹤水下目標的協同框架與跟蹤算法。在海上無人系統內,平臺間的跨域通信能力較弱,UAV 與UUV 要直接進行通信很困難,因此,UAV,USV和UUV 的跨域協同成為一個解決跨域通信的方法。Wu 等[17]提出了一種UAV,USV 和UUV 協同通信和搜索的框架,其中USV 為空中與水下通信的中繼,可更高效地完成水下目標搜索追擊任務。

由上述研究情況可以看出,現有的方法主要集中在解決同構平臺的航跡規劃,以及滿足異構平臺協同所需要的通信距離約束上,而較少考慮航跡點數量對航跡規劃成功率的影響,以及由UAV,USV 和UUV 構成的海上無人系統到達目標區域的時空協同問題。在一些典型的任務中,例如多域飽和攻擊水面目標任務,如果平臺沒有同時到達陣位,目標有可能會逃逸,從而使攻擊任務失敗。這類任務就對各個平臺的時空協同提出了較高要求。

對于海上無人系統時間協同航跡規劃問題,本文將首先針對海上靜止目標多域飽和打擊任務,對空中、水面和水下的自然威脅以及敵方威脅進行建模,設計優化函數,并使用DE 算法完成航跡求解;然后,針對多域飽和攻擊任務需要精準的時空協同的問題,為UAV,USV 和UUV 設計出發點不同、目標點相同的時間協同策略并進行仿真實驗驗證;最后,由仿真結果分析并總結航跡點數量與規劃成功率之間的關系。

1 時間協同航跡規劃問題建模

1.1 任務背景

在所有環境信息、敵方防衛信息均已知、敵方補給船航跡已被指揮中心獲取的情況下,臨時指派附近1 架UAV、1 艘USV 和1 艘UUV 組成海上無人系統,分別從(xSA,ySA,zSA),(xSS,ySS,0)和(xSU,ySU,zSU)的坐標位置出發,前往目標攻擊陣位攻擊敵方補給船。在接到指令前,三者在各自區域執行任務,未攜帶昂貴的遠程制導武器等大規模殺傷性武器。為徹底破壞該敵方目標,防止目標逃逸,三者需要分別從空中、水面和水下同時對目標船發動攻擊,在平臺資源和武器資源一定的情況下獲取最大效費比。另經偵察,已知目標船的噸位較大,不易轉彎,當前位置坐標為(xT0,yT0,zT0), 航速為VT0。 假定目標船航速VT0保持不變,故在攻擊任務開始前,根據環境及平臺約束,需為這3 個無人平臺規劃出一條能同時安全到達目標攻擊陣位的航跡,并給出出發時刻和巡航速度。

1.2 問題描述

由上述背景分析可知,UAV,USV 和UUV 在接到任務后是從不同起點出發的,為摧毀目標,需要同時到達目標點附近的攻擊陣位。圖1 所示為協同航跡規劃示意圖。

圖1 海上無人系統協同航跡規劃示意圖Fig. 1 Schematic diagram of cooperative path planning for UMS

在上述任務背景及假設下,可根據目標船當前位置和速度信息選擇其航跡上的一個點作為伏擊點p, 即終點pF。 在此問題中,起點pS和終點pF已 知,因此可在pS和pF之間插入有限個點生成航跡點,再將起點pS、 航跡點序列WP和 終點pF按順序連接即生成航線P。此時,UAV,USV 和UUV 的 航 跡 分 別 為PA,PS,PU,起 點 分 別 為pAS,pSS,pUS, 終點分別為pAF,pSF,pUF,航跡點序列分別為WPA,WPS,WPU。綜合考慮自然環境約束和敵方的威脅約束,通過優化算法求解出三者的最優航跡集合P*,如式(1)所示。

其中:

式中,WPA,WPS,WPU包含的航跡點數量可以不同。在三維空間中,海上無人系統協同航跡規劃問題就是用一組優化準則和約束為每個平臺規劃出一條航行代價最小的可行航跡。在同時到達目標位置的前提下,規劃的航跡滿足環境、威脅、自身運動性能約束,且航跡平滑、航程更短。

1.3 問題建模

UAV,USV 和UUV 三者航跡優化的指標通常包括航程的累計值J1、爬升和下降角的累計值J2以 及轉彎角的累計值J3,航跡規劃需要滿足的約束可以分為時間約束P1、 自然環境約束P2、敵方威脅約束P3、 爬升和下降角約束P4及轉彎角約束P5,優化目標函數如式(2)所示。精準的時空協同需各無人平臺能同時到達攻擊陣位,滿足時間約束P1,也即三者到達終點的時間誤差小于設定值ε。UAV,USV,UUV 到達終點的時間點分別表示為tA,tS和tU,如式(3)所示。

其中,

式中:Ai為 第i個 優化指標 系數;Pi為 第i個約束條件,其中Pi=0表 示滿足約束條件,Pi>0表示不滿足約束條件。以時間約束為例,其懲罰計算如下:

若要解決海上無人系統的時間協同航跡規劃問題,還需對自然環境約束和敵方威脅約束進行適當建模,構建符合現實需求的航跡優化函數,并通過優化算法求解出滿足約束的航跡。

1.4 場景建模

海上無人系統除了需要在劃定的任務區域內航行外,還要能夠避免穿過類似島礁等的禁入區和敵方雷達等的威脅區。

UAV 在指定空域,即禁出區VAF內飛行,將面臨的主要自然威脅是風暴區VA,紊亂的氣流會嚴重影響飛行,甚至造成機體損毀,所以航跡規劃應避免穿越風暴區。此外,UAV 還將面臨的主要敵方威脅是雷達探測區VAT。因此,對空域建模時采用長方體描述禁出區的邊界,如式(4)所示。鑒于實際的風暴區與雷達威脅區的空間幾何形狀差別較大,為了簡化模型同時又貼近實際,使用圓柱體描述風暴區的邊界,如式(5)所示。根據雷達探測的特性,使用半球形描述敵方雷達威脅的邊界,如式(6)所示。

上式中:p1,p2,p3,p4分別為用長方體描述的禁出區和與xoy面平行的下底面上按順時針排列的4 個坐標;hAF為 長方體的高;pA為用圓柱體描述的在xoy面圓心的坐標;rA為圓柱體半徑;hA為圓柱體的高;pAT為 半球在xoy平面圓心的坐標;rAT為半球坐標;d=1, 表示半球分布在z>0的區域。

USV 在指定海面區域,即禁出區VSF內航行,會受到風暴區的影響,風暴區的模型如式(5)所示。此外,USV 還面臨著暗礁威脅和敵方布置的水雷區VST威脅,以及敵方探測威脅,即雷達探測區VS。因此,對水面域建模時分別采用長方形描述禁出區邊界,多邊形描述魚雷區和島礁邊界,圓形描述敵方雷達威脅邊界,如式(7)如~式(9)所示。上式中:pS1,pS2,pS3,pS4分別為禁出區按順時針排列的4 個頂點坐標;rS為雷達探測區半徑;pS為 雷達探測區圓心的坐標;m為多邊形頂點個數;p1,p2,···,pm為禁入區按順時針排列的頂點坐標。

UUV 需要在指定水下區域,即禁出區VUF內航行,其面臨的主要自然威脅是海底的起伏地形,由規則格網數字高程模型(digital elevation model,DEM)記錄存儲,面臨的主要敵方威脅是敵方聲吶探測區VUT。因此,對水域建模時采用長方體來描述禁出區邊界,如式(10)所示;采用半球形來描述敵方聲吶威脅邊界,如式(11)所示。

上式中:pU1,pU2,pU3,pU4分 別為長方體與xoy面平行的下底面上按順時針排列的4 個坐標;hUF為長方體的高;pUT為 聲吶探測區在xoy平面圓心的坐標;rUT為 聲吶探測半徑;d=-1,為聲吶探測區分布在z<0處的區域。

1.5 航跡建模

對于隨機分布的航跡點,搜索空間太大,但采用如下航跡點生成方式則可減小搜索空間。將起點和攻擊陣位點投影到xoy平面,然后在xoy平面上畫出從起點到攻擊陣位點的線段L。 線段L被N個點平均分為N+1 段,并繪出經過每個點且垂直于x軸的直線,表示為 {L1,L2,···,LN}。航跡建模示意圖如圖2 所示。

圖2 航跡建模示意圖Fig. 2 Schematic diagram of path modeling

如圖2 所示,航跡點Wi(i=1,2,···,N)的投影在垂線Li(i=1,2,···,N)上,除x軸以外,其他維度的坐標需要考慮約束條件后再進一步予以確定。最后,便可形成一組航跡點序列WP=(W1,W2,···,WN)。 按 順 序 連 接 航 跡 點Wi(i=1,2,···,N) , 即可以構成無人平臺的航跡P*。UAV的航跡點數量為N1,生成的航跡點序列可以表 示 為WPA={WPA1,WPA2,···,WPAN1}。USV的航跡{點數量為N2,生成的航跡點}序列可表示為WPS=WPS1,WPS2,···,WPSN2。UUV的 航 跡點數量為N3,生成的航跡點序列可表示為WPU={WPU1,WPU2,···,WPUN3}。在所有步驟完成后,3D 空間內海上無人系統時間協同航跡規劃變成一個優化問題,即如何選擇航跡點,并讓海上無人系統整體上在滿足環境約束、運動約束的同時,以最小代價在最短時間內到達各自的攻擊陣位。

2 時間協同航跡規劃問題求解

時間協同航跡優化目標函數如式(2)所示。仿真求解需要根據場景建模和航跡建模,對優化目標函數和約束條件進行更詳細地描述。

2.1 優化指標

2.1.1 航程優化指標

UAV,USV 和UUV 的燃料供應有限,必須在燃料消耗完之前到達目的地。本文采用總的路徑長度與到達目的地的直線距離之比來表示燃油的消耗。

由此可見,路徑越短,在同等情況下無人平臺的燃油消耗越少,到達目標陣位所需時間也越短。而減少它們暴露于復雜環境中的時間,可以降低被未知威脅目標發現的概率。Jdis(A),Jdis(S)和Jdis(U)分別為UAV,USV 和UUV 的實際航程與直線距離之比,如式(12)~式(14)所示。

其中,

式中,坐標 (x0,y0,z0) , (xN+1,yN+1,zN+1)分別為航跡的起點和終點。若是UAV,N=N1; 若是USV,N=N2;若是UUV,N=N3。

因此,三者的航程優化可由式(15)表示。

2.1.2 UAV 航跡爬升角和下降角航程優化指標

USV 因是在水平面運動,所以不存在航跡的上下起伏問題。UUV 下潛后通常采取定深巡航方式,到達終點才開始上浮,且上升下潛均是在z軸方向直線運動,因而不適宜采用航跡的爬升和下降角度來描述。對于UAV 的航跡,其航跡點k的爬升和下降角 θk在限值之內,并由式(16)計算其累計值,有關 θk的計算見后文。爬升角限值αAk和 下降角限值 βAk分別由式(17)和式(18)計算,單位為rad。 αAk和 βAk與UAV 的飛行高度zAk相關,本文中設為高度1 000 m 時的計算值。

故UAV 航跡的爬升和下降角優化累計值如下:

2.1.3 航跡轉彎角優化指標

轉彎角度越大,能耗越多,例如飛行器的大角度轉彎需額外的推力,類似地,船艇需消耗轉舵機構的能量,其阻力的增加還需額外的推力,故規劃的期望航跡應盡量平滑。本文模型中,理想航跡的轉彎角未超過最大值且保持盡量小。圖3為轉彎角示例圖,圖中Pk為轉彎點,分別用(xk-1,yk-1,zk-1),(xk,yk,zk),(xk+1,yk+1,zk+1)表 示 航跡上連續3 個航跡點的坐標。假設第k個航跡點處的轉彎角為 γk(單位:rad),其計算方式如式(20)所示。

圖3 轉彎角示意圖Fig. 3 Schematic diagram of turning angle

其中:

設無人平臺的最大轉彎角為 γ,轉彎角數量為N,無人平臺總數為Nvehicle,則航跡的轉彎角獎勵函數(優化累計值)如式(24)所示。

式中,J3,J3(vehicle)分別為單個無人平臺和所有平臺的轉彎獎勵函數均值。

2.2 約束條件

2.2.1 時間協同約束

對于飽和攻擊任務,UAV,USV 和UUV 需要同時到達目標點附近指定的位置,以便同時發起攻擊。鑒于各平臺是從不同的起點出發,在規劃航跡時,應使它們暴露于威脅中的時間盡可能短。因此,提出如下所述的時間協同策略,以確定各平臺的出發時間和巡航速度,從而滿足時間協同約束。

如圖1 所示,UAV,USV,UUV 分別在空中、海面和水下航行,且各自的速度限值為 [vAmin,vAmax],[vSmin,vSmax],[vUmin,vUmax]。例如,為UAV 規劃一條長度LA的航跡,其到達目標攻擊陣位的時間區間按式(27)計算,而 最短時間TAmin和最長時間TAmax分別由式(28)和式(29)得到。

與式(27)~式(29)的計算方法類似,可分別得到USV,UUV 到達目標攻擊陣位的最短時間TSmin和TUmin。圖4 所示為無人平臺時間協同策略的示例。其中:到達目標陣位所用時間最長的為UUV,其最先出發,巡航速度為vUmax;UUV 出發T1時 間后,USV 出發,巡航速度為vSmax;UUV 出發T2時 間后UAV 出發,巡航速度為vAmax;在UUV 出發T3時間后,各平臺同時到達目標攻擊陣位。通過該時間協同策略,海上無人系統可以在最短的時間內到達攻擊陣位。

圖4 時間協同策略Fig. 4 Time coordination strategy

通過上述策略,同時到達的時間協同約束可以一直被滿足。時間協同約束項的值如式(30)所示。

2.2.2 禁入區和禁出區約束

可行的航跡不能穿越障礙物體。在海上作戰環境中,USV 和UUV 的主要禁入區是島礁,UAV 的主要禁入區是強風暴發生地。這里,給出一個合理的假設,即已知所有禁入區的位置、范圍等特性。為避免誤入禁入區,需設計一個懲罰函數用于定義航跡中某一點進入禁入區的情況。在近海環境下,海底有類似于陸地山脈一樣的起伏地形,假設f(xi,yi)為 (xi,yi)處地形的海拔值,(xAj,yAj,zAj) 為 UAV 航跡上的任意一點,(xSj,ySj, 0)為USV 航跡上的任意一點,(xUj,yUj,zUj)為UUV 航跡上的任意一點; ΩA為UAV 航行中的風暴區合集,風暴區用圓柱體表示,即 ΩA=ΩA1∪ΩA2∪···∪ΩAM1,其中M1為 風暴區數量;DS為水面水雷區和觸礁區的并集,即DS=DS1∪DS2∪···∪DSM2, 其中M2為水雷與觸礁區的數量之和。因此,UAV,USV 和UUV的禁入區懲罰函數分別如式(31)~式(33)所示。

以上式中:H為單個平臺規劃的航跡中一個點落在禁入或禁出區時得到的懲罰值;P為H的累計值;Ωsk為風暴區在水面的區域合集。

另外,UAV,USV 和UUV 需要在一片指定的區域內航行,在該區域外運行將會受到懲罰。以下給出的是航跡點落到特定區域外時對其進行懲罰的計算公式。

以上式中,VAF,VSF和VUF分別為UAV,USV,UUV的指定航行空間,也即禁出區。

式(31)與式(34)相加表示UAV 的航跡點未滿足禁入、禁出區條件時所受的懲罰,如式(37)所示;同UAV,式(32)和式(35)相加,式(33)和式(36)相加分別表示USV 和UUV 所受的懲罰,分別如式(38)和式(39)所示。式(40)表示UAV,USV 和UUV 的航跡不滿足禁出、禁入約束時受到的懲罰之和。

2.2.3 威脅區約束

首先,假設威脅源的類型、位置和范圍等信息完全已知。UAV,USV 的威脅源為敵方雷達,UUV的威脅源為敵方聲吶。UAV,USV 和UUV 需要遠離這些威脅源,否則一旦進入威脅區,就有可能被探測到甚至是被擊毀。對UAV 產生威脅的雷達區i(i=1,2,···,H1)的空間模型為一個用向 量VTi=[xATi,yATi,zATi,rATi,LATi]表 示 的 半 球形,其中, [xATi,yATi,zATi]為半球球心的坐標,記為pATi,rATi為 雷達最大探測距離,LATi為對UAV 的威脅系數,該值越大,威脅就越大。敵方雷達具備同時對空對海面的掃描能力,因此對UAV,USV 產生威脅的雷達總數均為H1。對USV 產生威脅的雷達區i(i=1,2,···,H1)的空間模型為一 個 用 向 量VSTi=[xSTi,ySTi,rSTi,LSTi]表 示 的 圓形,其中 [xSTi,ySTi]為 圓心的坐標,記 為pSTi,rSTi為雷達最大探測距離,LSTi為對USV 的威脅系數,該值越大,威脅就越大。對UUV 產生威脅的聲吶探測區i(i=1, 2,···,H2)的空間模型為一個用向量VUTi=[xUTi,yUTi,zUTi,rUTi,LUTi]表 示 的 半 球 形,其中, [xUTi,yUTi,zUTi]為 半球球心的坐標,記為pUTi,rUTi為 聲吶最大探測距離,LUTi為聲吶對UUV 的威脅系數,該值越大,威脅就越大。

UAV,USV 和UUV 在有航段穿入威脅區時,才會受到懲罰。如果UAV 的航跡穿過威脅區,設航跡上距離威脅區i最近的點為pAi=[xAi,yAi,zAi], 其中i=1,2,···,H1,H1為雷達威脅區總數,穿過威脅源i時對UAV 的航跡的懲罰可以采用式(41)定義;如果USV 的航跡穿過威脅區,設航跡上距離威脅區i最近的點為pSi=[xSi,ySi,zSi],其中i=1,2,···,H1,穿過威脅源i時對USV 的航跡的懲罰可以采用式(42)定義;如果UUV 的航跡穿過威脅區,設航跡上距離威脅區i最近的點為pUi=[xUi,yUi,zUi], 其 中i=1,2,···,H1,航跡穿過威脅源時對UUV 的航跡的懲罰可以采用式(43)定義。

通過上述代價計算,總的代價用采式(47)進行計算。

2.2.4 UAV 航跡爬升和下降角約束

UAV 在航跡點k處的俯仰運動受限于最大爬升角 αAk和 最大下降角 βAk,其定義分別如式(16)和式(17)所示。αAk和 βAk與UAV 所在的高度(單位:m)有關。

航跡點k和k+1之 間的線段為航段lk,其中爬升和下降角θk可以采用式(48)計算:

航跡上航段lk的爬升和下降角超出限值時,可以按式(49)進行懲罰值計算:

因此,爬升和下降角的最終懲罰、優化函數如式(50)所示。

2.2.5 航跡轉彎角約束

UAV,USV 和UUV 的運動分別受最大轉彎角 γA, γS, γU的約束。若規劃的航跡轉彎角超出限值,平臺運動能力會受到限制,使其無法執行規劃的航跡。鑒于轉彎角越小,航跡越平滑,故在本模型中,理想的航跡轉彎角應不超過最大轉彎角且應盡量小。分別用(xk-1,yk-1,zk-1), (xk,yk,zk),(xk+1,yk+1,zk+1)表示航跡上連續3 個航跡點的坐標,最大轉彎角為 γ 。假設第k個航跡點處的轉彎角為 γk, 如式(20)~式(23)所示計算。若第k個航跡點處轉彎角超過限值,則如式(51)所示計算其懲罰值pk。

設UAV,USV 和UUV 在第k個航跡點處的轉彎角分別為 γAk, γSk, γUk,其計算方法同式(23),航跡處轉彎角懲罰函數的計算如式(52)所示。

2.3 基于差分進化算法的求解方法

在上述約束條件下,UAV,USV 和UUV 三者的時間協同航跡規劃問題可以轉化為優化問題,如式(53)所示。

式中,P*為 使J(PA,PS,PU)最小的航跡合集。為了方便尋優計算,將約束條件,如禁入禁出區約束、威脅區約束、爬升和下降角約束、轉彎角約束及時間協同約束轉化為懲罰項,如式(54)所示。對應的適應度函數如式(55)所示。

式中:M為懲罰系數,是一個很大的正數項。當所有約束均得到滿足時,式(54)中的懲罰值為0,懲罰值為不滿足約束個數的整數倍;M值的設定應大于優化項的值; 優化項的所有系數之和為1,各優化項系數的值根據其的權重而定。在此設計下,權重大的優化項會被著重考慮。此優化項系數的設定使代價函數保持了一定的梯度。在整個尋優過程中,滿足更多約束且優化項的值越小的個體會被保留,從而產生更多可行的解。

通過分析,無人平臺的航跡點數量較多,約束較為復雜,優化目標帶有梯度性,是一個維度較高的非線性優化問題。因為DE 算法在求解維度較高的非線性優化問題方面具有獨特的優勢,所以本文采用該算法進行求解。DE 算法是一種基于種群差異的進化算法,其利用群體內個體之間的合作與競爭產生的集群智能模式來指導優化搜索。DE 算法特有的進化操作使該算法具有較強的全局收斂能力和魯棒性,非常適合求解一些復雜環境下的優化問題?;贒E 算法的路徑規劃流程如圖5 所示(圖中 ,Gen為代數),具體步驟如下。

圖5 基于差分進化算法的路徑規劃流程圖Fig. 5 Flowchart of path planning based on DE algorithm

步驟1:對航跡點進行編碼。前文采用等分方法確定了航跡點的x軸坐標,UAV 在空域內運動,USV 在水面運動,UUV 在指定深度的水下運動,種群中的個體包含這3 個無人平臺剩余的需要確定的坐標信息。UAV 的航跡點數量為N1,變量個數為 2N1; USV 的航跡點數量為N2,變量個數為N2; UUV 的航跡點數量為N3, 變量個數為N3。按照UAV,USV 和UUV 的順序給個體進行編碼,編碼的總長度D為三者路徑變量個數的總和,如式(56)所示。

由上式可知,航跡點數量越多,編碼長度越長,解空間會越大,求解的時間也就越長。因此,需要根據環境的復雜程度來確定航跡點的數量。若環境簡單,可適當減少航跡點數量,則求解時間會變短;若環境復雜,為了避開不可行區域,需要適當增加航跡點數量,則搜索到更優解的可能性會更大。

步驟3:計算適應度函數。對種群個體內的航跡點坐標進行解碼后,可分別得到UAV,USV和UUV 的航跡點序列WPA,WPS和WPU,將其帶入航跡代價函中,即可得到每條航跡的代價值。

步驟 4:變異、交叉和選擇操作。首先,對每個個體進行變異操作,得到變異個體;然后,將變異個體與父代進行交叉,得到實驗個體;最后,將實驗個體包含的航跡點序列代入適應度函數進行計算,并與對應的父代個體進比較,適應值小的一方保留下來作為新的父代。

在優化初期,主要是尋找航跡規劃的可行解,因此需要增加種群的多樣性,防止過早陷入局部最優。在優化后期,主要是從可行航跡中尋找出最優航跡,需要設置較小的變異算子,不斷逼近最優解。但變異算子是影響種群多樣性的關鍵控制量,因此,設計自適應變異因子F如下:

式中:F0為 常數變異算子;Gm為最大迭代次數;G為當前進化代數; λ 為隨G自適應變化的參數。

3 仿真實驗

本文海上無人系統的平臺仿真分析包括1 架UAV、1 艘USV 和1 艘UUV,因各無人平臺從不同的起點出發,故按照各平臺與目標點的距離,將空間劃分為近、中、遠3 個區域,即區域1、區域2 和區域3。為了確定這3 個區域內最優的航跡點數量,設計了航跡點數量對比實驗,并將航跡規劃成功率作為指標。為了驗證目標函數的合理性,在復雜環境下使用DE 算法求解其有效性。以27 組起點組合作為算例,每個算例獨立進行50 次蒙特卡羅方法實驗,記錄規劃成功率。而為了驗證所提時間協同策略的有效性,經對仿真結果的分析,求解出了出發時間間隔和巡航速度。此外,仿真計算使用的是一臺CPU 主頻為3.6 GHz 和RAM 空間為16 GB 的電腦。

3.1 環境及初始條件設置

設計的實驗場景包括3 個地理圍欄,7 個禁入區(包括海底地形1 個),9 個威脅源(空中、海面和水下各3 個)。威脅源的信息如表1 所示,其中對空雷達威脅、海面雷達威脅和水下聲吶威脅的系數分別對應LATi,LSTi和LUTi??罩薪雲^的信息如表2 所示,地理圍欄的信息如表3 所示,海面禁入區的信息如表4 所示。

表1 威脅源信息Table 1 Information of threat sources

表2 空中禁入區信息Table 2 Information of forbidden zones in the air

表3 地理圍欄信息Table 3 Information of geofence

表4 海面禁入區信息Table 4 Information of forbidden zones on the sea surface

各無人平臺的航跡信息和運動性能信息如表5所示,劃分的3 個區域如圖6 所示。以圖6 中紅色三角形所在區域為例,由于UAV 和USV 存在轉彎約束,自然環境和敵方威脅區的分布導致從紅色區域出發到目標點不存在滿足所有約束的可行航跡。因此,除了無可行解的區域,在其他區域內為3 個平臺分別選定1 個起點,每個平臺就有3 個起點,并按照所在區域編號,分別命名為起點1、起點2 和起點3。所有起點的坐標均在圖6 中詳細標識。為方便記錄,3 個平臺的起點的組合編號規則如下:按照UAV,USV 和UUV 的順序,將各自起點的數字作為編號的組成,以UAV 起點1,USV 起點2 和UUV 起點3 為例,該起點的組合編號就為123。按照此編號規則,可產生27 種編號組合。UAV 在三維空間飛行,航跡存在爬升段、平飛段和下降段,因此需要至少2 個航跡點。根據前期的仿真實驗,發現航跡點數量的設置與航跡規劃的成功率具有一定的關系。以區域1 為例,增加航跡點會增大搜索空間,需更多的時間來完成搜索,而航跡點個數的增加也會導致航跡點密度的增加,致使爬升和下降角約束更不容易得到滿足,航跡規劃的成功率反而會減低。因此,將起點在區域1、區域2 和區域3的航跡點數量范圍設定為2~3。UAV 可以在500~2 000 m 高度范圍的空域飛行,USV 在海平面飛行,UUV 在水下指定深度航行。3 個平臺的起點雖不同,但終點一致。

圖6 海上無人系統航跡規劃起點分布Fig. 6 Starting points of UMS path planning

表5 UAV, USV 和UUV 初始狀態信息Table 5 Initial status information of UAV, USV and UUV

航跡規劃求解用到的DE 算法的參數設定如表6 所示。

優化函數式中的主要參數設定如表7 所示。表中,A1,A2,A3和M分別為航程優化項、爬升和下降角優化項、轉彎角累計優化項和懲罰項系數。

3.2 仿真結果分析

3.2.1 最優航跡點數量

航跡點數量與航跡規劃的成功率有一定的關系,為確定起點在區域1、區域2 和區域3 內的最優航跡點數量,設計了蒙特卡羅實驗。使用起點組合111,222 和333,分別以航跡點數量2 和3 獨立進行50 次蒙特卡羅實驗,DE 算法的參數設置如表6 和表7 所示。選擇適應度函數小于100 作為規劃成功的判別條件。規劃的航跡滿足所有約束條件,適應度函數小于100。

表6 差分進化算法的參數設定Table 6 Parameter setting of DE algorithm

表7 優化函數的參數設定Table 7 Parameter setting of optimization function

最優航跡點數量的仿真結果如圖7 所示。圖中,橫軸數字由起點編組號和對應實驗使用的航跡點數量構成,例如111-2 表示起點組合號為111,航跡規劃時航跡點數量為2;縱軸為航跡規劃成功率的百分比。從圖中可以看到,111-3 的航跡規劃成功率最低,111-2 的航跡規劃成功率為74%,因而起點在區域1 內的航跡規劃適宜采用2 個航跡點。而在區域2 和區域3 中,采用2 個航跡點的航跡規劃成功率均比采用3 個航跡點的航跡規劃成功率低。在仿真環境中,從區域2 和區域3 中出發前往目標點需要面臨更多的障礙和威脅,增加航跡點可以提高航跡規劃的成功率。因此,對于起點在區域1 內的航跡規劃適宜采用2 個航跡點,而在區域2 和區域3 中的適宜采用3 個航跡點。

圖7 最優航跡點數量Fig. 7 Numbers of optimal waypoints

為進一步說明航跡點數量對于采用DE 算法求解航跡成功率的影響,選取起點編組號333 進行仿真實驗。UAV,USV 和UUV 航跡的航跡點數量均為N(N=1,2,···,6),為方便記錄,取編號為333-1,333-2,333-3,333-4,333-5 和333-6。算法和目標函數參數設定分別如表6 和表7 所示,其中基因長度D=4·N。每組獨立進行50 次蒙特卡羅實驗。選擇適應度函數小于100作為判別規劃成功的條件。仿真結果如圖8 所示。由圖可見,當航跡點數量小于3 和大于4 時,航跡規劃成功率較低;當航跡點數量為3 或4 時,航跡規劃成功率較高。當航跡點數量小于3 時,規劃的航跡容易穿越威脅區或是不可行區,當航跡點數量大于4 時,搜索空間維度增加,在該種群規模和設定迭代次數下,優化算法難以搜索出可行航跡。

圖8 航跡點數量對航跡規劃的影響Fig. 8 Influence of waypoint numbers on path planning

另外,當航跡點數量大于4 時,適當增加種群規模和迭代次數,可有效提高航跡規劃成功率,但單次規劃的時間也會相應增加。當設定種群規模為240,最大迭代次數為300,航跡點數量為5,其他參數不變時,規劃成功率可以達到100%。表8 所示為與圖8 中的起點編組號333-4 的結果對比??梢?,當航跡點數量為5 時,同樣的規劃成功率下單次規劃耗時90.255 s,而當航跡點數量為4 時,單次規劃耗時僅需25.777 s。

表8 單次優化耗費時間對比Table 8 Time consumption comparison of single optimization

3.2.2 優化函數和差分進化算法適應性

為了驗證目標函數的合理性和DE 算法的適用性,將生成的27 個起點編組作為27 個算例進行了航跡規劃實驗,編組結果如表9 所示。根據最優航跡點數量仿真結果,選取起點在區域1 中的2 個航跡點,在區域2 和區域3 中的3 個航跡點,對每個算例執行50 次蒙特卡羅實驗,并記錄規劃成功率。將適應度函數小于100 作為規劃成功的判別條件。表9 所示的仿真結果顯示,規劃的航跡滿足所有約束條件。

表9 27 組實驗規劃結果Table 9 Planning results of 27 groups of experiments

UAV 的起點在區域2 和區域3 中時其整體航跡規劃成功率在78%~100%之間,且規劃成功率為100%占比為77.8%。而當UAV 的起點在區域1 中時,整體的航跡規劃成功率在54%~74%之間,規劃成功率較低。由于區域1 內的距離小,航跡點密度較大,UAV 的航跡在爬升和下降角上不易滿足約束,因此此類起點編組的規劃成功率會較低。其原因在于,USV 和UUV 航跡點的坐標維度相比UAV 少一維,受到的約束會更少,起點分布對其航跡規劃成功率的影響也較低。整體上,27 個 算 例 的 求 解 時 間 在17.856~23.154 s 之間,適用于離線規劃。

3.2.3 時間協同策略及航跡分析

由起點組合332 解算得到的航跡如圖9 所示,其從不同角度對航跡結果進行了展示。圖9中包含了所有禁出區、禁入區和威脅區,其中禁入區和威脅區在原來形狀的基礎上進行了膨脹處理。圖9 中:紅色的框為空中禁出區,綠白相間的2 個圓柱體用于模擬風暴區,3 個表面朝z軸正方向的半圓表示雷達威脅區;位于xoy平面的深紅色方框為USV 的禁出區,該平面上3 個黑色的圓表示雷達對水面的探測區,4 個多邊形表示水雷區和島礁區;綠色的長方體框為水下禁出區,淺藍色的柵格面表示海底起伏的地形,3 個表面朝z軸負方向的半圓表示聲吶威脅區。

UAV 在500~4 000 m 范圍內運動,空中的紅色線條為UAV 的航跡。USV 在海平面上運動,水面亮藍色的線條為USV 的航跡。UUV 在深500 m的水層運動,水下黑色的線條為UUV 的航跡。在同時到達目標點的前提下,為盡可能縮短距離,由圖9 可以看到UAV 和USV 的航跡緊貼禁入區和威脅區的邊緣。雖然規劃出的航跡距離禁入區和威脅區很近,但因此前對該類區域進行了膨脹處理,故規劃出的航跡滿足安全距離。

圖9 海上無人系統航跡規劃結果Fig. 9 Results of path planning of UMS

為同時到達目標點,首先計算UAV,USV 和UUV 到達目標點的時間區間,然后按照提出的時間協同策略計算各平臺的出發時間和巡航速度。如圖10 所示,各個色塊代表對應平臺到達目標的時間區間,色塊的上、下邊分別代表到達目標的最大和最小時間。優化開始到第40 代時,在全局范圍隨機生成航跡,這一階段主要是使個體更加多樣,因時間協同、最大轉彎角等5 個約束中有較多的約束沒有得到滿足,故平臺到達目標點的時間區間波動較大。從第40~90 代,時間協同、最大轉彎角等其他約束逐漸被滿足,時間區間波動放緩。從第90~160 代,搜索出的航跡基本滿足約束條件,這一階段主要是進行優化函數的尋優,隨著航程、累計轉彎等優化項的進一步優化,各平臺到達目標點所需時間逐漸減少。

從圖10 還可以看到,優化結束后,UAV 到達目標的時間區間為16.71~38.44 min,USV 到達目標的時間區間為21.78~35.38 min,UUV 到達目標的時間區間為23.40~35.08 min。因此,UUV 以13 m/s的速度最先出發,在UUV 出發1.62 min 后,USV以15 m/s 的速度出發;UUV 出發6.69 min 后,UAV以23 m/s 的速度出發,3 個平臺同時到達目標的最短時間應該為UUV 出發后第23.4 min。

圖10 海上無人系統抵達目標點的時間區間Fig. 10 Time interval of UMS for reaching the target point

航跡的優化目標函數隨迭代次數的變化曲線如圖11 所示。由圖可以看出,在優化初期,懲罰函數使得隨機生成航跡的函數值比較高,這一階段主要是使個體更加多樣,規劃的航跡滿足了時間協同、最大轉彎角等5 個約束中較少的約束條件。從第10~70 代,采用差分進化算法主要尋找滿足所有約束條件的可行解,此時,函數值降低至100 以下。所產生的航跡滿足約束條件,驗證了前文所設計懲罰函數的合理性。從第91 代以后,主要是尋找使優化函數值最小的解,適應度函數值收斂至16.85。

圖11 航跡優化目標函數值優化過程Fig. 11 Optimization process of path optimization function

4 結 語

本文提出了基于DE 算法的海上無人系統時間協同航跡規劃方法,實現了多約束條件下的航跡規劃,在復雜的障礙環境下實現了海上無人系統的精準時空協同,具有一定的應用價值。首先,采用地理圍欄的檢測方法將障礙和威脅規避問題建模為多約束條件,使用懲罰函數將航跡規劃問題轉化為無約束的優化問題。然后,運用DE 算法進行優化求解,其優勢在于能夠保持搜索初期的多樣性和后期的精確性,保證最優航跡的求解。然而,隨著航跡點個數的增加,求解時間也不斷增加。受求解時效性的限制,本文所提方法只能應用于離線航跡規劃,后續還將針對更大規模的海上無人集群的離線規劃展開更深入的研究。

猜你喜歡
航跡成功率起點
基于自適應視線法的無人機三維航跡跟蹤方法
成功率100%,一顆玻璃珠入水,瓶子終于坐不住了!
大數據分析的船舶航跡擬合研究
成功率超70%!一張冬棚賺40萬~50萬元,羅氏沼蝦今年將有多火?
基于數據挖掘的船舶航跡自動識別系統
院前急救心肺復蘇成功率的影響因素研究
優化急診護理流程對提高急診患者搶救成功率的影響
一種基于全程凈航跡的越障判定方法研究
永遠不要用“起點”定義自己
六月·起點
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合