?

面向無人集群目標分配的層次化信息傳播方法

2023-11-27 02:53沈宇婷孟新高躍清
兵工學報 2023年10期
關鍵詞:層次化群組集群

沈宇婷, 孟新, 高躍清

(1.中國科學院 國家空間科學中心, 北京 100190; 2.中國科學院大學, 北京 100049;3.中國電子科技集團公司第五十四研究所, 河北 石家莊 050081;4.河北省智能化信息感知與處理重點實驗室, 河北 石家莊 050081)

0 引言

無人集群在實時作業過程中受到潛在目標源刺激后,需要根據時域、空域、頻域等多個維度信息完成集群能力部署調配的控制決策。當前無人系統的控制與信息決策等方面的研究已取得了豐碩的成果,發展了中心式、分布式以及仿生類等大量集群規劃與控制算法。

中心式主要有固定后方控制、集群固定控制中樞,或集群隨機控制中心的方式,首要和必須具備的就是全局信息或一定范圍內足量局域信息的輸入。而往往受機間通信鏈路的狀態、自然條件的變化、其他輻射源干擾等因素的影響,中心節點控制的方式很難在任何情況下都能獲取滿足規劃計算的最優狀態下的實時全量數據。

分布式思路是賦予集群中各節點自主的決策和行動能力,但也會引發新的問題。首當其沖的就是個體間存在大量的不完備信息決策與沖突消解,狀態/行為空間規模增大,效率會隨之下降[1]。盡管研究人員已經通過仿真與深度強化學習等結合的方式在一定程度上證明了這種方式的可行性,并開展了許多深入研究工作,但受限于訓練得到決策神經網絡,不僅難以顯式解釋行為的關聯與關系,同時在開放場景中恐出現計算難以收斂的情況。

仿生類算法主要通過研究動物的群體行為特征構建多智能體控制模型與協議,伴隨近年的群體智能熱潮,發展了鴿群[2]、雁群[3]、魚群[4]、蟻群[5-6]、狼群[7]等一系列理論研究與實驗成果在內的大量仿生類算法,指導了無人系統面向任務目標的編隊控制、會合控制、集群控制和一致性控制等問題的研究與實現。

綜合上述研究,盡管各式集群規劃與控制算法發展了線性規劃、遺傳算法、粒子群優化算法、強化學習和深度強化學習等多類型方法,促進了有關無人系統協同作業能力的發展。但場景訓練數據稀疏、仿真數據與實際數據的偏差,對算法模型能夠具備差異化場景遷移能力提出了極大的挑戰。同時,效用和復雜度難以平衡等多方面實用化考慮往往聚焦在特定場景和特定任務問題上,并未對無人集群系統構建形成面向實戰和實用化的體系性支撐。

從實用化無人系統構建的角度出發,陳杰等[8-9]提出需要解決面向任務的協同能力建模與自主編配規則建立等基礎性科學問題。在此指導下,從個體/群體的不同角度看,無人系統實用化存在多層次控制互動統一問題,即個體行動、任務協同與集群組織的行為一致性與互動性的統一。因此,面向未來實用化無人系統構建,如何找到其中能夠連接個體與群體、具備一定普適性、能夠動態擴展的共性關聯,是一項重要的工作。

從美軍無人機軍事需求排序中不難分析出[10],無論是小型集群化平臺還是大型綜合性平臺,信息的獲取感知、信息的共享交互都是無人機任務場景中最根本需要具備的基礎能力。因此,從實用化無人系統需具備的基礎能力分析,一個關鍵問題在于信息的及時交互、有效流通和高效利用[8-15]。當前的研究多將此問題解決集中在通信網絡規劃與設計、任務協同控制設計、分析處理算法效率和魯棒性提升等方面,較少從系統控制模型如何進行信息解耦方面,考慮實際中存在著大量不同層級、不同顆粒度、不同尺度和不同質量的信息共存和混雜的現狀。從實際應用上看,這種對解耦方式的忽視使得無人系統的控制模型設計往往是自底向上的模式,而需求的提出往往是自頂向下的,就會出現任務規劃、目標分配等算法設計服務于平臺搭載能力和通信設備組網能力等的問題。設計上的受限在實際中將演變成雙向制約,邏輯上處于上層的信息處理受限于資源環境的能力配給,而邏輯上處于下層的平臺控制在有限的指令下難以充分發揮載荷效能。

近年來,一些關于作戰系統與體系架構的研究,已將視角聚集在復雜系統的網絡信息流轉與調度上,并基于復雜網絡及其相關理論構建了作戰信息流轉超網絡模型[16]、面向任務的網絡分析模型[17]、基于超網絡的任務驅動漸進演化模型[18]、信息驅動激進演化模型[18]和海上編隊云作戰體系動態超網絡模型等模型和方法[19],在拓展研究界面的同時,驗證了復雜網絡對系統級、體系性架構設計的彈性與魯棒性增益。上述研究已經將任務協同的視角精準聚焦于系統與體系內節點信息關系與關聯映射規則等方面,但所研重點場景化和具象任務需求特征明顯,其網絡模型遷移能力尚有待驗證。而無人系統作為典型需要兼具自主與受控多模式混雜與平滑遷移能力的系統,其架構設計顯然需要以任務場景弱關聯性出發,盡量剝離特異性需求,找到集群節點信息關系中的基礎關系及其演化規則。

本文將研究視角聚焦于無人系統的復雜網絡和信息交互,從結合中心式和分布式的目標出發,將系統從網絡動態運行過程角度,看作時空和信息域的可變弱中心或多中心決策場景,為解決自底向上的系統設計和自頂向下的系統需求之間難以匹配的問題,提供一種分層解耦的系統框架規劃和設計思路。據此,通過層次化網絡信息傳播方法模型設計,實現群體面向目標的自主分配行為涌現,以期為未來信息主導設計無人群智系統和無人群智系統的扁平化提供按需裝填專有決策控制算法模型的底層機制。具體而言,本文基于復雜網絡信息傳播、社團結構等理論,對決策與通信解耦,構建雙層耦合系統模型基礎,提出基本的UAU-FO*層次化狀態控制方法,并面向中觀尺度動態群落信息交互控制,構建基于UAU-FO*的層次化信息傳播方法,形成個體目標揀選與群體協作涌現間可擴展關聯,實現目標信息的集群決策傳播效應和自主聚合解聚。

1 基于局域動態認知的層次化解耦

1.1 基于局域動態認知的層次化系統模型

基于復雜網絡及網絡信息交互視角看智能體動力分析如圖1所示:個體行動是基于自身及環境感知的信息決策結果;任務協同是一定范圍內多個個體的聯合信息決策和信息交換;集群組織是更大范圍,甚至全系統的信息交換內容、時間、頻次等控制問題?;趶碗s網絡信息交互,能夠為無人系統實用化個體/群體的多層次控制互動統一提供共性的關聯基礎。這其中的動力要素從節點的運動與目標作用兩方面可統一于基于網絡的交互與決策,通過級聯鄰域等范圍的局域信息感知,結合節點狀態控制,實現觀測信息傳播與觀測目標選擇的統一。

圖1 面向局域動態認知網絡的智能體動力分析Fig.1 Dynamics analysis of agents in local dynamic cognitive network

圖2 基于局域動態認知的層次化系統模型Fig.2 Hierarchical system model based on local dynamic cognition

據此,面向集群目標分配的層次化信息交互方法,基于局域動態認知的層次化無人系統模型(見圖2),通過通信連接關系和任務協同關系解耦,實現通信連接層始終保持隨機響應連接狀態,交互決策層任務協同關系變化既有獨立性,又具備快速響應能力。具體地,從運動行為來看,直觀改變的是節點相對位置和通信連接強度;從觀測行為來看,觀測信息流入影響網絡交互的內容、頻次等,通過節點對目標的揀選和信息的傳播來影響運動與節點的狀態控制。上述行為的產生是基于網絡的交互與決策,在觀測信息傳播行為和觀測目標選擇行為的驅動下,產生交互決策層的演化動力。而時空分布層則在這種演化動力的驅動下進行響應,完成具體的觀測行動和聚集、分散等運動。

1.2 基于局域動態認知的層次化系統演化動力分析

對目標揀選和分配來說,集群需對待觀測目標區域完成不確定目標的感知、觀測、監視等,則對任一目標所在區域,存在圖3所示狀態變遷過程。

圖3 狀態變遷過程Fig.3 State transition process

參照集合種群網反應-擴散模型,將目標區域視為亞種群節點,如圖4所示,智能體感知目標動向并擴散信息后,能聚集相應群落(社團)結構,即產生基于目標信息的鄰域吸引和節點聚集行為[20-22]。群落形成后,需抑制目標信息繼續擴散,降低對自由態節點的吸引,形成相對穩定的群落結構[23]。

圖4 目標動向發布與穩態觀測示意Fig.4 Target movement publishing and steady-state observation

但實際過程中,所有行為不能同步且同頻發生,如圖5所示,即為上述場景某時刻真實化描述(各群落顏色標識的對應狀態參見圖3)。由圖5可以看到:紫色完成觀測區域的紅色節點在釋放對鄰域各節點的吸引;資源不足和吸引過程的紅色、黃色區域,其紅色節點在擴散目標信息;橙色區域正在進行穩定觀測,群落既不擴散目標信息,也不吸引增加聚集,其群落的節點密度處在穩定范圍。

圖5 基于群落變遷的多智能體觀測集群演化Fig.5 Multi-agent observation cluster evolution based on community change

基于上述分析,層次化演化關鍵動力問題如下:

1) 信息交互與傳播的內容。關于目標的信息交互與傳播,以目標固有屬性與時空屬性(如輻射源位置等)等為內容,時空分布層收集目標信息,交互決策層揀選觀測,通知時空分布層規劃聚集運動。

2) 群落的構建與隔離。構建與隔離關注的是智能體如何以自體狀態切換產生群體性聚集效應。群落的構建與隔離針對揀選目標的專注觀測對各智能體觀測狀態切換進行約束控制。

3) 群落的動態擴容與釋放。動態擴容與釋放關注的是隔離邊界形成后,信息過濾約束機制使得資源不足時能再次釋放目標信息來增補節點,或在觀測期滿后能動態釋放所有節點,讓信息面向合適的對象、在合適的范圍里進行優化精簡的交互。

綜上,以決策傳播效應為目標的信息交互傳播方法的主要問題是中觀尺度信息交互行為和傳播行為的粒度、界限如何控制。

2 基本的UAU-FO*層次化狀態控制方法

構建面向層次化解耦的動態群落控制方法,需要解決信息交互內容的控制、種群的信息隔離和種群的聚合解聚。按交互決策和時空分布兩層考慮智能體信息解耦的節點交互關系,基于UAU-SIS的信息-病毒耦合傳播模型,改進構建基于UAU-FO*群落演化模型[24]。具體包括:1)采用UAU模型表征信息交互基于種群擴散與隔離;2)基于FO*局域動態認知信息傳播模型表征節點狀態及交互決策,以及時空分布層信息交換;3)基于級聯拓撲鄰域觀測,進行信息融合決策控制。

2.1 基本的UAU-FO*層次化狀態設計

基于UAU-FO*群落演化模型中,智能體狀態控制主要包括U-A狀態控制與FO*狀態控制,各基本觀測狀態含義及其詳細描述如表1所示。

表1 UAU-FO*層次化模型基本觀測狀態Table 1 Basic observating state of UAU-FO* hierarchical model

UAU-FO*模型表征智能體節點層次化聯合觀測狀態(見表1)包括:1)U(無關注):表征無關注目標狀態,交互決策層不對時空分布層的信息交換加以限制,即無條件接收所有信息;2)A(有關注):表征有關注目標狀態,交互決策層對時空分布層的信息交換進行限制約束,并以一定策略過濾時空分布與交互決策層間的交換信息;3)F(自由):自由漫游的狀態,如無人機巡察狀態,此時運動具有一定隨機性,交互決策層不限制約束時空分布層信息交互反饋;4)O*(聯合觀測態):有關注目標的狀態,此時運動具有指向性,交互決策層在對時空分布層的信息交互與傳播限制,在兩種隱式狀態模式下有不同策略的約束和限制。聯合觀測態細化有兩種隱式狀態:一是觀測態OBS,具備觀測目標,且在觀測區域內,交互決策層將以當前觀測目標為過濾條件,限制時空分布層信息交換具體內容;二是有序態ORD,具備觀測目標,但不在觀測區域內,可能出現觀測的關注目標的切換,即存在被吸引、干擾和誘騙的可能情況。有序態交互決策層將以當前觀測目標為約束條件,抑制時空分布層信息交換后,對關注目標揀選的評估結果,從而保證觀測的穩定性和抗干擾性。

2.2 基本的UAU-FO*層次化狀態控制

基于基本的UAU-FO*狀態設計,若智能體節點AICE_i所在系統的一層耦合網絡為NICE(AICE,EICE),對NICE進行時空運動和信息協同的雙層解耦即時空分布層NICE_LUst和交互決策層NICE_LUid。假設當狀態變遷獨立存在時,若λ為AICE_i由U態向A態的狀態變遷轉移概率、δ為由A態向U態的狀態變遷轉移概率、β為由F態向O*態的狀態變遷轉移概率、μ為由O*態向F態的狀態變遷轉移概率,則層次化聯合觀測狀態分解圖示如圖6所示。

圖6 層次化聯合觀測狀態分解Fig.6 Representation of state decomposition of hierarchical joint observations

(1)

(2)

(3)

(4)

(5)

(6)

圖7 UAU-FO*層次化演化狀態變遷Fig.7 UAU-FO * hierarchical evolution state transition

2.3 基本的UAU-FO*層次化狀態控制算法設計

由于層次化群落控制,實質上是利用網絡信息交互特性,基于層次化的個體狀態控制及其信息交互控制,通過個體基于級聯拓撲鄰域觀測,進行信息融合決策控制,涌現出的群落可控。因此,基本的UAU-FO*層次化群落控制方法的算法設計,本質上是對智能體節點AICE_i的狀態控制及信息融合決策算法設計,具體設計如圖8所示。

3 基于UAU-FO*的層次化信息傳播方法

3.1 動態中心周期性老化的群落信息交互約束方法

在UAU-FO*中的智能體狀態轉移和交互信息層次化約束時,聚集構成觀測群組后需要信息跨層約束,將觀測期信息交互局限群組內,同時檢測觀測是否結束并釋放約束?;趶碗s網絡老化效應和反應-擴散模型機理研究,提出基于動態中心周期性老化的群落信息交互約束方法,實現群組聚合解聚中,目標中心對群組內節點吸引力的可變調控[20-21]。

若對待觀測目標tgtm,存在最短觀測時限TOBS_min和理想觀測時限TOBS_max,其對應的觀測種群節點數需求為x。將首個感知該目標并發布觀測提議請求的節點,將作為目標tgtm聚合種群的中心,則中心的周期性老化與逃逸不為永久性,而是以觀測時限需求為測度的周期性、隨機性信息交互約束。若將中心節點發出提議的時刻設為t0,種群規模(即到達觀測區域的種群節點數)滿足觀測需求x,以O*態是否為OBS為標志進行計數,完成聚合的時間設為tx。

據此如圖9所示,基于UAU-FO*模型控制層次化信息交互與群落信息傳播方法,將對應目標tgtm單次完整觀測周期分為聚合態、隔離態、老化態和逃逸態:

圖8 狀態控制流程Fig.8 State control flow

1) 聚合態:從觀測發起到種群聚合完成。中心節點AICE_i不對聚集中智能體節點進行信息跨層交互的約束和限制,僅收集到達觀測區域并將O*態切換為OBS的節點信息。一旦將觀測狀態切換為OBS,則屏蔽非關注目標(即進行目標剔除等操作)。

2) 隔離態:由種群觀測開始到最短觀測時限。中心節點AICE_i需要完全抑制種群外部信息對觀測的輸入,同時以群組達成觀測協定或決策的形式,擴散觀測種群已構建的信息,從而抑制吸引聚集。

3) 老化態:從達成最短觀測時限到達成理想觀測時限。中心節點AICE_i開啟老化進程,吸引力降低,逐步降低對種群內部節點的信息隔離程度,即種群內的非中心節點AICE_j的時空分布層接收信息能夠以一定概率γagej反饋給交互決策層,即啟動屏蔽機制失效控制,且γagej隨著老化進程將持續增加。需要指出的是,信息隔離度降低的同時,智能體自身會結合駐留時限偏好進行關注目標的揀選。

圖9 動態中心節點周期狀態Fig.9 Periodic state of dynamic central node

種群內部節點和其鄰域內在時空分布層隨機連接重建概率pc[20]為

pc=Π(kj,tcur-tj)kj[tcur-(tx+TOBS_min)]-v

(7)

(8)

式中:kj為節點AICE_j處的度值;Π(kj,tcur-tj)表示節點AICE_j與新節點在時空分布層建立連接的概率,tcur為當前時間,tj為AICE_j加入此種群的時間,則tcur-(tx+TOBS_min)即為中心節點AICE_i的“年齡”;v為可調參數描述上述概率與老化進程之間的依賴關系;CUcur為當前種群計數。因此,在啟動屏蔽機制失效控制后,節點可能因屏蔽失效發生目標變更。

4) 逃逸態:從達成理想觀測時限開始到中心節點被其他目標吸引或老化逃逸終止。中心節點AICE_i開啟快速釋放種群節點的模式,也表現為老化速率的加速。而種群解散過程和原種群節點密度以及平均度等相關[24-25]。因為富集了更大觀測資源的種群,需要更加快速的釋放,避免集群資源的負載不均[25]。對于基于UAU-FO*模型構成的觀測群落,逃逸態的所有節點在逃逸前的聯合觀測態均為O*,因此對于非中心節點,根據中心節點的周期計時通知驅動逃逸概率的計算。具體地,群落中度為k節點的當前時刻逃逸概率[25]為

(9)

式中:k′為度為k節點的非中心節點鄰居的度;P(k′|k)是度為k節點指向度為k′節點的概率,通過求和對所有可能指向情況進行綜合,即沿連邊kk′逃逸的節點數均值;Dk′k為節點沿連邊kk′跳躍的概率。

3.2 基于UAU-FO*的層次化信息傳播算法設計

基于UAU-FO*的層次化信息傳播算法設計,是基于基本的UAU-FO*層次化狀態控制的群落控制算法。由于基本的UAU-FO*模型中,U-O*和A-F難以獨立存在則基于級聯鄰域收到的目標信息在每步決策時,簡化后只考慮UF和AO*之間的狀態變遷,如圖10所示。則任一智能體在時刻感知完,進入處理流程來更新本地的UA序列和FO*序列。算法流程設計(見圖11)如下:

1) 節點狀態控制:根據O*狀態,進行待處理目標信息的序列剔除,即若O*態為OBS,則僅保留UA序列中已激活的目標信息;若O*態為ORD,則更新所有可能的偏好關注目標信息。當UA序列中出現了偏好列表中潛在關注目標信息,則UA序列中相關目標狀態被激活。若當前更新了多個可關注目標,則關注序列中或會暫時性出現多個A態目標信息激活,根據目標收益-代價評估方法,結合動態中心周期性老化的群落信息交互約束方法,進行目標揀選以及是否進行關注目標的切換。

2) 層次化信息交互約束:當O*狀態為OBS時,交互決策層會通知時空分布層,不再接收處理非關注目標的相關信息。當O*狀態為ORD或在F態時,時空分布層的接收處理將不被限制。

圖10 基于簡化UAU-FO*的層次化狀態變遷Fig.10 Hierarchical state transition based on simplified UAU-FO*

4 仿真驗證

4.1 仿真實驗設計

本文提出的基于UAU-FO*的層次化信息傳播方法,是針對中觀尺度下無人系統目標分配的自主性涌現,構建的動態群落信息交互控制方法。預期面向無人系統對指揮控制層和通信組網層進行信息交互的解耦,以通信能力來保障任務協同,以任務信息交互與個體決策完成控制,提供基本的信息交互控制機制的設計實現。

從實驗對比與分析的角度看,本文提出的方法框架目的在于提供分層解耦的信息交互與傳播控制方法,而非單純的目標分配與任務規劃,目的在于為現有算法提供一套可擴展、可聯合的層次化系統容器,在實際的平臺控制模型中按需針對差異化場景狀態,裝填專用的決策模型或控制算法。

因此,本文方法的仿真驗證在于以下4個方面:1)面向信息交互的分層解耦可行性;2)基于信息傳播的自主協同行為涌現性;3)基于層間交互約束的群組調控魯棒性;4)裝填算法模型的可調整性。其中,裝填算法模型的可調整性來源于本文方法設計原理的本身,主要在4.3節中進行綜合分析討論。4.2節主要針對前3個方面設計相應的仿真實驗,驗證在分層解耦的框架下,將整個無人系統看作時空與信息關聯的可變弱中心或多中心決策系統,能夠基于信息交互與傳播的層次化控制,在個體目標揀選基礎上涌現出群體性行為,支撐實現無人集群面向動態目標的自主聚合解聚。

仿真場景設計如下:以無人機集群偵察作為想定任務場景,首先通過不同的通信連接保持數LinkCapmax、仿真實驗的仿真時間TimeStepSIM,觀察無人機集群可針對目標通過個體的自主信息交互,完成涌現動態群落的生成與老化逃逸過程。同時通過不同程度的連接中斷模擬,量化分析動態群落機制設計的穩定性、魯棒性和健壯性,能夠支撐無人機集群偵察過程的穩定長時間運行。具體而言,待偵察區域為橫向20 km、縱向50 km的矩形區域(橫縱分別按1 000個單位長度進行柵格化),假定氣象觀測條件良好且置空距離足夠,可忽略待偵察區域地形、坡度、土質等環境要素對觀測發現概率和物理運動的影響。集群數量為500架,忽略平臺實用升限、最大續航等非信息交互基本要素,將平臺抽象為質點。由于本文所提方法驗證首先需解決解耦方案的可行性,因此對集群中的平臺節點做同構處理。同時對非本文架構可行性驗證重點的運動學模型進行簡化,采用上限可調的勻加勻減速運動控制。當且僅當感知到目標時,按當前仿真步的通信連接關系,向鄰域擴散目標位置信息。為模擬連接的隨機性,集群連接構型基于Barabási-Albert優先連接模型生成,并根據隨機生成的連接構型進行初始化重連,保證仿真初始狀態通聯關系遵循想定規則。群組想定以局域、自主和信息交互為準則,在聚集、隔離、老化和逃逸過程中,僅依靠提出聚集協商請求(即目標信息局域擴散)進行控制。

圖11 算法流程Fig.11 Algorithm flow chart

多觀測目標揀選算法設計如下:將信息感知融合、觀測目標揀選和信息交互控制等方面均規范化到分布式信息交互視角下,以期構建相對完整的、從感知發現到決策行動的信息交互控制機制。所以,在仿真實驗設計過程中,對多目標信息同時出現時,無人機節點對多目標信息偏好的評估與計算做了基于信息交互視角的基礎指標評價算法設計,并提供了可擴展設計的抑制因子。在目標揀選過程中,若t時刻,任一無人節點Ax通過直接觀測和集群通信得到的目標信息經過融合后的集合為Ix(t),其中包含s個目標的可觀測序列,即為待揀選目標序列TGTt={tgt1,…,tgtl,…,tgts}。則面向信息交互的目標揀選方法基于交互決策層鄰域拓撲進行計算,進行基于信息交互評價的收益-代價評估后,篩選最大值MAX(Ix_tgtt)為擬觀測目標,具體為

(10)

(11)

表2 基于信息交互的收益-代價評估基本指標Table 2 Basic index of benefit-cost evaluation based on statistics of information interactions

表2中:dl為任一目標t時刻距Ax的距離;CU為計數函數,CU([tgtl]Hop1)和CU([tgtl]Hop2)分別為1跳和2跳鄰域傳播信息中目標的計數次數,CU([TGTt]Hop1)和CU([TGTt]Hop2)分別為1跳和2跳鄰域傳播信息中各目標出現總計數,eHop1和eHop2分別為1跳鄰域與2跳鄰域的權重;TD,l是基于交互記錄的目標信息存續度,即首次出現tapp,l至今總時長,TF,l為基于交互記錄的目標tgtl信息新鮮度,即上次出現tlast,l到當前時長,SUM(TD)為目標存續度之和,SUM(TF)為目標新鮮度之和,eD和eF分別為調節系數;wpri,l為目標優先級值,wpref,l為目標偏好值,SUM(wpri)和SUM(wpref)分別為所有目標優先級值之和與偏好值之和,epri和epref為調節系數。

本文實驗在對目標偏好值和優先級取值過程中,對優先級進行了平等化處理,并根據距離代價的排序給定偏好值排序,即將偏好預設為距離偏好。同時說明由于本文目標揀選的收益-代價評估方法對主要處于信息交互視角,對任務場景的差異化要素沒有強約束。因此,也為后續擴展目標揀選的具體方法,以及面向動態群落組織的多約束信息交互抑制與激勵提供了個體決策層面的可擴展、可更新的關聯作用點。

4.2 實驗結果與分析

根據4.1節中論述的前三方面待驗證重點,具體設計3項實驗,并對實驗結果進行統計展示。

4.2.1 面向信息交互的分層解耦可行性實驗

本節首先以任務協同關系與通聯關系分層解耦運行及其魯棒性測試實驗(實驗1),驗證集群信息解耦后能支撐集群完成目標信息傳播,進而支撐各節點完成目標的揀選。同時,通過任務協同關系與通聯關系分層連接特性實驗(實驗2),驗證在上述運行過程中,各層的網絡聯通特性是否具備穩定性基礎。

1) 實驗1:任務協同關系與通聯關系分層解耦運行實驗。待偵察目標在(-850,850)、(850,-850)和(-850,-850)三點分別于仿真時間20、100、300出現、并分別于800、700和600完成最佳觀測計時進入老化態。上述3個目標可感知目標范圍按分別按400、100和200計,觀察并驗證動態群落運行各階段情況。

由圖12可以看到在LinkCapmax=20條件下集群能夠在本文層次化信息傳播模型控制下,達成對鄰域無人機節點的聚集和偵察協同自主運動過程。且在此過程中,集群的通聯整體情況未發生剝離現象和稀疏情況。下面通過調節LinkCapmax模擬通信受到干擾、抑制和遮擋等弱通信條件,具體將通信負載上限降低為5條信道,同時降低通聯感知范圍至100。

圖12 聚合-隔離-老化-逃逸過程(LinkCapmax=20)Fig.12 Aggregation-isolation-aging-escape process (LinkCapmax=20)

圖13中由于通信抑制程度較大,在實驗中略降低了目標節點的聚集平臺數要求。進而盡管通信不良,集群仍可完成聚集、隔離、老化和逃逸的自主控制全過程,且未發生剝離、稀疏與突變。一方面證實了層次化信息交互對通聯關系保持穩定性的作用,一方面說明了自主化群組控制策略的穩定性,二者穩定性互為支撐,即基于時空分布層的穩定性,交互決策層的任務協同關系能夠自主化建立并保持穩定作業。

圖13 聚合-隔離-老化-逃逸過程(LinkCapmax=5)Fig.13 Aggregation-isolation-aging-escape process (LinkCapmax=5)

2) 實驗2:任務協同關系與通聯關系分層連接特性實驗。下面驗證種群隔離前后,集群時空分布層通信連接網絡特性,是否能夠任務協同關系在交互決策層變化的同時保持穩定不變。具體根據實驗1,為便于觀測度分布變化量,擴大變化程度,增加最大通信連接保持數至30條來提升繪制的可觀測性。

如圖14所示,在任務協同群組建立和信息抑制的具體過程中,被測無人機集群的時空分布層通信連接關系中未出現較低通信連接數的點,基本保持在滿通信信道負載運行,均勻性和穩定性良好?;谏鲜鰯祿徒换Q策層抑制信息通過時空分布層的有效抑制和傳播,同時印證了層次化解耦后各層在獨立特性保持基礎上,并不影響層與層之間的交互和協作,為分層解耦的無人群智系統模型設計提供了一定可重復的仿真驗證依據。

圖14 集群通信連接分布變化(聚集-隔離)Fig.14 Communication connection distribution of cluster (aggregation-isolation)

下面觀察整體的聚集、隔離、老化和逃逸過程,任務協同關系在交互決策層的變化,對時空分布層通聯關系的特性影響。設定如下:對目標1規定最少觀測節點數為6架、聚集開始時刻為6、最短觀測時限(進入隔離開始時限計時)為600、理想觀測時限(隔離到老化態分界)為900;對目標2 規定最少觀測節點數為16、聚集開始時刻為16、最短觀測時限為450、理想觀測時限450,對目標3 最少觀測節點數為10、聚集開始時刻為10、最短觀測時限為800、理想觀測時限900。則無人機集群應當在仿真步900左右進入老化態的無人機節點群組釋放期,并在仿真步1 700左右進入老化態的高峰釋放期。

針對上述參數設定進行了20次重復性實驗,圖15(a)和圖15(b)為一次實驗分布圖,圖15(c)和圖15(d)為20次實驗數據按仿真步進行均值計算的分布均值圖,重復性實驗具備結果相似性和特征一致性。將上述度分布出現較大波動的時刻范圍與任務協同關系群組控制時限對比可知,無人機集群的時空分布層通信連接實際分布的變化情況與任務協同關系變動情況匹配。同時在聚集、隔離和老化、逃逸過程中,時空分布層總體上未出現較低通信連接數的點波動擴散情況,基本保持在滿通信信道負載運行,均勻性和穩定性良好?;谏鲜鰯祿徒换Q策層抑制信息通過時空分布層的有效抑制和傳播。

圖15 集群通信連接分布變化Fig.15 Communication connection distribution of cluster

4.2.2 基于信息傳播的自主協同行為涌現性實驗

自主協同行為涌現性已在4.2.1節中完成現象觀測與穩定性驗證。主要驗證在具體的聚集與保持過程中(實驗3)以及在自主協同行為涌現過程中及其結果上(實驗4與實驗5),檢驗群組形成與運行時信息交互的實際發生行為,是否與動態群組中心節點的信息傳播意圖能夠匹配一致。

1) 實驗3:聚集與保持實驗。無人機集群群組聚集與保持實驗主要針對3個目標的群組規模變化進行的節點數統計,觀測3個目標的聚集過程具體運行情況。為便于繪制后續實驗將三目標出現時刻分別調整至5、8和10仿真時間步。

圖16中隨仿真推進,雖然首先發現三目標順序依次為目標1、目標2和目標3,但由于時空分布和信息擴散等情況,實際先完成聚集的是目標2,目標1、目標3緊隨其后,約滯后30步。3個群組均能夠建立并穩定運行。

圖16 目標觀測的群組統計Fig.16 Statistics of targets observation group

2) 實驗4:群組內外節點隔離實驗。群組內外節點隔離實驗主要針對聚集前后種群和集群鄰域信息持有情況變化進行統計。由于過程具備相似性,選擇最先完成聚集的目標2進行結果繪制,結果如圖17所示。由圖17可以看到,在群組形成過程中,隨著群組內部節點數的增加,集群內為與目標2觀測群組建立任務協同關系的節點數隨之減少,在群組聚集完成后,近乎即刻完成抑制與隔離。同時持有多目標信息節點數也在該時刻突變遞減,遞減趨勢沒有反復,說明這種抑制具有傳播的能力,即本文目標形成的基于動態多中心的決策傳播效應。群組形成時信息交互的實際傳播行為,與動態群組中心節點的信息傳播意圖匹配一致。

圖17 群組形成過程統計(目標2觀測群組)Fig.17 Statistics of formation process of group (observation group of Target 2)

3) 實驗5:群組內外目標信息傳播抑制實驗。群組內外目標信息傳播抑制實驗主要針對聚集前后群組內部和集群內目標信息交互頻次變化進行統計分析。

從圖17中無連接中斷情況下集群針對目標1~目標3信息交互的每步通信量變化。由圖18可以看到,3個目標均能夠隨著各自群組內部節點數的增加(即任務協同關系的逐步建立和穩定過程),保持一定的通信量,同時在群組聚集完成后,近乎即刻完成抑制與隔離。各條曲線的趨勢一致、無反復且具備穩定保持能力,說明這種抑制具備穩定性。群組運行時信息交互的實際抑制行為,與動態群組中心節點的信息傳播意圖匹配一致。

圖18 信息交互頻次統計Fig.18 Statistics of information interaction frequency

4.2.3 基于層間交互約束的群組調控魯棒性實驗

通過模擬弱通信連接環境和通信連接不同程度的中斷等情況,分別針對4.2.2節中的聚集與保持過程、自主協同行為涌現過程及其結果,觀測分層解耦后,對群組形成與運行時信息交互行為,與動態群組中心節點的信息傳播意圖是否能夠穩定的匹配一致,從而說明本文方法對群組調控的魯棒性增強。具體過程如下:

1) 實驗6:聚集與保持實驗。實驗場景要素設計與4.2.2節中的實驗3相同,同時智能體間添加頻次fINT服從泊松分布的連接中斷,在連接中斷期間,無人機節點無法與其鄰域產生信息交互。在此條件下,觀測3個目標的聚集過程能夠正常完成和延遲情況,以及群組能否穩定運行。同樣為便于繪制后續實驗將3個目標的出現時刻分別調整至5、8和10仿真時間步。具體地,模擬不同程度連接中斷情況,fINT依次服從泊松分布[0,3]、[0,5]、[0,8]和[0,10],結果如圖19所示。從圖19中可以看到,弱聯通條件加劇過程中,目標1~目標3的群組建立完成時間明顯滯后,但3個群組均能夠建立并穩定運行,證明本文算法在面向嚴重的通信中斷情況依舊具有較好的魯棒性。同時無人機觀測群組建立順序未發生明顯置換,在初始構型相同的基礎上,表明集群運行具備穩定性。

圖19 目標觀測的群組統計(弱通聯條件)Fig.19 Statistics of targets observation group (weak connection condition)

2) 實驗7:群組內外節點隔離實驗。實驗場景要素設計與4.2.2節的實驗4相同,針對聚集前后種群和集群鄰域信息持有情況變化進行統計,采用與實驗6相同方法進行魯棒性測試,即不同程度的連接中斷情況fINT變化相同。由于過程具備相似性,同樣選擇最先完成聚集的目標2進行結果繪制(見圖20)。從圖20中可以看到,弱聯通條件加劇過程中,目標1~目標3的無人機觀測群組建立完成的仿真時刻有明顯滯后,但均能夠建立并穩定運行,證明方法具有較好的魯棒性。同時在連接中斷程度增大過程中,各曲線突變點順序未發生明顯置換,在初始構型相同的基礎上,表明集群運行具備穩定性。

圖20 群組形成過程統計(目標2,弱通聯條件)Fig.20 Statistics of formation process of group (for Target 2, weak connection condition)

圖21 信息交互頻次統計(弱通聯條件)Fig.21 Statistics of information interaction frequency (weak connection condition)

3) 實驗8:群組內外目標信息傳播抑制實驗。實驗場景要素設計與4.2.2節中的實驗5相同,針對聚集前后群組內部和集群內目標信息交互頻次變化進行統計分析,采用與實驗6相同方法進行魯棒性測試,即不同程度的連接中斷情況fINT變化相同,結果如圖21所示。從圖21中可以看到,弱聯通條件加劇過程中,任務協同群組建立完成前通信量保持高位運行,且具備一定漸次擴散能力(見圖21(b)),本文方法對集群運行具備穩定性支撐作用。這種作用同時可體現在抑制作用穩定發生且不變,即群組建立后抑制作用持續性良好,即便存在不同程度的連接中斷,也并未發生目標信息由群組內向外擴散傳播,說明決策傳播效應不僅可有效發生,且具備保持能力。

4.3 綜合分析與討論

根據4.1節的論述與4.2節的實驗分析,進一步對本文方法的4方面重點進行綜合分析與討論。由于本文方法目的在于為無人系統的網絡化、自主化信息交互,提供可支撐協同涌現的信息交換解耦框架與底層機制。因此在驗證的過程中,一方面需要排除差異化場景對決策算法的特殊約束要求,如leader-follower、雁群、鴿群等算法,對集群內各個節點角色的事先劃分;另一方面需要驗證目標信息在層次化交換約束中交換的有效性,如目標信息是否能擴散,并在動態群組的形成與運行過程中得到信息傳播的和抑制;再一方面需要驗證網絡的彈性對無人系統信息交互自主協同涌現的穩定性與魯棒性的支撐作用。通過以上驗證方可證明,UAU-FO*所提供層次化解耦的信息交互與傳播方法,具備成為中觀尺度動態群落的信息交互控制機制共性基礎的可能。(需要注意的是,后續分析中對中心節點的召集行為的描述并不指中心節點發出了具有指向性和需求內容的指令,而僅僅向外傳播了目標的觀測結果信息。所以,整體實驗過程中,集群各層之間傳播與交互的具體信息,僅包含可觀測目標的信息。)

4.3.1 面向信息交互的分層解耦可行性分析

從信息交互的分層解耦可行性上看,依據本文設計的基于UAU-FO*的層次化信息傳播方法,在4.2.1節中,通過交互決策層的目標揀選,完成對時空分布層自身信息擴散與層次化約束控制。具體地,將任務協同關系的建立與運行,轉換為基于信息的目標篩選過程,局限在交互決策層,并對時空分布層的冗余信息進行層間交互抑制;而通聯關系的構建一方面取決于時空可達性,一方面依賴于目標揀選后行動對時空分布變化的影響。

在4.2.1節中,基于如上設計解耦后,從實驗1的結果看,目標動態出現的過程里,鄰近的節點能夠在層次化信息傳播機制的基礎上,實現對目標的聚集-隔離-老化-逃逸全過程,協同行為能夠在與通聯關系解耦牽制的基礎上,自主的建立并運行。同時魯棒性測試實驗,通過調節LinkCapmax模擬通信受到干擾、抑制和遮擋等弱通信條件,無人集群的群組自主聚集行為涌現和消散過程并不受時空分布層不穩定的影響。從實驗2看,整體運行過程中,無人集群的通聯整體情況穩定,未發生剝離現象和稀疏情況,兩層的網絡特性,在行為涌現過程中,雖出現一定波動,但能夠快速恢復幾乎滿通信負載的運行狀態,進一步說明了解耦后的層次化網絡具備穩定性運行基礎和動態恢復的彈性。

4.3.2 基于信息傳播的自主協同行為涌現性分析

從信息傳播的自主協同行為涌現性上看,其現象觀測與穩定性驗證已在4.2.1節中完成,依據本文設計的基于UAU-FO*的層次化信息傳播方法,以及本文目標形成的動態弱中心自主協同能力,還需要具備在整個過程中,檢驗聚合的群組與召集中心(即發現目標的散播信息節點)決策的各階段意圖是否保持一致,用以進一步說明這種涌現從宏觀觀測和個體的微觀行為上具備一致性。

在4.2.2節中,針對本文方法對動態中心周期性老化的具體階段進行劃分,分別開展了聚集-隔離階段的聚集與保持實驗(實驗3)、隔離前后的群組目標信息持有情況實驗(實驗4),以及隔離后集群內和群組內目標信息的層次化傳播抑制實驗(實驗5)。從實驗3看,在中心節點傳播目標信息開始召集后,接收到目標信息并揀選了該目標的節點開始聚集,對3個目標的聚集均能夠較快地完成,且從群組構成規模上具備協同關系的穩定性。從實驗4 看,在隔離前后,群組內目標信息的持有情況伴隨協同關系的建立完成,隔離前后出現了明顯的、近乎即刻的傳播抑制,且抑制的遞減趨勢在持續觀測過程中沒有反復,說明了抑制具備一定的傳播能力和穩定性。從實驗5看,對隔離后集群內與群組內的每步通信量分別統計分析,發現各條曲線的趨勢一致、無反復且具備穩定保持能力,進一步說明這種抑制具備穩定性。綜合上述,基于信息傳播的自主協同行為涌現能夠形成動態多中心的決策傳播效應,群組形成時信息交互的實際傳播行為,與動態群組中心節點的信息傳播意圖匹配一致。

4.3.3 基于層間交互約束的群組調控魯棒性分析

從基于層間交互約束的群組調控魯棒性上看,一方面在4.2.1節中初步從總體上證明了本文方法構建的無人集群信息交互機制具備一定的魯棒性增強能力。為進一步檢驗這種魯棒性增強和穩定性,是否能夠體現在聚合群組的各階段,用以說明這種涌現從宏觀觀測和個體的微觀行為在具備一致性的同時,兼具魯棒性與穩定性優勢。

在4.2.3節中,基于4.2.2節的對應場景,分別模擬弱通信連接環境和通信連接不同程度的中斷等情況,針對聚集-隔離階段的聚集與保持(實驗6)、隔離前后的群組目標信息持有情況(實驗7),以及隔離后集群內和群組內目標信息的層次化傳播抑制(實驗8)等各階段場景,進行的實驗測試,檢驗本文方法模型構建的機制,是否在各個階段均能夠具備對惡劣條件的抵御能力。從4.2.3節的3項具體實驗結果看,在通信鏈接中斷情況隨機性與頻次增大的過程中,目標1~目標3的無人機觀測群組的聚合完成與抑制,均較4.2.2節中對應良好通聯情況有明顯滯后,但均能夠建立并穩定運行,證明方法具有較好的魯棒性。同時在連接中斷程度增大過程中,各曲線突變點順序未發生明顯置換,在初始構型相同的基礎上,任務協同群組建立完成前通信量保持高位運行,具備一定漸次擴散能力,且群組建立后抑制作用持續性良好,說明決策傳播效應不僅可有效發生,且具備保持能力。在上述多個階段的魯棒性測試驗證過程中,可以看到這種魯棒性是持續作用的,是基于UAU-FO*的層次化信息傳播方法對交互決策和時空分布解耦后帶來的集群中觀尺度的固有屬性。

4.3.4裝填算法模型的可調整性

從裝填算法模型的可調整性上分析,本文方法對差異化決策與控制算法的可調整性在于信息交互的范圍控制、信息采信融合的具體策略以及決策傳播的策略的不同。涌現出具備協同行為的群組規模,僅取決于作為動態弱中心的節點對目標類型、威脅等級等信息的判斷,而與具體的信息交互要素無關。這種對多類型任務規劃、目標分配、構型控制等方面算法的兼容適配能力,來源于基于UAU-FO*的層次化信息傳播方法本身。

由于方法的初始設計僅關注信息交互的行為特征,并不約束具體的交互內容,各個無人節點僅按自身需求進行信息的擴散與層間約束,而不關心是否存在類似拍賣算法的多輪出價交互、也不關心是否存在中心控制節點的指令、更不關心領導節點的動向變化。因此,無論是鄰域信息聚合決策、級聯鄰域信息聚合決策、回流剪裁的級聯信息聚合決策還是全局信息聚合決策,層次化解耦的約束要素僅在于個體對目標信息的揀選。因此,本文所提方法具備裝填算法模型的可調整性,是系統級機制設計創新,為典型場景中目標分配和任務規劃等需求提供了具備耦合與彈性調控能力的底層機制與架構。

進一步分析本文方法的裝填算法模型可調整性,當前方法及實驗驗證過程中,各個節點的目標信息融合、目標評估揀選算法相同。但在開放式環境中,集群節點的信息交互及其約束需求差異化將更加劇烈。因此,在后續研究規劃中需要進一步開展對差異化場景下、或受不同的決策與控制算法影響下,影響層次化協同行為涌現的共性要素。同時,研究不同分層解耦粒度的系統,面向信息交互與傳播如何進行層次對齊的問題。以期通過上述持續性研究,在增強和深化層次化信息交互方法的同時,保持裝填算法模型的可調整性的原始設計特性。

綜上所述,本文所提模型對動態群落目標協商揀選與決策傳播能夠完成群組的隔離,有效控制對信息關注和交互,實現群落生成與規模調控,增強了無人機系統在信息交互與傳播演化方面的魯棒性和健壯性,可為進一步擴展模型方法,適配多樣化的場景提供衍化基礎。

5 結論

本文針對無人系統的實用化存在多層次控制的互動統一問題,從群體行為的中觀尺度考慮節點關系演化與控制,將結構特性與信息交互特性解耦分層,以形成決策傳播效應為目標,提出了基于UAU-FO*的層次化信息傳播方法,進而構建了面向時域、空域上動態變化目標無人機群目標分配的層次化信息傳播方法,通過仿真驗證了該方法對實現自主目標聚合解聚的有效支持作用。具體而言,面向無人系統對指揮控制層和通信組網層進行信息交互的解耦,以通信能力來保障任務協同,以任務信息交互與個體決策完成控制,提供基本的信息交互控制機制的設計實現,為無人機集群以共性關聯實現個體行動、任務協同與集群組織的行為一致性與互動性的耦合與統一提供思路,提出了具備自主與受控間混合平滑模式遷移能力的層次化無人系統信息傳播方法與基礎框架,為現有算法面向差異化應用場景,提供了一套可擴展、可聯合的層次化系統“容器”。

在本文的基本方法框架下,信息交互控制視角可為進一步拓展研究無人節點之間以個體與群體混合形式的復雜博弈問題提供多尺度互動統一的方法模型,也是未來在中觀尺度繼續完善本文所提方法框架的重點。如面向運動動力學、平臺能力構成不同的節點所組成的集群,如何構建面向個體與群體混合形式復雜博弈的信息隔離策略,使得多維度信息在跨解耦層次、跨多個群組過程中能夠高效交互,并延續本文的對優化通信負載、增強魯棒性、兼具個體自主性的出發點,將是后續研究中需要持續深入研究的重要課題。

猜你喜歡
層次化群組集群
面向量化分塊壓縮感知的區域層次化預測編碼
海上小型無人機集群的反制裝備需求與應對之策研究
關系圖特征在敏感群組挖掘中的應用研究
一種無人機集群發射回收裝置的控制系統設計
Python與Spark集群在收費數據分析中的應用
勤快又呆萌的集群機器人
鐵路傳送網OTN設備互聯互通開銷層次化處理研究
基于統計模型的空間群組目標空間位置計算研究
艦船系統間電磁兼容性的層次化優化方法
基于層次化分類器的遙感圖像飛機目標檢測
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合