?

基于類腦智能的無人集群設計初探及關鍵技術淺析

2024-01-05 06:50張融愷
無人系統技術 2023年6期
關鍵詞:類腦無人集群

張融愷,閆 鑌

(1. 智能博弈與決策實驗室,北京 100091;2. 信息工程大學信息系統工程學院,鄭州 450001)

1 引 言

無人集群是面向未來的熱點研究領域,其具有低成本、低傷亡、高密度、高容錯的特點,智能化無人集群更凸顯了分布式分攤風險(100-1>0)和協同式聚合能效(1+1>2)的優勢,成為各國科技角力的核心科研領域[1]。各軍事強國紛紛開展了分布式、小規模的集群作戰平臺研究[2],著眼未來戰爭,發展智能化、協同化的無人作戰系統[3]。目前無人系統已基本實現多無人機控制能力[4],美國開展了多項無人項目,包括“小精靈”“郊狼”“山鶉”[5],歐盟提出壓制防空無人機蜂群領域合作[6]。無人集群具備數量多、密集高、規?;膬瀯荩?],國內也已完成3051 架次的多無人機的同時控制[8]。

多無人機進一步發展為無人集群,需要從數量優勢向智能化、協同化的質量優勢逐步演進。全球人工智能和機器人峰會構想無人集群具有5S需求[9],包括集群化、智能化、小型化、安全性、敏捷性。美國規劃2025 年無人集群將實現高度自組織控制并具有戰場認知能力[10]。目前無人集群的智能協同能力仍處于起步階段,研究場景多為靜態及可控的任務,控制主要依賴預組織和預定義的程序,而未來無人集群需要面向動態復雜的高不確定性環境[11]。要實現無人集群智能協同能力的提升,腦驅智能啟發算法作為無人系統的大腦,是無人機集群感知、協同、控制能力的重要來源。

模仿生物群體智能是當下無人集群的主要方案,借鑒自然生物群落如蟻群、蜂群、狼群的集群行為,運用簡單的內部規則條件控制整體行動,促進早期無人系統控制獲得一定的自主能力。然而在面向復雜動態環境時,生物群體涌現的集群智能具有一定局限性,例如生物群體啟發的無人集群組成要素相對單一,各模塊間交互方式較為固定,智能形式呈現初級的自下而上模式。仿生集群方案可能面臨發展受限的問題在整體遷移性和適用性方面有待提升,難以實現在復雜多任務場景中的有效應用。

隨著腦科學及神經科學在近幾十年的快速發展[12],腦啟發算法為無人集群智能演化提供了另一種仿生思路。大腦作為自然界公認的高級智能系統,借鑒類腦智能的感知、決策、規劃能力成為多領域研究的發展趨勢。類腦智能是指受腦機制和人類認知過程啟發,基于計算建模通過軟硬件結合實現的機器智能[13]。人造系統經過了漫長的迭代升級,然而目前沒有一種通用智能系統能達到人腦的智力水平[12]。因此大量研究均面向人腦的多維感知能力、環境適應能力、自主學習能力,以促進人造智能系統在相關領域能力的突破。目前類腦研究主要包括兩個方面,模擬大腦神經元模型的類腦芯片,以及智能感知的類腦機器人。類腦智能在無人系統領域已開展了初步的探索,包括多維復雜態勢信息感知、分布式任務的方案優化、無人機故障排查、無人系統實時路徑規劃等[13]。歐盟啟動的腦計劃研究中部署了人腦模型的高級計算架構,通過模仿人腦的工作模式啟發未來的計算機及機器人開發。類腦模型的SOAR(State,Operator,and Result,狀態、操作者和結果)架構[14]也廣泛應用于計算科學、機器人控制、智能感知等領域。此外,腦模型在硬件領域啟發了類腦芯片的研發和應用,未來的高性能計算架構將獲得類腦的低功耗和高并行能力[15]。目前廣泛研究的人工神經網絡也參考大腦的功能結構,全連接網絡層借鑒了神經元的連接模式,卷積神經網絡模仿視覺系統的感受野,長短時記憶網絡的優異性能受到記憶機制啟發,脈沖神經網絡融入了神經元的激活和抑制特性。腦系統作為通用智能的參考模板,科研人員希望能夠充分學習其出色的知識遷移能力和自組織能力[16]。

現有無人集群的類腦研究處于起步階段,人工神經網絡應用成為當下主流的仿腦模式,集群的腦啟發形式仍以應用人工神經網絡為標志,這與現有計算設備的硬件與軟件約束有關。然而,人工網絡的仿腦原理與腦啟發的類腦機制不同,其在硬件構成和功能實現上與真實大腦仍有差異。研究人員逐漸重視真實大腦與無人集群的關系,借鑒大腦模型構建無人系統,在類腦的宏觀層面上開展了無人集群的交叉研究。Zhao等[17]受到腦機制的啟發,研究模仿人腦記憶通路的無人集群決策模塊,構建個體知識庫以實現熟悉場景的快速洞察。無人系統模仿人腦路徑規劃能力,在復雜環境中動態規劃最優路徑。魏瑞軒等[18]的研究中,運用高密度無人集群解決碰撞問題,構建丘腦-基底核-額葉皮層的類腦通路,協助無人集群獲得“條件反射”的實時快速調整方案。

類腦與無人系統的混合智能組合模式,一方面借鑒了人腦的智能決策能力,另一方面充分發揮了無人系統在危險惡劣環境中的執行能力,人機結合能夠相互取長補短,為無人系統賦人腦智能將有效融合二者優勢。研究人員已在多種無人系統中探索類腦方法[19],在多種無人集群的現實任務中獲得效能增益。強化學習是借鑒人與環境的交互模式[20],通過模仿人類在環境中獲得收益或懲罰的反饋通路 ,優化無人機間的通信策略[21],訓練無人系統與想定環境實時交互以獲得性能的快速迭代優化,通過自學習過程實現自動的增量知識獲取。此外,類腦的智能無人集群應進一步拓展應用領域,集群模型框架不應約束無人機的運行空間,系統應面向體系和框架的構建,從而打破空域壁壘實現跨域協同。無人集群智能的類腦啟發路線仍處于初步探索階段,腦科學的快速發展也發掘出多種創新的認知理論。無人集群與類腦集合是人腦智能的復刻、拓展、延伸,多層次的腦機制模仿和運用為無人系統提供了廣闊的融合發展空間。

本文對無人集群系統提出了多角度的探索思路,從端、邊、云三個角度討論了腦機制與無人系統的結合方式,為類腦和無人集群的混合智能構建了具體方案。首先,對單體無人機的構成要素進行分析,參考神經元和腦功能結構提出通用異構的無人機設計思路。其次,借鑒腦機制的神經通路模型,將高效、低功耗優勢應用于無人集群的拓撲和鏈路方案。此外,基于人腦雙向、多循環的視覺加工機制,構建無人系統從感知到決策的環形信息交互體系。綜合上述類腦無人集群的基礎架構,模仿人腦的自修復、自組織、自適應、自學習等高級認知功能,進一步提升無人集群的長期穩定和自我進化能力。最后,面向現階段的無人集群和類腦研究基礎,展望后續類腦無人智能集群的探索方向。

2 腦啟發的個體無人機設計

個體無人機模仿大腦神經元的基本結構,探索單體無人機在節點層面的設計方法。個體無人機是無人集群的基本實體單位,承擔觀察、通信、決策等細分任務。人腦的基本單元結構是神經元,在處理復雜事項時也可將腦功能區作為細分模塊。無人機的層次化劃分與大腦分層結構具有共通性。本文從神經元和腦功能區兩個類腦尺度進行分析,討論腦啟發的未來個體無人機結構。

2.1 通用異構的個體無人機

平臺通用、載荷異構的個體無人機形態具有低成本、高復用的優勢,有利于提升無人集群整體構建的共融協同能力。平臺通用提升了無人機間的溝通效率,并節約了開發多平臺的時間和經濟成本。載荷異構為無人機的任務多樣化提供了可能,便于無人集群在執行復雜任務時細化分配子任務。前期規范化的無人機個體設計有利于集群間協作,并提升集群的再組織能力。

個體無人機可參考腦結構中神經元這一基本結構和功能單位,在底層模型構件中盡量趨同相似以實現平臺同構,在子任務中細化要素形成載荷異構。大腦的神經元基礎形態由胞體和軸突組成,各腦區神經元的分子組成和主要形態并無顯著區別,根據各神經元的任務需要演化為多種功能特質,各神經元的胞體突起大小、軸突長短、釋放神經遞質種類可能存在顯著差異。參考大腦的神經元分類方法,感覺神經元負責刺激的傳入和感知,聯絡神經元擔任神經脈沖的任務傳遞,運動神經元主要指導骨骼肌的運動。如圖1 所示,感知無人機可根據任務分工搭載功能性模塊,觀測無人機掛載紅外、雷達等感知模組,通信無人機配備鏈路交互單元,執行無人機裝載執行任務的專用儀器。無人集群可模仿人腦工作模式,在實際任務執行中借鑒大腦的信息處理機制。類腦智能的無人集群在遂行任務中遵循OODA(Observation 觀察、Orientation 判斷、Decision 決策、Action執行)環路,其常規協同流程如下:感知無人機類似無人集群的眼睛,主要負責觀察不同階段以獲取前方態勢信息,并將態勢信息源源不斷上傳至臨近通信無人機;通信無人機類似無人集群的大腦和嘴巴,負責態勢信息的收集、整合和溝通,主要實現判斷和決策任務,一方面將感興趣目標信息反饋回感知無人機進行進一步觀測,另一方面指揮執行無人機完成預期任務;執行無人機類似無人集群的雙手,主要負責執行階段,基于搭載設備實現有利于集群的現實操作。神經元在生物演化中進化出整體形態相近、功能細化不同的通用異構形態,兼具低成本、高平替的特性,可以作為個體無人機規劃的參考模型。

圖1 通用異構無人機的類腦設計Fig.1 Brain-inspired design of general heterogeneous UAV swarm

通用異構設計方案與美軍最新的馬賽克作戰思想契合[19],運用統一的開放式架構,應用成熟的商用接口,面向特定任務為通用無人機部署特種功能[22]。馬賽克作戰思想[23]是基于大量單一、可平替的低成本平臺,構建靈活自適應的無人集群,以提升無人機間互操作性和自適應性[24]。一方面,無人集群的底層個體元素由統一規范接口的通用無人機組成,可有效提升內部數據共享及信息傳輸效能。另一方面,根據任務需求設計無人機的異構方案,有利于集群的靈活組合和功能復用,提升無人系統整體針對動態復雜環境任務的執行能力。

2.2 無人機的模塊化層級架構

無人集群與個體無人機間一般存在多個層級,中間層級增設可提升底層組織能力和模塊間協同效率。部分無人機組成的中間層級可借鑒腦功能區的規劃模式,底層個體按照相近功能進行聚合。

研究人員發現大腦的信息加工主體為腦功能區,目前公認的布洛德曼分區將大腦劃分為52 個區。解剖學研究發現刺激相應腦區會影響特定認知功能,熒光蛋白標記研究驗證了大腦工作依靠腦功能區間的協作。這些負責特定感知信息處理的腦功能區包括:處理視覺信息的枕葉視覺功能區、控制肢體運動的頂葉運動皮層、加工聽覺信息的顳葉聽覺皮層。功能區內部的神經元結構和功能相近,能夠集中高效處理特定的任務信息。Tang 等模仿大腦的功能區分布提出了SPAUN 腦模擬器[25],在SPAUN 腦模擬器[26]中設置了250 萬個模擬神經元,并將其劃分為10 個模擬腦功能區,這項多腦區協同計算模型具有開創性意義。無人集群的子部分可以模擬腦功能區的聚合形式,縮小功能相近的無人機間的距離。需要注意的是,無人機間的距離減小可以是空間距離,也可以延伸為拓撲結構的連接距離,其主要目標都是降低相近信息整合與交互過程中的通信損耗。此外,無人集群的分層設計可以借鑒視覺區V1、V2、V3的大腦層級架構,聚合單體神經元的視覺能力,形成處理亮度、輪廓、紋理的高級功能。分布式的無人機個體通過聚合集中,形成超越個體的群體處理能力,得以完成高級復雜任務。

目前的無人集群主要執行短時間的在外任務,執行長時任務需要對無人機功能分層管理。無人集群在外長期執行任務,需要穩定可靠的生存能力,同時要具備持續更新的自學習能力。如圖2所示,大腦在進化中逐漸發展為三層結構,底層爬蟲腦負責呼吸、體溫等生命維持功能,中層哺乳腦發育出捕食及社交能力,高層的皮質腦進化出人類的感知、決策和判斷功能。爬蟲腦、哺乳腦和皮質腦分別代表了人類的生存需求、生活需求和進化需求。當下無人集群的發展處于爬蟲腦向哺乳腦的進化階段,可借鑒人腦的進化路徑增加相應功能,首先實現自組織的通信和觀測能力,再逐步拓展自學習的進化迭代功能。

圖2 類腦無人集群的功能分層管理Fig.2 Functional hierarchical management of brain-inspired UAV swarm

3 無人集群的類腦交互模式

無人集群的分布式結構可抽象為邊和節點的關系,個體元素間穿點成線形成集群整體,通過溝通連接共同完成任務。無人機間的連接和分布可參考大腦信息加工模式,腦系統進化過程中篩選出的拓撲結構和連接模式是優質模板。本文基于腦啟發的通信等級、交互環路、網絡組織三個層次探討無人集群的類腦交互模式。通信等級劃分中,對海量信息進行取舍并排序加工優先級,預設專屬鏈路實現重要信息優先處理。交互環路設計中,雙向內外循環的指揮鏈路形成指令反饋環路并提升信息交互效率。網絡組織規劃中,節點拓撲組織形式模仿穩定高效的“小世界”腦網絡。

3.1 預設重要信息加工通路

無人集群在執行任務時有大量信息排隊等待處理,包括原始環境采集數據和海量中間處理文件。無人系統對信息重要性排序并優先處理關鍵任務,將提升整體任務規劃能力并優化數據加工流程。無人集群經常面對目標價值排序和任務優先級設置問題,在規劃多任務時可參考腦系統中的通路設置,以類腦的專屬通路和預設通路為例,啟發無人系統的任務分配方案。

無人集群在分布式協作時首先要分清敵我,敵我識別的混亂將混淆任務對象和合作伙伴。大腦在進化過程中為自我認知構建了專屬通路,以回答“誰是我們的敵人?誰是我們的朋友?”腦機制的自我識別功能中最具代表性的是“雞尾酒原理”,即人們在嘈雜的雞尾酒會中也能清晰地聽到自己的名字。研究發現人腦在潛意識下也在自動捕捉自我相關信息,當自我屬性信息出現時會喚醒大范圍的大腦皮層。在心理學實驗中被試對自我姓名和面部的按鍵反應更快,并且對自我信息的靈敏度更高。核磁掃描發現大腦對自我信息有特異性反應,包括自我識別的專屬通路和右前額葉腦區的特異性激活。無人集群在自我識別時也可參照大腦機制,一方面通過設置專屬通路提升敵我識別加工的優先性,另一方面分配部分線程進行自動持續的身份驗證。無人集群對自我識別的優先處理有利于敵我態勢的實時感知,及時評估集群現存的行動能力,快速調整任務規劃并提供信息支撐。

無人集群大多采用固定處理流程加工環境信息,通用處理模板的多樣性感知信息能力仍有待提升,集群可以對感知信息預先分類并分配至預設通路進行針對性加工。例如,無人集群的目標檢測及定位可參考大腦視覺的工作模式,信息的分類加工可以參考大腦視覺處理的兩條預設通路。進行物體的視覺加工任務時,物體的識別通過大腦腹側的“what”通路加工,而物體的位置和運動信息通過大腦背側的“where”通路處理?!皐hat”和“where”通路分別預設了不同的視覺加工能力,前期視覺任務分類后會歸屬到特定通路進行針對性加工。無人集群在任務處理時可借鑒預設通路的模式,預設多種人工神經網絡結構處理多樣化數據。如圖3 所示,以集群收集到的圖像、時序、拓撲信息為例,采集到的視覺圖像數據應用卷積神經網絡,音頻及雷達等時序信號使用長短時記憶網絡,集群的拓撲圖信息運用圖神經網絡等,發揮神經網絡各自優勢處理類型匹配的環境數據。將不同任務分配給專業的信息加工通路,提升差異性任務的定制化加工能力。

圖3 無人集群處理多模態數據的專屬通路Fig.3 The exclusive path of the UAV swarm processes multimodal data

3.2 雙向內外循環的指令鏈路

無人集群任務執行中的信息主要在感受節點和決策節點間傳遞,信息傳遞方向大多為從感受節點到決策節點的單向自下而上模式,以及決策節點實時控制末端節點的單向自上而下模式[27]。如圖4所示,OODA 模型提出后,部分無人集群采用觀察、判斷、決策、行動的4 步驟,形成周期性重復的單向閉環,規范了無人系統任務執行的操作流程?,F有OODA 模型仍可以進一步優化創新,包括縮短環路運行周期,以及提升信息利用效率。本文提出類腦的雙向內外循環的信息傳輸環路,雙向通路促進了層級間信息流向的多樣化,內外循環增加了外部數據及中間信息的復用效率。

圖4 無人集群的指令鏈路Fig.4 The instruction link of UAV swarm

外部信息的通路可以參考多級視覺皮層的信息流向,視覺信息加工框架可以應用到無人集群的通信過程中。研究人員起初認為視覺信息從低級V1 區逐漸向高級區V2、V3、V5 傳遞,進一步研究發現高級視覺區能夠指導低級區的信息處理,形成了雙向的信息交互通路,例如高級認知分配更多注意力調整低級視覺區關注感興趣的圖像細節。更深入的研究發現V2、V3、V4 存在內部信息的循環交互,信息處理中產生的亮度、顏色、輪廓等特征經歷了循環加工,內部信息循環有效提升了數據利用率。研究人員在人工智能領域中,探索使用過雙向循環的類腦模型,例如圖靈獎得主、深度學習先驅 Geoffrey Hinton 提出未來人工智能將應用“前向-前向”的前向網絡,在反向傳播的基礎上推廣了更接近大腦機制的正向傳播算法。

無人集群的防碰撞研究正在探索雙向內外循環的交互方式,Girard等將腦啟發的碰撞規避原理應用于無人集群的碰撞規避[28],其提出的基底核-丘腦-額葉交互模式中包含雙向通路和多層循環。魏瑞軒等提出自主心智發育的無人機防碰撞控制架構[18],借鑒類腦模型中的避障航路方法,構建了以知識庫、避障策略、威脅模式為功能節點的雙線循環通路。ACT-R模型[29]應用腦啟發的功能區環路建模,實現了特定任務中的活動預測。

3.3 穩定高效的小世界網絡

目前無人集群的主要拓撲結構包括:星形組網、中心式組網、網狀組網、分層混合組網等?,F實中根據任務難度評估無人集群所需的穩定性、效率、交互性等因素,側重任務需求選擇相應的拓撲結構。然而人為預設定的拓撲方式難以滿足動態的環境變化,任務牽引的無人集群自適應拓撲方式更符合復雜多變的現實任務。其中,為無人集群設計優質的默認網絡結構將大大降低自適應難度,促進集群在默認網絡基礎上的優化改進。

大腦在長期進化中發展出一套高效穩定的基礎網絡結構,“小世界”的拓撲形式在多種腦網絡中得以驗證[30]。如圖5所示,“小世界”規律是指融合了相鄰節點的密集連接以及遠距離節點的長程連接,其結合了正則網絡的穩定性優勢和隨機網絡的效率優勢,既穩固了相近節點的合作又降低了信息長傳的中轉次數,在聚類能力和連接代價中保持了平衡。已有多項研究將“小世界”模型應用在城市交通和社區建設中。上文將個體無人機類比大腦神經元或功能區,腦網絡的拓撲方法同樣可以移植應用于無人機集群,提升功能相似無人機的通信頻率,增加處理任務時同類無人機的協作能力,保留部分長程中繼通信能力,為無人集群間的遠距離交互留有溝通鏈路。無人集群根據環境進行自適應調整時,只需在默認“小世界”拓撲結構中調整臨近聚類密度和長程連接數量,這將有效降低網絡優化難度和重組織時間。

圖5 無人集群的交互連接方式Fig.5 Interactive connection mode of UAV swarm

4 類腦無人集群的高級智能呈現

通過在個體無人機與集群交互的底層框架基礎上構成靜態骨架,織線成面的無人集群將進化出更高的協同智能,實現動態組織和自我進化的軟實力提升。目前的無人系統在高損傷情況下難以達到與腦系統一樣的魯棒性,并且在復雜環境中缺少穩定的自組織協同能力。類腦無人集群借鑒人腦的自修復性提升抗毀自愈能力,應用腦機制的自組織方案改善整體協調功能,參考腦啟發的自學習模式促進集群持續優化迭代。

4.1 自修復與自組織能力

無人集群運行時會面臨部分節點失靈或損毀情況,子功能損傷可能引起上下游信息擁堵,節點損壞會進一步導致整體性能缺陷。目前應對突發情況通常設置緊急預案,評估集群整體損傷等級后執行備選方案。有限固定方案難以精確應對復雜損傷問題,無人集群仍需提升針對現實受損情況的自我修復能力。無人集群可以參照大腦強大的自我修復功能,極端案例表明,患者在失去一半大腦后仍有機會存活。本文以大腦的日常修復、部分損傷、嚴重損傷為例,討論無人集群的類腦修復方案。

日常維護是保證無人集群穩定運行的基礎,無人機的狀態評估和診斷預測將有效降低其老化受損風險。無人機自我診斷領域逐漸使用深度學習方法[31],Guo 等利用卷積神經網絡預測無人機傳感器的故障[32],彭軍等應用深度信念網絡進行發動機的故障分類[33]。無人集群進行周期性的測試檢修,其檢修頻率可以參考大腦睡眠周期。通常大腦在夜間睡眠時會進行白天受損神經元的修復,在評估白天工作量和神經元受損狀態后調整睡眠休整時長。無人集群可借鑒大腦調整工作強度與睡眠時長的規律,評估無人集群的任務難度以調整檢修頻率,交替排布無人機的檢修和工作時間表。

無人集群的部分損傷可通過鏈路重分配方式,從全局角度尋找重組方案來盡可能保持集群的整體性能。如圖6 所示,這種全局尋優的修復方式可參考大腦機制,例如視力障礙患者的觸覺聽覺功能得到加強,肢體永久損傷對應腦區的神經元會被近鄰腦功能區延伸占用。神經元功能復用和重分配有效緩解了部分節點損失,可以延伸應用到受損節點的周圍無人機,與集群整體重新建立連接。通過充分利用剩余無人機構建新的上下游連接,保障和加強集群內其他功能通路的有效運行,實現功能自愈并保持整體執行能力。在集群設計初期應預留容錯空間,布設一定比例的冗余節點,實現損傷個體無人機的快速替換。若預留的冗余無人機仍難以填充現有損失缺口,可以參考大腦中神經干細胞的更新方式,整合各損傷無人機中完好的部分零件,拼湊重新組合成新的組裝無人機,維持集群的基本運行。

圖6 無人集群的自修復、自組織功能Fig.6 The self-repairing and self-organizing functions of UAV swarm

4.2 自學習能力

目前無人集群出廠及行動前被植入基礎功能,使用目標相似任務數據庫進行離線學習。然而,離線學習數據庫的方式有一定的時間滯后性,并且需要將數據庫在目標任務間遷移,難以適應動態未知的現實任務環境。知識的獲取有利于無人集群智能化的提升,可以參考人腦對新知識的學習模式,增加無人集群在任務中的自學習能力,獲取真實環境中的動態知識。如圖7 所示,類腦無人集群的學習可以分為3 個階段:在學習庫中存儲知識、與環境交互過程中掌握知識、開辟空間持續拓展知識。

圖7 無人集群的自學習流程Fig.7 Self-learning process of UAV swarm

無人集群通過任務獲取的數據不斷擴大知識庫,提煉整合感知的信息加入自身知識庫是自學習功能的第一步。記憶功能可參考大腦海馬體和丘腦的存儲模式,將任務經歷重演形成知識庫的長期記憶。知識庫的構建將動態信息持續整合形成經驗累積[34],同時便于相近任務決策時的知識快速檢索,縮短無人機的反應時間。研究學者受大腦記憶模式啟發,提出了可塑突出形態的赫布法則[35],深度學習領域也將模擬人腦神經元的脈沖神經網絡應用于機器的記憶能力研究[17]。在無人系統的知識庫構建研究中, 魏瑞軒等在無人機避障方法中引用規避策略知識庫,模擬丘腦對知識的增量獲取功能,提升無人機預防碰撞的策略發育[18]。

無人集群在知識庫的基礎上還需反復強化運用新知識,與環境交互測試中強化新知識記憶通路和運用能力,在真實場景下改善無人系統的環境自適應性。強化學習模仿大腦的學習過程[36],通過環境反饋的獎勵結果優化現有知識結構,這種無需人工干預和標記的方法,被廣泛應用于機器智能體的自學習過程中。Qiao 等模擬內顳葉皮層對視覺能力設計了強化學習框架,提升了智能體物體識別在遮蔽、旋轉等不同視角下的魯棒性[37]。Jafari 等提出了大腦情緒模型啟發的智能控制器,情緒機制啟發的無人系統具有小型化和實時性優勢,在無人機飛行測試中展現出更強的抗干擾能力[38]。機器憑借自身算力優勢,強化學習的智能體在個別領域的能力甚至超越人類,例如DeepMind 提出的AlphaGo Zero 展現出極強的圍棋技術,以及Neural Turing Machine 在多智能體協同的星際爭霸游戲中擊敗了人類世界級選手。

強化學習的運用提升了無人集群的學習技能,增量學習將進一步提升無人系統的終身學習能力。無人集群對新知識的增量學習促進系統保持長久的進化趨勢,同時系統應保持新舊知識的更替,替換失效舊知識為新知識提供記憶空間。新舊知識替換過程可以借鑒大腦的遺忘機制,頻繁使用的知識會加強記憶通路,而長久未用的知識遵循遺忘曲線規律而逐漸忘記。研究人員提出了類腦的HAM人類關聯記憶模型[39],人工神經網絡中的增量學習借鑒大腦遺忘模式,通過凍結舊神經元和增補新神經元獲得記憶空間,分配新記憶通路或重組記憶網絡獲得新知識。機器人實際應用場景中,Sandini等[40]應用增量學習思想提出了類腦的認知發育機器人,Gao 等[41]應用增量式特征提取改善機器人的辨認和識別能力。

5 類腦無人集群的未來展望

類腦的無人集群研究是前沿的交叉領域,其整體性能的提升依靠各自學科的研究發展,混合智能效果呈現交互的螺旋上升趨勢?,F有腦啟發的無人系統仍處于起步階段,從整體架構到細節設計均有待探索和完善。本章列舉類腦無人集群在多個研究領域的未來增長點,多方向形成合力協助無人集群的智能化發展。

5.1 類腦芯片助力無人集群成為忠誠守望者

未來無人集群將負責更多的巡航、觀察等態勢感知任務,持續不間斷的信息采集成為無人集群的重要功能。大腦可以在消耗極低能量的情況下調控維持人體的生理功能,并在低功率狀態下完成與外界的多種交互。未來的類腦芯片使用將大大降低機器功耗,通過將脈沖神經網絡、憶阻器等應用于類腦無人機,可顯著提升無人機的續航功能。低功耗的無人機可完成更長時間、長距離、高復雜度的任務內容,提升個體無人機的連續工作能力,在接力偵察和周期巡邏中降低無人機架次。此外,對于處于靜默狀態的無人機,低功耗優勢將延長其待機和壽命年限,可在更早期部署而不需擔憂短期能源問題。

5.2 強化對抗訓練無人集群成為持續學習者

目前無人集群的學習方式主要基于離線數據庫訓練,缺少自我學習的迭代更新能力,并且需要根據目標任務挑選相關數據進行預先學習。研究發現填鴨式教學收效快但難以迭代和創新,而面向環境和現實問題的互動啟發式教學可以調動智能體的積極性。無人集群作為智能體可借鑒交互式的訓練方法,在現實場景交互過程中學習針對性知識,并根據不斷變換的外部環境更新和優化現有知識庫。此外,可參考教學中的辯論和討論形式,形成智能體間的對抗[41]和博弈模型,擇優留存性能最佳的模型樣本,或針對不同智能體優勢構建多場景的后臺預案。

5.3 腦機交互促進無人集群成為敏捷執行者

目前無人集群任務執行仍需人工在環路的指導和輔助,這需要人與機器間高效準確的交互溝通,快速變換的復雜任務場景尤其需要對無人機的精確控制。類腦無人集群模仿人腦的信息加工模式,將提升中間數據處理結果的直觀性和解釋性,間接幫助操作人員對態勢信息進行判讀和分析,有益于后方人員快速下達準確的操作命令。短期內可借助增強現實、混合現實等沉浸式的交互應用技術,將外界信息直接刺激個人感官系統,協助操作員獲得全方位的態勢信息。此外,目前人機交互模式為鍵盤鼠標及操控搖桿,隨著腦機接口技術的不斷發展,腦機交互可能逐漸替代外周神經系統間接控制的肢體交互,人腦將實現與機器的直接互聯通信。研究發現肢體操作信號僅占大腦神經指令的一小部分,大腦信息的直接傳輸將提升人機交互效率和指令準確性。

6 結 論

類腦無人集群是無人系統實現智能化和協同化的創新方法,腦驅智能將助力無人集群獲得類腦的感知和認知能力。本文從個體無人機設計、集群環路搭建、高級智能呈現三個角度討論了腦啟發的無人系統應用。類腦無人集群融合了人腦機制與機器結構形成混合智能,將充分發揮人類智能的認知優勢和無人系統的執行優勢。本文借鑒人腦機制啟發無人集群的感知和決策能力,分析了無人集群與人腦系統的共性,并對未來無人集群的類腦方案提出研究設想及建議,為無人集群在智能化和協同化道路上的發展提供了參考。

猜你喜歡
類腦無人集群
神經元規模最大類腦計算機問世
基于多尺度網格細胞模型的無人機類腦矢量導航方法
海上小型無人機集群的反制裝備需求與應對之策研究
無人戰士無人車
反擊無人機
一種無人機集群發射回收裝置的控制系統設計
中國成立“類腦國家實驗室”“借鑒人腦”攻關人工智能
Python與Spark集群在收費數據分析中的應用
詩到無人愛處工
無人超市會流行起來嗎?
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合