?

異維異質非線性多智能體系統的一致性自適應控制器設計

2024-01-25 01:10范永青
指揮與控制學報 2023年5期
關鍵詞:異質維數一致性

秦 波 朱 旭 范永青 高 揚

1.西安郵電大學自動化學院 陜西 西安 710121

2.北京航天計量測試技術研究所 北京 100076

多智能體動態系統在各種工程領域中有著廣泛應用.其中,系統中各智能體之間的協同控制器設計已經成為學者們研究的一個熱點問題[1-5].各智能體的狀態實現一致性是整個系統完成協同工作任務的一個重要判斷標準,因此,研究一致性控制器設計是多智能體系統中協同控制的一個基本問題.關于同質多智能體一致性控制器的設計已經提出多種豐富的研究成果[5-9].在實際應用中,每個智能體帶有不同的動態特性(即,異質多智能體)廣泛存在.因此,如何設計異質多智能體系統的一致性控制器是學者們的研究興趣之一.

諸多學者提出多種異質多智能體系統的控制器設計方法,如: 事件觸發/自觸發策略[10-11]、自適應觸發控制[12]、魯棒自適應控制[13]、一致性PI 分布式控制[14]、一致性自適應控制[15]等.然而,在這些已有的研究成果中,僅僅考慮了異質多智能體系統是線性的情況,使得控制器僅適用于線性多智能體系統.針對這一缺點,廣大學者們開始關注異質非線性多智能體系統的一致性控制器設計研究,并提出多種控制器設計方案[16-19].

模糊邏輯系統和神經網絡系統作為常用的萬能逼近器,在解決各種未建模動態系統和未知非線性函數中起著舉足輕重的作用,且已經被廣泛應用在各種控制器設計過程中[20-25].文獻[26-32]成果中的設計方法僅對某些特殊結構(如: 維數相同或嚴格反饋形式)的異質多智能體系統有效.

對于帶有不同維數的異質多智能體系統的輸出一致性控制問題,已經有學者們給出一些系統輸出一致性的控制器設計方法[33-35].文獻[36]針對一類非仿射非線性多智能體系統的輸出一致性,采用Nussbaum 增益函數動態面控制方法,提出一種輸出與給定信號實現一致性的神經網絡控制方法.但是這些方法僅適用于多智能體的輸出一致性,而對于多智能體系統的狀態一致性就顯得無能為力.由此分析可知,如何設計出新穎的一致性控制器設計方法,使得控制器的設計不僅適用于具有相同維數的異質多智能體系統,而且也適應于帶有不同維數的異質多智能體系統,使得異質多智能體系統具有更寬廣的工程應用范圍是一個值得研究的問題.

本文試圖設計出具不同維數(相同維數視為特殊情況)的異質非線性多智能體系統的一致控制器設計方法.受文獻[37-43]中大系統和復雜動態系統提出的各子系統之間相似特征的啟發,將相似性概念與性質引入到維數不同的異質多智能體系統中.如果從多智能體系統之間的連接關系結構的角度來看,每個智能體被視為網絡拓撲圖中的一個節點,其中,每個節點的空間維數相同或不同.通過介紹各異質智能體之間的相似特征,研究基于不同維數且具有相似特性的多智能體系統的一致性自適應神經網絡控制器設計方法.

本文與已有成果中的異質多智能體系統的一致性控制器設計方法相比,所提出的控制器設計方案主要有以下優點:

1)提出每個智能體之間的相似性概念和性質,并且給出一種通過具有相同或不同維數的異質多智能體的性質來獲得相似的參量方法.

2)針對異質多智能體系統的一致性控制問題,設計了具有相似參量的分布式狀態反饋自適應神經網絡控制,該控制器不僅適用于帶有相同維數的異質非線性多智能體系統,也適用于帶有不同維數的異質非線性多智能體系統.

1 預備知識和系統描述

考慮帶有N 個子系統的多智能體系統,其中,第i 個智能體可以描述為如下形式:

定義1: 第i 個智能體系統的維數和第j 個智能體的維數不同時(即),多智能體系統(1)稱為異維異質多智能體系統.

注1:由異質多智能體系統(1)可知,每個智能體的維數是不同的(當ni和mi分別取相同值時,系統(1)等價于相同維數的異質多智能體系統,該情況視為異質多智能體系統的特殊情況.文獻[5-9,20-32] 中的系統均屬于本文中各智能體維數相同的特殊情況).因此,本文研究的異維異質多智能體系統相比其他文獻中的異質多智能體系統具有更廣泛的應用.

假設1: 在異維異質非線性多智能體(1)中,如果存在矩陣和已知矩陣滿足以下條件,稱第i 個智能體和第j 個智能體系統是相似的.

假設3: 在有限緊集論域Ω 上,未知非線性函數gi(xi)可以通過徑向基神經網絡的萬能逼近性質對其進行逼近,即滿足以下逼近性質:

在實際應用中,權重Wi的值一般很難獲得,因此,其估計值被用作控制器設計中,記估計誤差為.

2 帶有相似參數的分布式反饋自適應RBFNN控制器設計

根據異維異質非線性多智能體(1)之間存在的相似性假設條件,首先定義各智能體之間的一致誤差為,并令表示多智能體系統的一致跟蹤誤差,其為如下形式:

帶有相似參量的分布式反饋自適應神經網絡控制器設計為:

控制器ui1為魯棒控制部分,其作用是消除多智能體系統(1)中的外部干擾,設計形式為:

智能體之間的耦合權重ci的自適應律設計為:

定理1: 考慮異維異質非線性多智能體系統(1),如果各智能體之間滿足假設1 中的相似條件,則系統在控制器(6~9)的作用下,多智能體系統(1)的一致性誤差可以實現一致有界條件(11),且閉環系統中的所有信號是有界的.

由閉環系統(12)可知,各智能體之間的一致性跟蹤誤差滿足如下形式:

選取如下Lyapunov 函數:

函數(15)沿系統(14)的時間導數為:

由控制器(6)中的設計形式,有下式成立:

由于以下不等式成立:

根據不等式(20)和式(21),不等式(19)等價于:

在不等式(23)兩邊同時對時間進行積分,得

因此,下列不等式成立

由Schur 補引理可知,矩陣不等式(27)可以轉變成式(9)的形式.

3 仿真算例

本章給出兩種類型的異質多智能體系統的一致跟蹤控制器仿真來說明本文所設計方法的有效性.

例1.帶有相同維數的同質非線性多智能體系統,即,多智能體系統(1)所描述的每一個智能體都帶有相同的維數,且各智能體的動態特性完全相同.

考慮如圖1 所示具有5 個智能體的網絡拓撲結構圖.

圖1 5 個智能體的網絡結構拓撲圖Fig.1 Topological graph of network structure of five agents

由圖1 可知,網絡圖的Laplace 矩陣為:

在本例子中,智能體的動力學方程參考文獻[5]中的形式如下:

自適應定律(7~8)中的參數選取為:

在本文所設計的自適應神經網絡控制器(6~9)的作用下,多智能體系統(28)的所有狀態實現一致性時間響應情況如圖2 中(c)和(d)所示.如果采用文獻[5]中的控制器設計方法,則系統狀態的一致性時間響應如圖(a)和(b)所示.從圖2 中本文控制器和文獻[5]中的控制器仿真結果比較,帶有同維同質非線性多智能體在本文設計的控制器作用下,可以快速地實現所有智能體系統的狀態一致性.并且由圖2(a-b)可以看出,在已有文獻[5]提供的控制器作用下,狀態的一致性具有超調和時間反應慢的缺點.由此比較可知,本文設計的控制器方法具有時間響應快和低超調的優點.

圖2 智能體(28)中狀態xi(t)的一致性時間響應Fig.2 Consistence time response of state xi(t)in agent(28)

圖3 估計值參數范數的時間響應Fig.3 Time response of norm of estimated value parameter

圖4 耦合參數ci 的時間響應Fig.4 Time response of coupling parameter

例2.考慮帶有6 個智能體的網絡拓撲結構如圖5 所示.

圖5 6 個智能體系統的網絡拓撲結構圖Fig.5 Topological graph of network structure of six agent systems

由圖5 可知,其Laplace 矩陣為:

不同于其他具有相同維數的非線性異質多智能體系統的一致性,本例子考慮實際工程應用中,二自由度與三自由度的機械臂動態系統的所有狀態跟蹤另一子系統的狀態軌跡,其各運動方程表示為如下形式:

二自由度機械臂系統中的參數如表1 所示.

表1 第1、第2 和第3 個機械臂系統中的參數Table 1 The parameters in the first,second and third robot arm systems

其中,各項表達式有如下:

三自由度機械臂系統中的參數選取如表2 所示.

表2 第2 和第4 個機械臂系統中的參數Table 2 The parameters in the second and fourth robot arm systems

系統的狀態初始值選取為:

在設計的控制器(6~7)和自適應律(8~9)的作用下,其仿真結果如圖6~圖9 所示.

圖6 智能體(30)中位置狀態的一致性時間響應Fig.6 Consistence time response of position state in agent(30)

盡管各個異質非線性智能體的狀態維數不同,但在本文設計的控制器作用下,由圖6 可知,第2個和第4 個智能體系統的所有位置狀態,仍然可以實現一致跟蹤第1 個智能體系統的位置,且第1 個智能體和第4 個智能體的兩個位置狀態也可實現與第1 個系統的狀態一致.同理,圖7 中各智能體的速度也可以與第1 個系統的速度實現一致性.從圖8 可以看出,神經網絡中權重估計值范數是有界的.圖9 表明各智能體之間的耦合強度也是滿足有界性.

圖7 智能體(30)中速度狀態的一致性時間響應Fig.7 Consistence time response of speed state in agent(30)

圖8 估計值參數 范數的時間響應Fig.8 Time response of norm of estimated value parameter

圖9 耦合參數ci 的時間響應Fig.9 Time response of coupling parameter ci

4 結論

針對帶有不同維數的異質非線性多智能體系統的一致跟蹤控制器設計問題,給出一種帶有相似參量的分布式狀態反饋自適應神經網絡控制器設計方法.該方法充分利用各智能體之間的相似信息,通過相似參量和求解線性矩陣不等式設計控制增益矩陣,結合自適應神經網絡控制器設計方法,使得不同維數的異質非線性智能體的所有狀態實現一致性.通過仿真算例可知,本文方法不但可以應用于相同維數的異質非線性多智能體系統,也可適用于不同維數的異質非線性多智能體的一致性.

猜你喜歡
異質維數一致性
β-變換中一致丟番圖逼近問題的維數理論
關注減污降碳協同的一致性和整體性
注重教、學、評一致性 提高一輪復習效率
IOl-master 700和Pentacam測量Kappa角一致性分析
一類齊次Moran集的上盒維數
關于齊次Moran集的packing維數結果
涉及相變問題Julia集的Hausdorff維數
隨機與異質網絡共存的SIS傳染病模型的定性分析
基于事件觸發的多智能體輸入飽和一致性控制
Ag2CO3/Ag2O異質p-n結光催化劑的制備及其可見光光催化性能
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合