?

多無人機輔助NOMA網絡的聯合無線資源分配算法

2024-03-05 07:42邵鴻翔孫有銘冀保峰劉云卿
無線電工程 2024年3期
關鍵詞:最大化基站輔助

邵鴻翔,孫有銘,冀保峰,韓 哲,,劉云卿

(1.洛陽理工學院 計算機與信息工程學院,河南 洛陽 471023;2.中國人民解放軍 61062部隊,北京 100089;3.河南科技大學 信息工程學院,河南 洛陽 471023)

0 引言

5G和B5G(Beyond-5G)網絡中,在數據高速率和低時延應用需求急劇增長的推動下,功率域非正交多址(Non-Orthogonal Multiple Access, NOMA)成為一種很有前途的多址技術[1-2]。NOMA可支持多個用戶在同一正交資源內同時傳輸,接收端采用逐次干擾消除(Successive Interference Cancellation, SIC)技術對接收到的信號進行解碼。與傳統的正交多址(Orthogonal Multiple Access, OMA)技術相比,NOMA能有效提高頻譜效率和能量效率,允許更多用戶連接到所需的網絡。

近年來,無人機(Unmanned Aerial Vehicle, UAV)因其具備高機動性、易于部署和高概率視距傳播引發的高速率等特點備受關注。UAV輔助移動通信系統的研究可有效應對地面基站過載、突發災害和緊急事件的通信增強和恢復[3]。UAV通信網絡將是未來6G空天地一體化網絡融合的關鍵組成部分,在戰場偵查、野外救援和物聯網信息傳輸等民用和軍用領域發揮重要作用[4]。將NOMA引入UAV輔助移動通信系統,可實現終端接入數量的增加、用戶服務質量(Quality of Service, QoS)的提升和無線通信中頻譜短缺問題的緩解。

目前,對功率域NOMA的用戶配對和功率分配方案的研究已取得了許多成果。文獻[5]根據下行NOMA網絡中用戶的目標速率要求,提出了一種分布式強/弱用戶配對和功率分配算法。文獻[6]考慮了最小速率約束,提出了一種實現下行NOMA網絡中和速率最大化的封閉式最優用戶配對解決方案。文獻[7]提出了一種基于NOMA網絡的分布式群組切換用戶配對方案,在考慮需求多樣性的情況下,最大限度地提高用戶體驗質量。以上研究只考慮單一基站場景,未考慮多UAV場景和其機動性對NOMA網絡中的資源分配帶來的挑戰。近年來,面向NOMA的UAV輔助通信網絡系統級資源分配優化研究受到廣泛關注[8-15],如能量和頻譜效率[9,11],UAV軌跡[10,14],位置和功率聯合優化[12-13],分組和功率聯合優化[15]。文獻[8]研究了利用周期性NOMA和UAV軌跡聯合優化多用戶通信調度,使地面用戶最小吞吐量最大化。文獻[9]考慮用戶的多重QoS,從能效角度研究了UAV基站最優高度的NOMA方案。文獻[10]研究了基于NOMA通信和能量收集的UAV輔助合作認知無線網絡的最大吞吐問題。文獻[11]研究了在UAV位置和功率約束下的輔助全雙工非正交多址(FD-NOMA)系統的能量效率最大化問題。文獻[14]研究了NOMA/OMA混合模式下的軌跡優化問題,實現UAV輔助通信系統中上行/下行鏈路平均數據速率最大化。文獻[15]提出了基于圖論最大割定理和輔助變量法的用戶分組功率分配聯合優化方法,實現了UAV-NOMA系統和速率的提高。然而,上述研究大多集中在單一UAV場景,僅關注單個UAV的能效和少量UAV間干擾,缺乏多UAV輔助通信NOMA網絡的多維聯合資源分配方法研究。本文的主要貢獻如下:

① 研究多UAV空中輔助基站(Flying Base Stations, FBSs)和多地面站(Ground Base Station, GBS)混合組網復雜場景下的坐標位置,NOMA功率分配和用戶配對多維聯合優化問題,給出了一種從系統角度獲得用戶QoS提升的思路。

② 不同于文獻[6,16]用戶數等于信道數2倍的設定,在給定FBSs位置的多小區場景下,推導出最優的NOMA功率分配閉式解和通用NOMA用戶配對方案。

③ 為最大化網絡效用,將UAV的位置優化問題描述為一個局部利他博弈,證明它是至少包含一個純策略納什均衡(Pure Strategy Nash Equilibrium,PNE)的精確勢能博弈,并設計了一種分布式學習算法以較低的復雜度找到PNE最優解。

1 模型和問題描述

圖1 UAV輔助NOMA空地網絡系統模型Fig.1 System model of UAV assisted NOMA air-ground network

1.1 干擾圖模型

類似文獻[17],利用非對稱干擾圖來捕捉各類型基站間同信道的復雜干擾關系。具體來說,應用廣泛使用的干擾度量(Interference Metric, IM)來計算任意2個基站i和j的歸一化干擾水平:

(1)

根據干擾關系,定義下面2種集合:

值得注意,不同的干擾圖標準和基站間干擾關系的定義方法并不影響后續的數學推導、博弈模型的建立以及最后的結論。

1.2 問題描述

(2)

(3)

Ri(Li,PIi,αi),其中ci表示經濟系數,可根據用戶優先級、終端類型等設置,來刻畫不同基站的權重關系;Ri表示基站i服務的所有用戶速率和,Li、PIi、αi分別表示該基站的位置策略、用戶配對策略和功率分配策略。為實現網絡效用的最大化,考慮NOMA用戶配對、功率分配和UAV位置聯合優化問題,該問題可表示為:

(4)

2 聯合解決方案

為解決UAV輔助的多小區NOMA網絡資源分配問題,提出一種復雜度相對較低的近乎最優的3步資源分配方案。首先,分析單基站場景下NOMA功率分配策略。然后,推導通用最優NOMA用戶配對方案。最后,給出基于博弈的位置策略選擇方法。

2.1 最優NOMA功率分配和配對策略

假設所有基站都選定其位置策略,并對一個相對簡單的單基站系統來分析其最優功率分配和用戶配對策略。

(5)

證明:根據式(2)和式(3),對NOMA模式接入同信道2用戶的和速率求導得:

(6)

(7)

式(2)、式(3)、式(4)C2和式(7)聯合可得到αn的取值為:

(8)

(9)

(10)

(11)

(12)

(13)

2.2 UAV基站位置優化

為了利用基站間相互作用和影響,采用局部合作博弈。不失一般性,每個基站作為一個博弈參與者是自私理性,目標都是盡可能最大化自己效用函數。運用博弈論,設計了一個具有局部合作的分布式位置優化方案。在形式上,對動態位置部署博弈建模為G=[BS,{Ai}i∈BS,GIM,{ui}i∈BS],其中BS={1,2,…,M}代表M個博弈參與者,Ai=Li表示博弈參與者基站i的策略集合,及UAV可選懸浮位置,ai∈Ai表示基站i的選擇位置,a-i表示除參與人基站i以外的其他基站的位置選擇策略;GIM表示網絡各類基站間耦合關系的干擾圖,ui表示基站i的效用函數。

類似文獻[17],為獲得全局最優UAV位置策略,定義博弈參與者i的效用函數為:

(14)

(15)

定理4:動態位置部署博弈G是一個精確潛博弈,至少存在一個純策略NE點。

證明:首先,構造潛函數為:

(16)

根據干擾圖的鄰居關系,可以得到:

(17)

(18)

(19)

另一方面,基站i的效用函數值隨其單邊位置策略的改變可以表示為:

(20)

任意博弈者基站的效用函數由于其單方面改變策略發生的變化與構造的潛函數變化相同。因此,根據文獻[18]對于潛博弈性質的定義,本節所提的位置部署博弈G是一個潛函數為φ的精確潛博弈。由于精確潛博弈有至少一個PNE點。所以,所提博弈G至少有一個純策略納什解,定理4證畢。

本文目的是最大化全網累加和速率最大。雖然從定理4知道,所提博弈至少存在一個PNE點,但是并不知道是否博弈能達到最優NE點。

定理5:全網累加和速率的全局最優解是所提博弈G的一個PNE。

根據定理5,如果能設計一個有效算法可以找到最優NE解,那將會得到式(4)所建立問題的全局最優解。

3 分布式學習算法

(21)

式中:a-i為BSi鄰居的策略選擇,b>0為學習參數,反映玩家的理性水平。根據文獻[19],如果學習參數b足夠大,CDSSA能夠以任意高的概率使歸一化網絡容量最大化,具體執行如算法1所示。假設博弈有n個玩家,每個玩家有m種策略可選,所提CDSSA和BR算法每輪迭代的計算復雜度分別為O(nm3)和O(nm2)[20]。

算法1 CDSSA 初始化:收集定義網絡范圍內各類基站的位置信息、預發射功率,信道增益,根據式(1)及對應2.1節方法,構建有向干擾圖模型。設置t=0,每個基站的位置策略等概率分布,及?aii(t=0)=1/Ai,?i∈BS,ai∈Ai。學習算法執行過程,循環for t=1,2,…,kmax①所有基站根據其當前的策略概率分布?aii(t-1)選擇位置策略ai(t),并與他們的“耦合”鄰居基站交換信息。②第t次迭代,在干擾圖中隨機選擇多個共存的FBS(無干擾影響的UAV可同時更新各自策略,加速算法收斂)。對于任意2個選擇的FBSs i和j,它們的鄰居集合εi∩εj=?。根據式(14)和式(21)更新行動概率分布ΓAi(t)。然后,被選中的FBS根據ΓAi(t)隨機選擇一個動作。其他FBS的行動保持不變ai(t)=ai(t-1)。③每個FBS i感知其接入用戶的信道增益,并根據式(5)和式(11)采用最優功率分配策略αoptn和用戶配對PI?(m,n)i。④如果達到了預定義的最大迭代步數kmax,則停止;否則執行步驟①。迭代結束 end for輸出:博弈參與各基站的均衡位置策略和用戶配對策略L?i,PI?i,α?i,i∈BS。最后,計算所定義的全網效用U=∑Mi=1ciRi(L?i,PI?i,α?i)。

4 仿真分析

圖2 5×5網格網絡拓撲示意Fig.2 5×5 grid network topology

圖3分別從單次結果和100次蒙特卡洛實驗結果反映了所提方案的收斂性和最終可達速率。與BR算法中總是貪婪選擇效用最大的更新策略不同,所提算法的位置策略更新是基于各策略效用/總和的概率向量形式,效用越大只是在下一次被選中的概率越大,而非一定會被選擇,從而避免陷入局部最優。由于本文設定用戶數Ui>2K,定理3所提最有配對效果優于定理2的首尾配對和隨機配對。

圖3 所提方案的收斂性比較(用戶數Ui=18)Fig.3 Convergence comparison of the proposed scheme and other algorithms(Ui=18)

從圖3可看出,所提方案能夠快速在40次迭代以內收斂到穩定點,并且所達網絡效用優于其他方案。從平均網絡效用的性能度量可以看出,所提方案與首尾配對方案和隨機方案相比,性能分別提高了約14.67%和30.09%。

圖4對比了不同用戶數下各方案的性能??煽闯鲈谟脩魯荡笥?2,及用戶數大于2K時,所提最優配對方法更具優勢。

圖4 不同活躍用戶時網絡效用性能比較(K=6)Fig.4 Network utility comparison of the proposed scheme and other algorithms under different number of active users(K=6)

圖5 不同信道狀態誤差下網絡效用性能比較Fig.5 Network utility comparison of the proposed scheme and other algorithms under different channel errors

5 結束語

本文提出了一種最大化多UAV輔助下行NOMA網絡總速率的UAV位置、用戶配對和功率分配聯合優化算法。在基站位置固定的多蜂窩場景下推導出最優用戶調度配對和功率分配策略閉式解。在多基站網絡情況下,將UAV的位置優化問題描述為一個局部利他的勢能博弈,并證明該博弈模型至少包含一種PNE。為快速獲得最優PNE,設計了一種分布式學習算法,最大化所定義的網絡速率。仿真結果表明,該算法優于現有方案,顯著提高了網絡效用,并探討了信道信息誤差對性能的影響。后續研究可進一步考慮用戶體驗質量、各類型基站服務代價和其他非完美信息建模等條件下的UAV輔助通信資源優化。

猜你喜歡
最大化基站輔助
小議靈活構造輔助函數
倒開水輔助裝置
勉縣:力求黨建“引領力”的最大化
Advantages and Disadvantages of Studying Abroad
劉佳炎:回國創業讓人生價值最大化
可惡的“偽基站”
減壓輔助法制備PPDO
基于GSM基站ID的高速公路路徑識別系統
提高車輛響應的轉向輔助控制系統
戴夫:我更愿意把公益性做到最大化
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合