?

機器學習輔助太赫茲渦旋波超表面快速設計方法

2024-02-21 11:14司黎明鄧嘉軒
無線電通信技術 2024年1期
關鍵詞:渦旋模數波束

司黎明,鄧嘉軒,呂 昕

(北京理工大學 集成電路與電子學院/毫米波與太赫茲技術北京市重點實驗室,北京100081)

0 引言

太赫茲波是指頻率在0.1~ 10 THz的電磁波,由于其廣闊的頻譜帶寬有望運用到6G通信技術,來解決當前通信頻帶頻譜資源匱乏的困境,而備受科學家的青睞[1-2]。渦旋電磁波是指攜帶有軌道角動量(Orbital Angular Momentum,OAM)的電磁波,可以理解為在平面波的基礎上增加了相位因子eilφ[3]。有別于傳統電磁波的幅度、頻率、相位、極化方式等參數,在當今頻譜資源匱乏的時代,渦旋電磁波給出了新的自由度,為提高未來6G通信系統容量以及通信安全提供了可能[4-7]?,F階段產生渦旋電磁波的方式主要有天線陣列、渦旋相位板以及超表面等[8-10]。其中,超表面是由亞波長人工電磁結構 二維周期排布形成的材料,相較于前兩個器件具有設計簡單、剖面低、成本低的優勢,因而成為當前產生渦旋波的主流選擇[11-13]。

傳統的超表面設計方法主要是依靠設計人員通過仿真軟件進行參數掃描來獲得符合預期的超單元。然而,渦旋波超表面由于相位因子的加入,陣面上每個單元的相位需求都不盡相同,導致超表面結構復雜,需要耗費大量的時間對每個點位的超表面單元進行掃參。如何快速準確地得到滿足相位和幅度條件的單元是構筑渦旋波超表面的研究熱點。近年來,以機器學習為代表的人工智能技術異軍突起,給學術界、工業界乃至人們日常生活都提供了極大的便利,為解決學術以及生產生活中的實際問題提供了新的方向[14-16],目前已有學者將機器學習運用到輔助超表面設計中。利用機器學習輔助超表面設計只需大量可靠的數據集并構建合理的神經網絡,即可得到符合預期的超單元結構參數,大大縮減了時間和精力的損耗,也降低了超表面的設計難度[17-19]。

本文提出了一種利用機器學習輔助快速設計太赫茲渦旋波超表面的方法,其特點在于同時運用神經網絡和優化算法,快速精準地得到滿足預期的超單元。利用得到的超單元組成的超表面能夠在 220 GHz產生多模數的渦旋波。220 GHz是大氣傳輸窗口,在該頻段下太赫茲波傳輸損耗小,常常用于點對點通信,因而具有極高的研究意義?;谔岢龅某瑔卧?設計了基于長短期記憶(Long Short-Term Memory,LSTM)神經網絡和遺傳算法的逆向單元設計模型,并由此得到工作頻率在220 GHz,模數分別為1、2、3的渦旋波超表面。

1 機器學習輔助超表面快速設計方法

1.1 超表面結構

本文設計的屬于反射型超表面,超單元結構及參數如圖1所示。該單元由三層結構組成,單元長度a=500 μm,中間的介質基板的材質為TOPAS(環烯烴共聚物,相對介電常數為2.34,損耗角正切為 0.000 07),厚度為h=70 μm。該材料在太赫茲頻段具有較高的穩定性,且吸收損耗較小,常常被用作加工設計太赫茲材料[20]?;宓撞繛榻?電導率為 4.561×107S/m),金的穩定性和電導率保證超表面在高頻段能夠保持良好的反射性能?;迳戏綖殚_口環形狀的諧振腔結構,其材料為金。主要結構參數包括:a為超單元晶格長度,b為開口環形諧振腔寬度,g為開口環形諧振腔末端間距,d為開口環形諧振腔長度,w為開口環形諧振腔金屬條寬度,h為介質基板厚度。通過調節尺寸參數b、g、d、w可以改變單元的諧振頻率,從而改變反射波束的相位。

圖1 超表面及其單元結構示意Fig.1 Schematic diagram of metasurface and meta-atom structure

為了得到大量可靠的數據集,需要對輸入的尺寸參數在合理的范圍內進行采樣,從而得到大量的樣本。利用Python-CST聯合仿真在合理范圍內改變b、g、d、w四個參數,得到3 200組尺寸參數對應的單元樣本。將這些結構參數代入電磁仿真軟件CST中進行全波仿真,導出對應單元的S11參數。由于單元背面為金層,反射幅度變化小,可以忽略不計,只需考慮相位部分。將S11參數進行如下的數學變換,得到對應的反射相位:

(1)

式中:Phase為單元反射相位,Re(S11)為S11的實部,Im(S11)為S11的虛部。由式(1)得到的相位在 -180°~180°,得到的反射相位還需要進行歸一化數學處理,使其處于-1~1,以避免神經網絡在計算中產生的數值問題,便于網絡的收斂以及后續的預測。

1.2 LSTM神經網絡輔助快速設計超表面模型

機器學習輔助超表面快速設計需要精確地預測單元相位。只有當單元頻譜的預測精度足夠高時,設計的單元才能較好地滿足目標相位需求?;谏窠浘W絡的頻譜預測模型是指將訓練集中的單元結構參數與對應的反射相位作為訓練數據,對神經網絡進行訓練。訓練完畢后,輸入合理的單元尺寸參數能夠輸出對應的反射相位,其模型示意如圖2所示。

本文選取的神經網絡為LSTM。LSTM屬于循環神經網絡(Rerrent Neural Network,RNN)的一個分支,擁有三種重要的門[21],即輸入門(Input Gate)、遺忘門(Forget Gate)和輸出門(Output Gate)。其中,遺忘門是最重要的門,它是用來對輸入數據進行選擇性“遺忘”,在存儲重要有用信息的同時刪除無用的信息,從而達到高效記憶的目的。LSTM由于高效的記憶能力,常常被用在時間序列預測、股票預測、自然語言處理等方面,與正向頻譜預測有著極大的相關性,這也是選取該網絡的靈感及由來。

LSTM是重復的模塊(Block)的鏈式結構,也稱為LSTM的神經元(Cell)。圖3展示了LSTM神經網絡的典型單元結構。綠色的Xt代表輸入信息,藍色的ht代表LSTM層的輸出信息,t表示時序。黃色方框代表神經網絡層,粉色圓圈代表逐點運算, LSTM可以通過控制各種門的狀態來實現對神經元增添信息。

圖3 LSTM神經網絡典型單元結構Fig.3 Typical unit structure of LSTM neural network

本文選取的神經網絡由輸入層、四個LSTM層、一個全連接層和輸出層構成,具體神經網絡結構如圖4所示。由于LSTM神經網絡的結構中有時間序列的加入,故輸入輸出的維度需要增加序列長度。圖4中輸入輸出維度的順序為batch大小、序列長度、特征參數個數。在設置網絡參數時,將初始學習率設為0.001,訓練輪次epoch設為200,即訓練的迭代次數為200。每訓練完一次epoch,學習率減少0.000 000 45,即最后一次訓練時學習率為 0.000 1。這樣設置的目的是為了讓網絡訓練趨于穩定時,防止過大的學習率破壞網絡的穩定性。優化器選擇自適應優化器(Adam),將數據集中的3 200份數據按照8∶2隨機劃分為訓練集與測試集。損失函數選用最小均方誤差(Mean Square Error, MSE )來表征預測結果與實際標簽的距離。

圖4 LSTM神經網絡結構Fig.4 Structure of LSTM neural network

圖5為機器學習輔助超表面快速設計方法示意,輸入目標單元相位,遺傳算法在尺寸空間內隨機生成一組尺寸參數,調用神經網絡實時預測對應單元相位,評估預測相位與目標相位的差距,迭代更新尺寸參數后再調用神經網絡進行預測,如此反復,最終輸出符合目標相位的尺寸參數。

圖5 機器學習輔助超表面快速設計方法示意Fig.5 Schematic diagram of machine learning-assisted metasurface rapid design method

2 結果分析

將本文的LSTM神經網絡與傳統的多層感知機 (Multi-Layer Perceptron,MLP)神經網絡進行對比,在網絡結構與參數相同的情況下,比較二者對于相同超單元頻譜預測效果。圖6為選取的兩個超單元LSTM和MLP預測相位與實際仿真相位曲線對比。

(a) MLP預測單元1

(d) LSTM預測單元2

從圖6可以看出,LSTM對于單元相位的預測效果是要優于MLP的,對于相位跨度較大的單元,對比效果更加明顯。這是由于LSTM加入了對時間序列的考慮,對單個預測頻點相位進行預測時會受之前頻點相位的影響。為了進一步探究兩個神經網絡預測效果不同的原因,給出了兩個神經網絡訓練200 epoch的MSE損失值和單元預測準確率的曲線,如圖7所示。

(a) 訓練損失值曲線

(b) 預測準確率曲線

從圖7可以看出,LSTM的初始損失值高于MLP且初始預測準確率更低,這是由于LSTM神經網絡訓練初期對單元預測效果差,再加上時間序列的前后影響,導致網絡對整個序列的預測誤差大,損失值高,預測準確率低。而MLP為簡單的全連接網絡,對相位的預測是基于各個頻點單獨預測,前后之間不產生影響,對整個序列的預測誤差更小。但LSTM僅訓練了20 epoch后損失值便從3.65下降到接近0,而MLP則訓練了120 epoch才從1.8下降并收斂到0附近。這是由于隨著訓練輪次的增加,準確率逐漸升高,LSTM網絡序列內部的前后影響帶來的“正反饋”進一步提升預測準確率。而MLP只能通過訓練一步步提升對單個頻點相位的預測準確率。這反映了LSTM在序列預測方面相較于MLP具有收斂快、預測準確率高的優勢。

為了驗證機器學習在輔助快速設計太赫茲渦旋波超表面的性能,分別設計了工作頻率在220 GHz,模數分別為1、2、3的渦旋波超表面,利用仿真軟件CST對其進行全波仿真,并遠近場分析。

渦旋電磁波是指攜帶有OMA,波前呈現螺旋式分布的電磁波[22]。軌道角動量與電磁波的位置相關,表現為電磁波的波前相位分布。簡而言之,渦旋電磁波就是在平面波的基礎上加上一個相位因子,可以簡單表達為:

V(r,φ)=A(r)·eilφ,

(2)

式中:A(r)為平面波的幅度,r表示空間點到波束中心軸的徑向距離,φ為方位角,l為OAM 的模數,即相位從0°~360°的變化次數。在自由空間的傳播過程中,相位會隨著方位角的變化而變化,電磁波的等相位面呈現螺旋階梯狀。在理論上,渦旋電磁波攜帶的OAM的模數l可以取任意值,不同模數之間可以相互線性表示而且互相正交。當平面波垂直入射到超表面時,要產生模數為l的渦旋波束,超表面上的相位分布可以表示為:

(3)

式中:φ(x,y)表示超表面單元中心點坐標為(x,y)時的相位,l為OAM的模數。由式(3)可以看出,渦旋波超表面每個位置上的相位需求不盡相同,這造成了超表面結構的復雜,依靠傳統的仿真掃參得到符合相位需求的單元需要耗費大量時間。而本文的逆向單元設計模型只要訓練完畢,依靠Python-CST聯合仿真,能夠快速得到滿足相位分布的渦旋波超表面。平面波垂直入射到超表面上反射得到的渦旋波三維遠場圖如圖8所示,圖中所有波束都呈現中空環形的“甜甜圈”樣式,且圖8(a)~(c)中的相位分別呈2π、4π、6π的螺旋分布證明了其分別為模數l為 1、2、3的渦旋波束。

圖8 頻率為220 GHz不同模數渦旋波束遠場強度和相位分布Fig.8 Far-field intensity and far-field phase of vortex beam with different modes at a frequency of 220 GHz

超表面上產生的渦旋波為多個OAM模數疊加產生的,為了進一步驗證渦旋波束的質量,還需要對其進行模式純度分析。模式純度可以定義為主模數功率占所有模數功率的比值,即:

(4)

式中:El表示模式為l的電場強度,En表示模數為n的電場強度。模式純度越高證明該模數渦旋波占所有渦旋波的比重越高,渦旋波束質量越好。頻率為220 GHz時三個超表面生成的渦旋波束在模數分別為1、2、3的模式純度如圖9所示,可以看出,渦旋波束在l=1、2、3的模式純度分別為91%、82%、80%,模式純度較高,波束質量較好。

(a) l=1

(b) l=2

(c) l=3

3 結束語

本文利用機器學習的方法輔助快速設計太赫茲渦旋波超表面。提出了基于LSTM神經網絡和遺傳算法的超單元逆向設計模型,該模型對于超單元的頻譜預測準確率高達95%,并能快速準確得到滿足相位需求的超單元。利用該模型構筑了三塊工作頻率為220 GHz,模數分別為1、2、3的渦旋波超表面,遠場仿真效果良好且模式純度高于80%。該方法能夠解決傳統渦旋波束超表面設計時,由于超表面結構復雜而耗費大量掃參時間和精力的問題,對于未來產生6G太赫茲渦旋波、提高通信安全具有啟發意義。

猜你喜歡
渦旋模數波束
基于PM算法的渦旋電磁波引信超分辨測向方法
基于單片機和模數化設計的低壓側電壓監視與保護裝置
模數化設計方法在景觀鋪裝設計中的應用
毫米波大規模陣列天線波束掃描研究*
光渦旋方程解的存在性研究
圓陣多波束測角探究
基于LID模式的城區排澇模數探析
Helix陣匹配場三維波束形成
一種新型的RSA密碼體制模數分解算法
變截面復雜渦旋型線的加工幾何與力學仿真
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合