?

光子脈沖神經網絡研究歷程與展望

2023-02-10 01:19彭楚宇
光通信研究 2023年1期
關鍵詞:諧振器激光器光子

柯 特,朱 盈,彭楚宇,胡 曉,肖 希

(中國信息通信科技集團有限公司 光纖通信技術和網絡國家重點實驗室,武漢 430074)

0 引 言

人工神經網絡(Artificial Neural Networks,ANN)是一種運算模型,用以對生物神經系統結構和功能進行抽象和模擬,在信息處理和模式識別等領域發揮著重要作用[1]?,F代神經科學的實驗表明,許多生物神經系統都采用神經元發放脈沖的時間來編碼信息[2-3],脈沖信號在神經系統中的運動是大腦進行思維的基礎[4]。因此,根據現代神經科學的最新研究成果,更具生物可解釋性的第3代ANN——脈沖神經網絡(Spiking Neural Networks,SNN)應運而生。SNN具有計算量小、對噪聲魯棒性強的優勢,其應用已涉及信息處理的各個領域并取得了較大進展。SNN適合于硬件實現,近十年來隨著光學器件技術和工藝的進步,結合光學優勢克服電學瓶頸的光子SNN正逐步取得發展。

本文介紹了脈沖神經元的建模機制,SNN的學習機制和軟硬件實現,重點介紹了光子SNN基于不同光學器件的實現方案,進而對光子SNN的發展進行總結與展望。

1 SNN

生物神經元具有對內外刺激做出響應的能力,而脈沖神經元模仿生物神經元的工作模式,圖1 所示為脈沖神經元模型。圖1(a)展示了一個生物神經元通過大量的樹突接收其他神經元的軸突發放的各不相同的動作電位,即脈沖序列,并對它們進行整合從而使得軸突發放一定時間間隔的輸出脈沖序列,該輸出脈沖序列又成為與之連接的下一個神經元的輸入脈沖序列。真實的生物神經元形態和動力學特征十分復雜,對其進行高維建模則很難進行數學分析,不利于大規模SNN的組網和研究,因此,研究者對脈沖神經元建立了狀態變量微分方程模型并對其進行簡化從而提出多種影響較大的脈沖神經元模型[5-16],圖1(b)所示的泄露積分發放(Leaky Intergrate-and-Fire,LIF)神經元模型是目前普遍公認的在生物真實性和實現簡化性方面取得最佳平衡效果的神經元模型[17],長期以來在包括光子SNN的神經計算領域得到了廣泛的應用。

脈沖神經元的連接構成了SNN,在SNN的學習機制方面,通常認為具有兩種學習機制:即在無標簽數據的情況下進行無監督訓練和在標簽數據的情況下進行監督訓練。在無監督學習中,脈沖時序依賴可塑性(Spike-Timing-Dependent Plasticity,STDP)算法與生物學習機制密切相關[18-20],是一種基于突觸前脈沖和突觸后脈沖的時序來調整神經元之間連接強度的機制[21-24],圖1(c)所示當突觸前脈沖先于突觸后脈沖發放(tpretpost)神經元連接強度減弱,神經元連接強度變化(Δw)的絕對值與脈沖發放時間差(Δt)成反比。在監督學習中,目前比較著名的監督學習算法有SpikeProp[25]、Tempotron[26]、ReSuMe[27]、突觸權重關聯訓練(Synaptic Weight Association Training,SWAT)[28]、Chronotron[29]、脈沖模式關聯神經元(Spike Pattern Association Neuron,SPAN)[30]和精確脈沖驅動(Precise Spike Driven, PSD)[31]算法,這些監督學習算法主要基于梯度下降、STDP機制或脈沖序列卷積[32]。

圖1 脈沖神經元模型

在基于軟件實現SNN方面,北京大學信息科學技術學院數字媒體所媒體學習組和鵬城實驗室聯合開發了SpikingJelly框架,該框架基于PyTorch并采用SNN進行深度學習,已應用于物體檢測任務并實現了較好的效果[33]。此外,Eshraghian團隊[34]開發的SNN深度學習框架snnTorch亦被深度學習界廣泛使用。但使用上述框架在圖形處理器(Graphics Processing Unit,GPU)等通用硬件上對數據集進行訓練時,數據集的“0-1”脈沖序列編碼被GPU等通用硬件當作普通實值進行矩陣運算,從而無法體現SNN的優勢。

在基于硬件實現SNN方面,具有代表性的成果包括:英國曼徹斯特大學的SpiNNaker[35]、德國海倫堡大學的HiCANN[36]、美國斯坦福大學的Neurogrid[37]、IBM公司的True-North[38]、Intel公司的Loihi[39]、我國浙江大學的Darwin[40]以及清華大學的Tianjic[41],以上神經形態的硬件實現摒棄馮·諾依曼架構而采用存算一體的方式并結合SNN設計,實現學習、感知、推理和預測的人工智能行為。然而,受限于電子瓶頸以及摩爾定律的放緩,電子類腦硬件難以進一步提高SNN的計算速度和能效[42]。

2 光子SNN

相較于傳統電子計算芯片面臨制程接近摩爾定律極限所帶來的瓶頸和約束,光具有高帶寬、高速率、低延時和低功耗的優良特性,因而利用光的上述優勢集成光子SNN,進而實現學習、感知、推理和預測等功能,已成為當今信息處理領域多學科融合的熱門方向,國內外的多個研究團隊開展了深入研究并已取得較為豐富的成果。本文以下內容將介紹多種光子SNN,按照實現器件分類,包括半導體光放大器(Semiconductor Optical Amplifier,SOA)實現方案、電吸收調制器(Electro Absorption Modulator,EAM)實現方案、激光器實現方案、微環實現方案以及其他實現方案。

2.1 SOA實現方案

2009年,美國普林斯頓大學Fok研究團隊[43]首次提出了光子LIF神經元,開辟了光子SNN的研究領域。經過多次完善,2011年,該團隊設計了圖2所示的實驗來實現基于SOA的光子LIF神經元[44],其核心思想是建立SOA載流子密度變化和LIF神經元膜電位變化之間的對應關系來實現光子LIF神經元。輸入脈沖經可調光衰進行加權和可調延時線進行延時后通過50∶50耦合器耦合形成一路輸入信號(圖2中A處),輸入信號與波長為λ1的采樣脈沖同步進入SOA。由于采樣脈沖的能量很小,因此它對SOA增益的影響相比輸入信號可忽略不計。由于SOA內部的交叉增益調制(Cross Gain Modulation,XGM),輸入信號會導致SOA的增益突然下降,SOA輸出的采樣脈沖(圖2中B處)能量隨之降低;隨后SOA的增益逐漸恢復,采樣脈沖的輸出功率也逐漸提升。SOA輸出處的帶通光譜濾波器使得只有波長為λ1的采樣脈沖經摻鉺光纖放大器(Erbium Doped Fiber Amplifier, EDFA)放大和偏振控制器(Polarization Controller, PC)后輸出至由長度為10.5 m的高摻雜GeO2(HD)非線性光纖所構成的閾值判決器1,對低于設定閾值的光信號進行過濾從而輸出清晰的脈沖序列,然后由太赫茲光非對稱解復用器(Teraherz Optical Asymmetric Demultiplexer, TOAD)對閾值判決器1的輸出(圖2中C處)進行反轉,閾值判決器1的輸出脈沖作為TOAD的控制信號,在該控制信號所制造的轉換窗口內波長為λ2的采樣脈沖作為TOAD的輸出信號從而實現信號的反轉。TOAD的反轉作用實現了光信號的恢復,使得輸出波長完全獨立于輸入波長。此外,由于對信號的反轉會帶來一定程度的信號劣化,在神經網絡的傳播過程中這種劣化會積累進而導致類腦計算錯誤,從而在TOAD的輸出端對光信號進行第二次閾值處理。

圖2 基于SOA的光子LIF神經元[44]

上述實驗雖然實現了基于SOA的光子LIF神經元模型,但兩個閾值判決器使得LIF神經元模型的實現過于復雜和昂貴,且沒有實現對神經元的抑制性輸入。針對上述問題,該團隊提出了圖3所示的基于SOA的對稱光子神經元結構[44]。該結構包含兩個SOA,SOA1接收興奮性輸入,SOA2在接收抑制性輸入的同時接收SOA1的輸出?;赟OA的對稱光子神經元的輸出可以視為單獨興奮性輸入和單獨抑制性輸入結果的疊加,當且僅當興奮性輸入存在而抑制性輸入不存在時,基于SOA的對稱光子神經元才發放脈沖。

圖3 同時接收興奮性輸入和抑制性輸入的對稱光子神經元結構[44]

基于SOA的光子脈沖神經元性能受載流子生存時間和脈沖發放后恢復時間的影響,現代SOA的載流子生存時間可低至10 ps,恢復時間可低至25 ps,實驗所用SOA的恢復時間從小于100 ps到近似500 ps,可輸出皮秒級脈寬。

與此同時,國內也有北京大學和西安電子科技大學等高校開展了相關研究。2015年,北京大學趙建業教授團隊[45]進行了基于SOA的光子STDP的實驗,其實驗結構框圖如圖4所示。鎖模激光器(Mode-locked Laser,MLL)作為脈沖源,其輸出光經兩個帶通濾波器輸出波長為λ1和λ2的光并分別被用作突觸前脈沖和突觸后脈沖,兩束光之間的相對時延由一個可變光延遲線(Optical Delay Line,ODL)控制,突觸前脈沖和突觸后脈沖由一個90∶10的光耦合器分開,形成的強脈沖作為信號脈沖,弱脈沖作為探測脈沖,突觸前探測脈沖和突觸后信號脈沖進入SOA1,突觸前信號脈沖和突觸后探測脈沖進入SOA2,信號脈沖進入SOA之前,通過電流注入對應于載流子密度的SOA增益被保持在一個常數值,信號脈沖進入SOA之后,載流子密度由于受激發射而下降,這個持續數ps的過程被稱為增益飽和。脈沖通過后,表征SOA增益的載流子密度將由來源于外部電流注入的載流子而恢復,一般恢復時間將持續幾百ps,增益恢復的動態特性由探測脈沖采樣,探測脈沖通過光帶通濾波器從SOA的輸出提取,然后通過光電探測器(PhotoDetector, PD)探測。圖5所示為基于SOA的光子STDP實現機制,如果探測脈沖在信號脈沖到來之前進入SOA(圖5中Ⅱ、Ⅲ所示),那么探測信號被正常放大且不被載流子損耗所影響,如果探測脈沖在信號脈沖之后的幾百ps以內到達SOA(圖5中Ⅰ、Ⅳ所示),那么此時探測信號的輸出功率將弱于正常放大的功率,SOA1構成圖5(左)的波形,SOA2構成圖5(中)的波形,SOA1構成的波形和SOA2構成的波形相減之后形成圖5(右)所示的STDP特征。該團隊所用MLL脈沖發放頻率為100 MHz,因此脈沖發放間隔為10 ns,遠大于實驗所用SOA的恢復時間25 ps,突觸前脈沖和突觸后脈沖的相對時延Δt在-400~400 ps之間可調。

圖4 基于SOA的光子STDP實驗結構框圖[45]

圖5 基于SOA的光子STDP實現機制[45]

2021年,我國西南大學鄧濤教授團隊[46]提出利用垂直腔半導體光放大器(Vertical-Cavity Semiconductor Optical Amplifier, VCSOA)對上述實驗進行改進,相比于傳統的平面SOA,VCSOA所需的偏置電流和輸入功率都更低。

2.2 EAM實現方案

2012年,美國普林斯頓大學Fok研究團隊[47]提出了一種混合模/數的光子脈沖神經元,并首次利用EAM構建光子脈沖神經元,其實現原理圖如圖6所示,該光子脈沖神經元由一個作為積分器的EAM、一個基于四波混頻(Four-WaveMixing, FWM)的異步脈沖源發生器以及一個基于高鍺摻雜非線性環路鏡(Ge-doped NLM)的閾值判決器組成。圖6中Ⅰ處波長為1 550.12 nm的N路輸入信號進行加權和延時并由圖6中Ⅱ處的光耦合器進行耦合。圖6中Ⅲ處所示少部分混合信號通過FWM構成脈沖光源,一個分布反饋式激光器二極管(Laser Diode, LD)發出1 547.21 nm的連續波光信號作為FWM的泵浦,當輸入信號和泵浦同時存在時FWM發生,由此新產生的1 544.30 nm波長的光信號構成了脈沖光源。圖6中Ⅳ所示混合信號和脈沖光源的發光進入EAM,輸入信號的能量積累于EAM,EAM的輸出表征脈沖源的強度。EAM的輸出脈沖進入圖6中Ⅴ處的閾值判決器,閾值判決器濾除低于閾值的弱脈沖,高于閾值的強脈沖則以圖6中Ⅵ處的閾值輸出。該團隊的研究成果使得神經元的輸出不再受限于脈沖源的采樣速率,實現了神經元的異步響應。信號在EAM的累積基于負偏置EAM的有限交叉調制恢復時間,負偏置越大相應的恢復時間越低。該團隊所用EAM負偏置最大可調至-3 V,相應恢復時間最低可為約10 ps,產生50 ps的累積窗口進而實現ps級的脈寬。

圖6 基于EAM的異步光子脈沖神經元的實現[47]

2013年,該研究團隊利用具有飽和吸收體的EAM和SOA完成了STDP的ps級實現[48],其實驗結構框圖及實現機制圖如圖7所示。圖7(a)所示突觸前脈沖和突觸后脈沖分離,突觸前脈沖絕大部分進入EAM,突觸后脈沖絕大部分進入SOA。圖7(b)中Ⅰ所示當突觸后脈沖先于突觸前脈沖發放時,突觸后脈沖進入SOA導致SOA增益的迅速下降,如果突觸前脈沖緊隨突觸后脈沖到來,那么SOA的輸出功率會最低,反之,如果突觸前脈沖的發放時間遠在突觸后脈沖發放時間之后,那么隨著時間的增加SOA的增益會逐漸恢復,SOA的輸出功率也會增加,此時對于EAM,圖7(c)中Ⅲ所示由于EAM反向偏壓的存在,在突觸前強脈沖到來之前EAM無法對突觸后弱脈沖進行飽和吸收,導致EAM的輸出功率很低。圖7(b)中Ⅱ所示當突觸前脈沖先于突觸后脈沖發放時,突觸弱脈沖不會導致SOA增益下降,因此輸出功率保持不變,對于EAM,圖7(c)中Ⅳ所示當突觸后脈沖緊隨突觸前脈沖到來時,強烈的飽和吸收作用于突觸后脈沖導致EAM輸出強脈沖,由于反向偏壓的存在,EAM的吸收逐漸建立,導致突觸后脈沖的輸出功率逐漸降低。將圖7中Ⅰ~Ⅳ所實現的效果線性疊加即可實現(圖7(d)所示)基于SOA和EAM的光子STDP,實驗所用突觸前脈沖和突觸后脈沖的功率都為10 dBm左右,脈寬都為5 ps左右,相對時延在-300~300 ps之間可調。

圖7 基于SOA和EAM實現光子STDP[48]

2.3 激光器實現方案

2.3.1 DFB激光器實現方案

2013年,美國普林斯頓大學Nahmias團隊[49]首次提出利用嵌入可飽和吸收(Saturable Absorber, SA)的分布反饋式(Distributed FeedBack,DFB)激光器(DFB-SA)和光電探測器來模擬LIF神經元模型,其實驗結構框圖及原理圖如圖8 所示。圖8(a)所示該模型主要由3個部分組成:兩個PD和1個激光器,PD接收的興奮性輸入和抑制性輸入綜合作用產生可以調制激光器增益模塊載流子注入的輸入電流并通過SA輸出光脈沖。DFB-SA作為閾值判決器和脈沖生成器其行為類似于真實的生物神經元軸突。圖8(b)所示輸入脈沖作用于PD產生的電流擾動調制增益,足夠的興奮積累導致脈沖的輸出,緊隨而來的是一個短暫的不應期,與此伴隨的是增益載流子濃度的下降和SA載流子濃度的上升。2015年,該研究團隊繼續對上述實驗進行擴展[50],圖8(c)所示通過波分復用(Wavelength Division Multiplexing, WDM)技術多路輸入脈沖在同一波導傳播,通過一組可調光譜濾波器對不同波長的脈沖信號在光域進行興奮加權或抑制加權后再次集成在同一波導進入平衡光電探測器(Balanced PhotoDetector, B-PD)。WDM技術的使用實現了神經元的多路輸入進而可實現光子脈沖神經元的大規模片上集成。2020年,該團隊進一步將基于DFB-SA的LIF神經元模型集成到Ⅲ-Ⅴ族光子集成電路中[51]。

圖8 基于DFB-SA實現LIF神經元[49-50]

2020年,我國上海交通大學鄒衛文教授團隊[52]使用DFB-LD實現了基于單波長的光子STDP,其實驗結構框圖和結果曲線如圖9所示。圖9(a)所示輸入波形由任意波形發生器(Arbitrary Waveform Generator, AWG)提供,DFB-LD由一個具有150 kHz外部調制帶寬的LD控制器驅動,隨后的可調光衰用于調整B-PD的輸入光功率,最后由示波器監控輸出信號。圖9(b)和9(c)所示低幅度的脈沖為突觸前脈沖,高幅度的脈沖為突觸后脈沖。當突觸后脈沖先于突觸前脈沖發放時,B-PD的輸出有兩個波峰,兩個波峰幅度之差構成了圖9(d)所示的STDP曲線tpost-tpre<0的部分。當突觸前脈沖先于突觸后脈沖發放時,B-PD的輸出有一個波峰,該波峰的幅度構成了圖9(d)所示的STDP曲線tpost-tpre>0的部分。圖9(e)所示當突觸后脈沖幅度上升時STDP曲線隨之整體上升。圖9(f)所示突觸前脈沖幅度上升時,STDP曲線tpost-tpre>0的部分保持穩定而tpost-tpre<0的部分會下降,因此可以將突觸前脈沖和突觸后脈沖的幅度作為可調參數來調節STDP曲線。

圖9 基于DFB-LD實現光子STDP[52]

2.3.2 嵌入石墨烯可飽和吸收體(GSA)的可激發激光器實現方案

2013年,美國普林斯頓大學Shastri等人[53]首次提出基于可飽和吸收體(Graphene Saturable Absorption,GSA)的可激發激光器實現光子脈沖神經元,其實現原理圖如圖10所示。該團隊進行了圖10(a)所示的實驗,波長為980 nm的泵浦光經由一個980/1 550 nm的WDM耦合器進入摻鉺光纖(Erbium Doped Fiber, EDF)以保持其載流子濃度,用以放大通過1 480/1 550 nm的WDM耦合器進入環路的興奮性脈沖。隔離器確保激光器中光信號的單向傳輸。激光器的脈沖通過一個80∶20的耦合器輸出。圖10(b)所示的結果驗證了當有足夠的興奮性光(藍色)輸入石墨烯增益區提升了載流子濃度后,環路將激射出脈沖(紅色)。

圖10 石墨烯可激發激光器的實現[53-54]

2016年,該團隊在前期實現石墨烯可激發激光器作為LIF神經元的基礎上實現了簡單時間模式檢測任務[54],其原理圖如圖11所示。兩個石墨烯可激發激光器級聯,輸入為一對時間間隔為Δt的脈沖,脈沖經過第一個激光器后通過數千米長的單模光纖(Single Mode Fiber, SMF)產生延時τ,當Δt≈τ時第2個激光器發放脈沖,兩個激光器之間通過一個PD而非直接的光輸入用以調制激光驅動器,這種PD驅動架構有利于大規模片上神經網絡的實現。與此同時,該團隊還實現了基于石墨烯可激發激光器的LIF神經元實現反饋回路,其原理圖如圖12所示。通過作為延時單元的SMF將輸出反饋給輸入,電加權單元控制光/電探測器的調制深度,用以根據是否高于閾值來提供全響應或無響應。脈沖可以在反饋回路中循環傳播。反饋回路的實現表明基于石墨烯可激發激光器的LIF神經元具備多級聯和信息記憶的能力,這種能力是實現多層神經網絡進而實現復雜信息處理任務的基礎。

圖11 基于石墨烯可激發激光器的LIF神經元實現時間模式檢測任務[54]

圖12 基于石墨烯可激發激光器的LIF神經元實現反饋回路[54]

2018年,該團隊在前期實現基于石墨烯可激發激光器的LIF神經元基礎上對實驗進行了進一步的改進[55],其原理圖如圖13所示。

圖13 同時接收興奮性輸入和抑制性輸入的石墨烯可激發激光器[55]

AWG1調制一個1 480 nm的LD來生成興奮性輸入,AWG2調制一個980 nm的LD來生成抑制性輸入,此時的EDF沒有額外的泵浦輸入。實驗表明興奮性輸入會導致脈沖輸出,當抑制性輸入在時間上先于興奮性輸入且逐漸接近興奮性輸入時,脈沖輸出逐漸被壓制到0。

2.3.3 垂直腔面發射激光器實現方案

2013年,美國普林斯頓大學Nahmias團隊[56]首次提出嵌入SA的垂直腔面發射激光器(Vertical-Cavity Surface-Emitting Laser, VCSEL)(VCSEL-SA)光子脈沖神經元,并從理論上提出這種低功耗、小面積和便于大規模集成的嵌入SA的可激發激光器具有LIF神經元的動力學行為,其結構示意圖如圖14所示。來自光纖系統的多路輸入波長(λ1,λ2,…,λk)信號通過光柵耦合器耦合向下進入VCSEL-SA,不同波長的光信號各自產生興奮或抑制激勵,波長為λ0的激勵脈沖沿VCSEL-SA朝上輸出。2015年,該團隊進一步通過SPICE分析從理論上提出了基于VCSEL-SA的光子脈沖神經元等價電路模型[57],并在此基礎上進一步驗證了該等價電路模型的脈沖輸出神經元動力學特性。2017年,我國西南大學鄧濤團隊[58]設計實驗驗證了兩個互連的VCSEL之間可以實現可控的脈沖傳輸。

圖14 VCSEL-SA結構示意圖[56]

2019年,西安電子科技大學項水英教授團隊從理論上提出利用VCSEL和VCSOA設計雙層光子SNN以實現基于無監督算法的任意脈沖模式識別[59],其結構示意圖及原理圖如圖15所示。圖15(a)所示為嵌入SA的VCSEL構成LIF神經元(VCSEL1,VCSEL2,…,VCSELn),突觸連接權重(W1,W2,…,Wn)通過由前所述基于VCSOA實現的STDP陣列進行調整。圖15(b)所示為神經網絡仿真學習過程,時空脈沖發放時刻固定(t1、t2),訓練過程中噪聲脈沖發放時刻隨機(t3),突觸后神經元的脈沖發放時刻(t4)逐漸收斂到首脈沖發放時刻t1,圖15(c)所示隨著學習的進行突觸后脈沖發放時刻(Post-Synaptic Spike Timing, PST)、突觸連接權重(w1、w2、w3)逐漸收斂至固定值,PST與目標脈沖輸出時刻之差sdm逐漸收斂到0,由此驗證了基于光子STDP的學習規則對噪聲的魯棒性,同時該團隊還驗證了由于噪聲脈沖發放時刻具有隨機性,因此實際需要更多的學習周期以達到收斂,更多的突觸前神經元、VCSOA的輸入波長接近諧振腔的諧振波長以及提升學習速率有利于提升神經網絡的性能,VCSOA更高的偏置電流亦有利于提升神經網絡的性能但要考慮平衡功耗。

圖15 基于VCSEL和VCSOA實現無監督任意脈沖模式識別的光子SNN[59]

2021年,該團隊在上述工作的基礎上進一步提出基于VCSEL-SA和VCSOA的光子SNN實現監督學習分類任務[60],其結構示意圖如圖16所示?!?-9”為待識別的10種輸入模式并在實際訓練時對輸入模式加上噪聲后進行時空編碼構成輸入層神經元(PRE1, PRE2,…,PRE-IN)的輸入,每種輸入模式由20×20的像素所構成,監督信號為目標脈沖,神經網絡的訓練由基于STDP和anti-STDP規則的ReSuMe算法來執行。輸入層神經元的輸入、監督信號以及由輸出層神經元輸出構成的脈沖反饋共同作用通過上述算法訓練神經元的連接權重wij。隨著訓練的進行輸出層神經元(POST1,POST2,…,POST-O)脈沖發放時刻會逐步收斂,最終實現根據輸出層神經元的脈沖發放時刻識別對應的輸入模式。

圖16 基于VCSEL-SA和VCSOA實現監督學習分類任務的光子SNN結構示意圖[60]

同年,該團隊在傳統權重學習基礎上引入突觸延時可塑性,實現了基于VCSEL-SA的光子SNN[61]和基于VCSEL-SA的二進制卷積光子SNN[62],實現了利用基于VCSEL-SA的光子SNN實現數獨求解器[63]。2022年,該團隊又實現了基于VCSEL-SA的光子SNN用于運動識別和方向識別[64]以及基于VCSEL-SA的多層光子SNN[65]。表1所示為基于激光器的光子脈沖神經元關鍵性能參數。

表1 基于激光器的光子脈沖神經元關鍵性能參數

2.3.4 其他激光器實現方案

2011年,比利時布魯塞爾自由大學Coomans團隊[69]提出基于半導體環形激光器的光子脈沖神經元,并從理論上提出通過光注入觸發脈沖在可激發非對稱的半導體環形激光器內部觸發脈沖的可能性。2013年,葡萄牙阿爾加維大學Romeira團隊[70]提出包含了由納米級雙勢壘量子阱共振隧道二極管所驅動的LD組成光電集成電路在1 550 nm工作波長條件下生成ns級光脈沖的能力;2022年,英國斯特拉斯克萊德大學Hejda團隊[71]進一步提出了基于共振隧道二極管的光子SNN,在時空脈沖模式分類任務中實現了94%的分類準確率;2013年,比利時根特大學Alexander團隊[72]提出基于微盤激光器的光子脈沖神經元,同年該團隊從理論上驗證了微盤激光器可以對來自其他微盤激光器的興奮性脈沖做出響應[73]。2014年,法國巴黎第七大學Braive團隊[74]提出基于嵌入SA的微柱激光器具有神經元的興奮性行為,驗證了在單脈沖擾動下激光器可以產生亞納秒的響應脈沖并分析了激光器泵浦偏置的作用、雙脈沖激發條件下激光器的絕對和相對不應期,以及由載流子動態特性所調制的抑制動態;2019年,同樣來自該機構的Pammi團隊[75]繼續驗證了單個和耦合的微柱激光器的計算能力以及通過可調時延和脈沖碰撞來執行時間模式識別;2016年,希臘雅典國立卡波蒂斯坦大學Mesaritakis團隊[76]提出一種半導體量子點被動MLL來實現神經元的興奮性和抑制性行為,該實現方式僅需簡單地調整激光器內置SA的反轉電壓而無須使用復雜的電/光轉換結構。2019年,同樣來自該機構的Sarantoglou團隊[77]驗證了半導體量子點被動MLL具有將興奮性信號和抑制性信號分別在各自波段內進行光脈沖編碼來實現真正的抑制性神經元的能力;2022年,我國西安電子科技大學項水英教授團隊[78]提出基于SA的法布里佩羅激光器來實現光子脈沖神經元并通過實驗驗證了其具有時間積分、門限判決、脈沖生成以及不應期的LIF神經元特性,并進一步提出通過時分復用脈沖編碼來實現基于光子SNN的模式識別任務。

2.4 全光微環諧振器實現方案

2012年,比利時根特大學Van Vaerenbergh團隊[79]從理論上驗證了當輸入波長接近微環諧振器共振波長時足夠高的輸入功率會加熱微環,由此產生的熱光效應會形成雙穩態性能,此外由于光可以產生改變折射率系數的自由載流子,因此高品質系數的微環甚至可以自激發脈沖。微環的這種雙穩態性能和可以自激發脈沖的能力使得絕緣硅上微環可以實現脈沖神經元的特性;2013年,該團隊繼續從理論上驗證了微環的動態特性可以用于設置脈沖在級聯的兩個微環間傳播的時延用以實現SNN的訓練算法,為基于微環諧振器的更大規模SNN的實現奠定了基礎[80];2018年,美國普渡大學Chakraborty團隊[81]提出基于頂部嵌入相變材料Ge2Sb2Te5(GST)的微環諧振器作為光子脈沖神經元,其結構示意圖及原理圖如圖17所示。圖17(a)所示為其結構示意圖,初始狀態的GST為晶態,滿足諧振條件的“寫”脈沖從INPUT端口耦合進入環形波導作用于GST導致其晶度降低非晶化提升最終到達非晶態,相應地,在“讀”階段隨著GST晶度的降低諧振光波從THROUGH端口導出的比例相對降低而從“DROP”端口導出的光波相對提高。圖17(b)所示為DROP端口的傳輸特性,這種僅改變GST的晶度即可控制光波傳輸比例的機制構成了“積分-發放”脈沖神經元模型。在此基礎上該團隊進一步將兩個嵌入GST的微環諧振器組合成一個可同時接收正輸入和負輸入的單個神經元(如圖17(c)所示),輸入脈沖通過兩個微環諧振器的“DROP”端口和“THROUGH”端口分別進行正積分和負積分,通過移相器Φ形成的合成脈沖的幅度為兩者之差,神經元膜電位的積分與合成脈沖的幅度成比例。脈沖的發放由圖17(c)的“輸出單元”來執行,該結構包含一個光放大器,一個環行器,以及一個頂部嵌入初始狀態為晶態的GST的矩形波導。對嵌入GST的矩形波導而言,當GST處于晶態(非晶態)時,其傳輸率較低(高)。對積分單元和輸出單元而言,“讀”、“寫”周期逐次循環進行,在神經元積分單元的“寫”周期內,“讀”脈沖通過發放單元。另一方面,在神經元積分單元的“讀”周期內,“讀”脈沖依次通過微環諧振器和放大器后形成的脈沖寫入位于輸出單元嵌入于波導的GST。環行器用于引導進入和離開矩形波導的脈沖。當位于積分單元的GST處于初始晶態時,光放大器的輸出不足以使矩形波導內的GST非晶化,因此此時的脈沖無法通過矩形波導,然而,在若干“寫”脈沖的作用下,膜電位的積分超過閾值后光放大器的輸出足以使矩形波導內的GST非晶化進而可以實現脈沖的輸出。一旦神經元實現脈沖輸出,“復位”脈沖將會傳遞,使得神經元恢復初始狀態。該團隊利用這種同時包含積分單元和輸出單元的光子脈沖神經元構建了3層全連接的SNN用以對MINIST數據集進行訓練,實現了98.06%的識別準確率。

圖17 基于嵌入GST微環諧振器的光子脈沖神經元[81]

2019年,德國明斯特大學Feldmann團隊[82]提出并制造出集成可塑突觸(圖18(a)所示)的全光SNN,其結構圖如圖18所示。神經元之間突觸連接的權重通過集成于光波導頂部的相變材料(Phase Change Material,PCM)來改變,多路不同波長(λ1,λ2,…,λN)的輸入加權后經微環諧振器以及WDM多路復用器(圖18(b)所示)集成于單波導后進入集成PCM胞體(圖18(c)所示)的環形諧振器(圖18(d)所示),足夠的功率將導致環形諧振器輸出脈沖,以上的過程同樣構成了“積分-輸出”的脈沖神經元模型。通過調整上述所述單個神經元(圖18(e)所示)的輸入權重即可實現最簡單的基于監督學習與非監督學習的模式識別任務,進一步地集成多個上述神經元構成多層SNN可實現更為復雜的模式識別任務。

圖18 基于相變材料和微環諧振器的全光脈沖神經網絡[82]

2022年,美國普林斯頓大學Jha團隊從理論上驗證了一種互補金屬氧化物半導體(Complementary Metal Oxide Semiconductor,CMOS)兼容的集成石墨烯硅基微環諧振器光子脈沖神經元[83],其結構示意圖如圖19所示。該團隊從理論上驗證了石墨烯的克爾效應和飽和吸收可以提升神經元的非線性效應。

圖19 與硅總線波導耦合的混合石墨烯硅基微環示意圖[83]

同年,西安電子科技大學項水英教授團隊提出一種基于Add-Drop型微環諧振器的光子脈沖神經元[84],圖20所示的基于Add-Drop型微環諧振器的光子脈沖神經元的動力學模型表現為“共振-輸出”,這種光子脈沖神經元沒有明確的脈沖發放閾值門限,任意強度的光擾動輸入在光泵浦的作用下即可產生一個輸出脈沖,這種特性對于光時序編碼SNN是重要的實現機制。同時,該團隊還驗證了這種Add-Drop型微環諧振器在突觸強脈沖的作用下對隨后到來的弱脈沖產生強烈的非線性效應,由此實現了光子STDP。此外Add-Drop型微環諧振器還具有權重配置的功能,Add-Drop型微環諧振器具有較大的熱光系數使得溫度的變化和折射率的變化有著近似線性的關系,折射率的變化進一步導致共振波長的變化,最終導致Drop端口的輸出發生變化,產生權重在[0,1]范圍內可調的效果?;谝陨铣晒搱F隊實現了基于Add-Drop型微環諧振器的光子脈沖神經元構成的神經網絡,采用基于權重的ReSuMe延時學習算法進行脈沖序列學習并實現了收斂,同時該團隊還驗證了初始權重、門限功率和學習速率對神經網絡性能有影響,對其進行合理的設置有助于提升網絡性能。表2所示為基于微環諧振器的光子脈沖神經元關鍵性能參數。

圖20 基于Add-Drop型微環諧振器的光子脈沖神經元[84]

表2 基于微環諧振器的光子脈沖神經元關鍵性能參數

2.5 其他實現方案

除上述方案之外,2020年,我國西南大學吳加貴研究員團隊[86]提出了基于硅基光子微腔的光子脈沖神經元,驗證了微驅動諧振器的調制效應可以生成神經形態光脈沖;同年,我國上海交通大學蘇翼凱教授團隊[87]提出了基于無源微諧振器的光子脈沖神經元,該團隊利用微諧振器的非線性特征來實現脈沖神經元,并表現出了脈沖神經元的激發門限特性、不應期特性和級聯特性;2021年,波蘭華沙大學Tyszka團隊[88]通過實驗驗證了在激子極化激元的脈沖非共振激發狀態下半導體微腔具有LIF神經元的行為。

總體來看,基于SOA和EML的光子神經元為早期的實現方案,技術成熟,但SOA和EML存在體積較大難以集成的問題?;诩す馄鲗崿F光子脈沖神經網絡的方案眾多,但還是受制于“光-電-光”的轉換效率,且從大規模集成的角度來看激光器的體積仍然偏大?;谙嘧儾牧虾臀h諧振器的方案是近年的研究趨勢,微環諧振器體積小容易集成,但受制于微環諧振器的控制難度和相變材料的壽命,該方案仍待進一步完善與優化。

3 結束語

SNN的硬件化是實現其強大智能算力的重要途徑,同時,光具有高速、低功耗和大帶寬等特性,因此光子SNN具有比生物大腦快千萬倍乃至十億倍的運算速度和推理能力的潛力??傮w來看,由于人類對神經科學和類腦機制的研究還處于初始階段,因此現階段光子SNN的理論模型和訓練算法仍與真實生物神經元的運行機制存在較大差異;其次,現階段光子SNN的物理實現還主要以單個分離光學器件實現神經元和突觸為主,整體網絡的性能探索和研究多基于仿真,實現真正的大規模集成光子SNN還需克服器件體積大、加工難度高,以及不同功能的光學器件難以耦合等各種難題;最后,現階段光子SNN的訓練和控制仍然要通過電子芯片來實現,這也使得光子SNN的整體性能將仍然受限于電學硬件的瓶頸。

綜上,光子SNN涉及人工智能、計算科學和光電集成等多個領域,需要從底層的材料器件,中間的系統架構,到上層的算法實現來進行多層次、跨領域的交叉研究和發展。未來,隨著光子技術的不斷進步與突破,光子SNN的實現有望往大規模、集成化、可編程、低功耗和低成本的方向演進,越來越多地適用于數據中心和自動駕駛等復雜場景。

猜你喜歡
諧振器激光器光子
《光子學報》征稿簡則
基于多模諧振器的超寬帶濾波器設計
激光器發明60周年
多諧振器無芯片RFID標簽設計
關于寬帶石英濾波器配套諧振器的選用
基于T型諧振器的窄帶帶通濾波器設計
一體化半導體激光器的ANSYS熱仿真及結構設計
基于注入鎖定法激光器的研究
在光子帶隙中原子的自發衰減
多光子Jaynes-Cummings模型中與Glauber-Lachs態相互作用原子的熵壓縮
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合