?

逐束團三維信息提取軟件HOTCAP的實時性能優化

2024-03-10 05:20楊星冷用斌周逸媚
核技術 2024年2期
關鍵詞:響應函數束流電荷

楊星 冷用斌 周逸媚

1(中國科學院上海應用物理研究所 上海 201800)

2(中國科學技術大學 合肥 230026)

3(中國科學院大學 北京 100049)

4(中國科學院上海高等研究院 上海 201204)

亮度和穩定性是同步輻射光源的關鍵指標,需要不斷努力以獲得高流強、高亮度和良好的穩定性。然而,提高存儲環性能受到包括電子束與周圍真空室之間的相互作用等復雜效應在內的各種限制。此外,新一代光源普遍具有插件數量多、動力學孔徑小和時間分辨率高(皮秒量級)等特點,使得如何最小化不穩定性成為一個需要解決的關鍵技術問題,包括是什么導致了束流不穩定,以及如何解決束流不穩定性等[1]。實現對束流位置和電荷的測量將有助于定量地研究束流阻抗、耦合不穩定性和非線性動力學,并可以為加速器物理學家提供一個非常強大的機器研究工具。開發逐束團信號處理算法和建立一個高分辨率、高刷新率的逐束團參數測量系統至關重要。世界范圍內的先進粒子加速器,比如上海光源(Shanghai Synchrotron Radiation Facility,SSRF)[2-3]、上海軟X射線自由電子激光裝置[4]、北京正負電子對撞機二期工程儲存環[5]、北京高能同步輻射光源[6]、合肥光源(Hefei Light Source,HLS)[7]、大型強子對撞機(Large Hadron Collider,LHC)[8]、日本高能加速器研究機構KEKB[9]、韓國浦項光源[10]、澳大利亞光源[11]等普遍搭建了自己的用于提取逐束團三維位置信息的系統。

具有大內存容量的高采樣率、多通道寬帶示波器是從束流位置探測器(Beam Position Monitor,BPM)獲取原始數據的理想工具[12]。通過算法處理,可以獲得逐束團三維位置和電荷量等信息。然而,由于輸入數據量極大,信號處理算法又較為復雜,因此對基于高速示波器的3D束電荷和位置測量的綜合數據處理算法或相應的數據處理軟件包的要求很高。為了滿足這一需求,上海光源束測組的研究人員成功開發了HOTCAP(逐束團三維位置和電荷量精確測量寬帶示波器信號處理軟件包),作為一個在線測量系統,可以同時測量逐束團三維位置[13]。此外,當同步輻射裝置在top-up模式下運行時,需要頻繁地進行電荷的補充注入,所以注入瞬態也是儲存環機器研究的一個重要窗口[14]。而在該軟件包之前也沒有成熟的在線系統能夠剝離補注電荷信號。HOTCAP實現并集成了上述功能,可以同步測量每個束的三維位置,并剝離充注電荷信號,進一步分析注入瞬態。

實際使用中,該軟件仍存在需要優化改進的部分,其中至關重要的是計算效率,之前版本的軟件包對一組典型數據的分析需要30 min以上,而上海光源top-up運行模式下,每2~3 min就會注入一次,合肥光源則是約10 min注入一次,即在兩次注入之間無法完成一次數據處理,即使是不間斷的工作也會有遺漏的注入事件。為實現兩次注入期間完成相應的信息提取,需要將單次計算時長縮短至兩分鐘以內,因此,本文中討論了計算效率的具體優化方式與相應的實驗驗證。

1 HOTCAP基本測量原理及系統結構

典型的基于HOTCAP的逐束團3D位置測量系統結構如圖1所示,采用紐扣型電極(圖中深藍色方框標注)拾取攜帶束團電荷量、束長、橫向位置、縱向位置等多種信息的束流信號,一般包含4個電極以便采用差比和算法提取橫向位置信息,探頭拾取到的信號經高性能射頻電纜直接饋入寬帶高速數字采樣示波器中,示波器量化后得到的數字波形被傳輸至計算平臺進行分析計算,提取逐束團信息。

圖1 HOTCAP測量系統結構示意圖(彩圖見網絡版)Fig.1 Structural diagram of HOTCAP measurement system structure (color online)

紐扣電極拾取的束流電信號可以表示為:

式中:I(t)為流強,縱向呈高斯分布的束團流強可以表示為I0(t)??梢钥闯?,采集到的電壓信號與束流的橫向位置F(δ,θ)、縱向位置(縱向相位t0)和電荷(e·N)有關。以圖1所示為例,束團從探頭法平面的第一象限穿過,因此最靠近束團的D電極耦合信號強度最大,遠離束團的A電極耦合信號強度最小,B、C電極信號居中。因此,探頭拾取到的信號中已包含逐束團位置測量所需要的全部信息,可以通過設計算法來將逐束團三維位置信息提取出來[15]。

實際采集到的信號并不完全符合理論推導,并且有限帶寬的饋通還會引入時延,采集設備的帶寬限制也會改變信號在時域內的波形。因此需要使用實際采樣得到的信號通過統計學的方式重建響應函數,以唯象的方法確定束團在探頭上的表現。具體原理為:示波器的采樣頻率并非束團在探頭處重復出現頻率的整數倍,因此采集到的束團的不同圈的信號為同一個響應函數上不同起點的采樣,將不同圈的信號按照其特有的起點排列在同一圈內,就可以得到該束團在該電極上的響應函數[13]。

HOTCAP軟件包的基本結構如圖2所示。圖2中用戶界面(User Interface,UI)模塊使用Python中PyQT5庫進行開發;輸入/輸出(Input/Output,IO)模塊使用Scipy庫進行數據的讀取與緩存;計算模塊為整個軟件算法的核心:計算時間主要受計算模塊的效率影響。

圖2 HOTCAP軟件包算法結構Fig.2 Algorithm structure of HOTCAP software package

2 HOTCAP軟件運行效率測試及優化方法分析

計算平臺的硬件性能會對實際的計算時長產生重要影響,為保證軟件的通用性,實驗采用一臺性能普通、廣泛使用的商業計算設備進行測試,該設備處理器型號為AMD Ryzen76800H,主頻3.2 GHz,內存大小16 GB。

圖3為HOTCAP軟件處理流程圖。選取一組典型數據,使用原數據處理軟件進行處理,各模塊在處理流程中的具體耗時數據統計如表1所示。

表1 原數據處理軟件處理SSRF數據各模塊耗時統計Table 1 The time spent in processing SSRF data by the original software

圖3 HOTCAP軟件處理流程圖Fig.3 Processing flowchart of HOTCAP software

分析以上測試結果:耗時較長模塊中,IO模塊的耗時取決于數據存儲介質的性能,基本無法優化,而響應函數的重建、儲存電荷與補注電荷的信息提取在算法上存在較大的優化空間,其中電荷的三維位置提取算法在儲存電荷信息提取,補注電荷信息提取中被反復使用,計算資源占用最多,優化空間是最大的。

縱向相位計算的基本原理是互相關法,通過在固定范圍內,將實際采樣得到的信號與之前建立的響應函數(LUT)重采樣得到的平衡位置的理論采樣信號(LUTn,i)進行相關度計算以尋得該束團該圈最可能的相位[7]。

相關系數Ccor的計算來源如式(2):

其中:

式中:to表示束團的初始采樣相位;f是示波器采樣頻率;表示某個束團在第N圈采樣得到的n個采樣點;LUTn,i表示對重建得到的該束團的響應函數按照不同的起點i進行重采樣得到的代表ti相位的n點序列。

為提高軟件通用性,原數據處理算法選擇在較大相位范圍內(300 ps)以0.1 ps間隔來計算相位相關系數以尋找可能的相位真值,這就要求進行3000次匹配計算。對于上海光源的具體實例而言,儲存環在top-up運行模式下,束團長度基本固定,束團相位連續變化,從監測記錄的運行歷史數據看,同一束團連續兩圈內相位變化遠小于1 ps[11],因此可以以上一圈的相位值為基準點,縮小匹配范圍,即采取自適應的辦法,將匹配范圍縮小,考慮到其變化范圍小于1 ps,保留余量后,將匹配范圍縮小至(phasei-1-1.5,phasei-1+1.5),這樣一個長度為3 ps的區間。

橫向位置的計算基于二者在縱向相位匹配完成后,幅度滿足以下關系:

將相位互相匹配采樣得到的信號與對響應函數進行重采樣得到的信號進行比較,以求得該束團該圈在該方向的投影大小,可以看到其中采樣信號和響應函數的范數這兩個變量已在相位計算中計算,可以使用將變量緩存于內存中進行復用的方式減少重復計算,以增加內存占用的方式提高計算速度。

3 優化后軟件束流實驗測試

3.1 計算效率評估

為評估優化后軟件的通用性,分別選用上海光源和合肥光源數據進行了實測分析。

第一組數據選擇上海光源正常供光時的注入數據進行分析,該數據為四通道數據,單通道數據長度102.5百萬樣點,采樣頻率為10 GHz,包含一次補注電荷的注入。

原數據處理軟件處理該組數據用時見表1,平均約50 min,得到了包含儲存電荷逐束團三維位置、電荷量、補注電荷三維位置、補注電荷量、探頭響應函數等信息。

使用優化后的數據處理軟件對同一組數據進行處理,平均用時總計185 s,約3 min,約為優化前耗時的6%,各模塊耗時數據統計如表2所示。

表2 優化后數據處理軟件處理SSRF數據各模塊耗時統計Table 2 The time spent in processing SSRF data by the optimized software

雖然相較于原版本,計算效率已經提升了超過90%,但是離2 min的目標還有一些距離。分析優化后軟件中各模塊耗時的占比,可發現響應函數計算模塊耗時75 s,占比達到了40%,但從測量原理來看,每組數據都重新計算系統響應函數是不必要的,本模塊還存在較大的優化空間。

在同步輻射光源儲存環中,束團的束長變化較小,同時相對于束團原始分布來說探頭和信號電纜的帶寬很低,因此對于某一組確定的探頭來說,探頭信號引出端輸出的束流信號形狀是基本不變的,這意味著HOTCAP測量系統的響應函數是確定的,從同一組探頭上采集的多組數據,并不需要每次都重建響應函數,可以建立一次以后重復使用。

按以上分析,選擇使用外部響應函數的方法對軟件進行了優化,引入提前計算好的響應函數用時遠小于0.1 s,總的數據處理時間成功縮短到120 s以下。

其中,計算補注電荷數據的過程也與計算逐束團三維位置的過程基本獨立,因此,可以對存在注入的情況進行獨立計算,而對于一般的不含注入的穩態數據的分析,僅需儲存電荷信息提取的50 s。

第二組數據選擇合肥光源正常供光時的穩態數據進行分析,該數據為四通道數據,單通道數據長度為200百萬樣點,采樣頻率為20 GHz。

該數據組的特點為數據長度較長,圈數多,但示波器位數低,采樣精度較低,原數據處理軟件用時總計20 min。

使用優化后的軟件包進行處理,總計用時不到25 s,是優化前耗時的2%,提升明顯,詳細用時如表3所示。

表3 優化后數據處理軟件處理HLF數據各模塊耗時統計Table 3 The time spent in processing HLF data by the optimized software

相應地,使用外部響應函數分析同一組數據時,可以直接省去計算響應函數的計算,使單次計算僅需10 s完成。

3.2 計算分辨率評估

數據處理效率的優化,不應以降低束流3D位置測量分辨率作為代價,因此需要對優化前后軟件包的逐束團3D位置分辨率進行對比評估。

逐束團3D位置分辨率的評估方法選擇使用PCA方法,該方法以奇異值分解(Singular Value Decomposition,SVD)為核心原理,通過對數據進行主成分分析,將周期變化的采樣信號數據分解為特征不同的成分,保留主要成分,舍去噪聲成分,實現數據降噪,同時可以將分離出的噪聲作為評估測量系統信噪比、分辨率的指標[16]。

以上海光源和合肥光源數據為樣本,采用主成分分析(Principal Component Analysis,PCA)方法分析對比逐束團3D位置測量分辨率,結果分別如圖4與圖5所示。從圖4和圖5的對比分析可知,軟件優化前后水平方向、垂直方向位置分辨率基本不變,而新版本軟件的縱向位置(相位)分辨率有所提高。其原因是在縮小了匹配范圍后,相位信息提取的波動范圍也被限制在更小的范圍內,去除了隨機采樣誤差中較大毛刺數據的干擾。

圖4 三維位置測量結果分辨率結果(SSRF)(a) 縱向相位分辨率,(b) 橫向x方向位置分辨率,(c) 橫向y方向位置分辨率Fig.4 Resolution of 3D position measurement (SSRF)(a) Longitudinal phase resolution, (b) Lateral x-axis position resolution, (c) Lateral y-axis position resolution

圖5 三維位置測量結果分辨率結果(HLS)(a) 縱向相位分辨率,(b) 橫向x方向位置分辨率,(c) 橫向y方向位置分辨率Fig.5 Resolution of 3D position measurement (HLS)(a) Longitudinal phase resolution, (b) Lateral x-axis position resolution, (c) Lateral y-axis position resolution

3.3 計算準確性評估

數據處理效率的優化,也不應以降低束流3D位置測量準確性作為代價,因此需要對比優化前后軟件包輸出波形數據的一致性。

選擇上海光源供光運行時某個束團的穩態縱向振蕩波形、注入過程中儲存束團的水平方向殘余振蕩波形、注入過程中補注束團的縱向阻尼振蕩波形等三個最具代表性的物理過程,來評估優化后軟件的計算準確性。其結果如圖6所示。

圖6 三維位置測量結果優化前后的差別(a) 縱向相位測量結果,(b) 縱向相位優化前后測量結果差,(c) 橫向x方向位置測量結果,(d) 橫向x方向位置優化前后測量結果差Fig.6 Difference between 3D position measurement before and after optimization(a) Longitudinal phase measurement results, (b) Difference in measurement results before and after longitudinal phase optimization, (c) Lateral x-axis position measurement results, (d) Difference in measurement results before and after optimization in lateral x-axis position

如圖6(a)所示,優化前后軟件處理得到的單個束團穩態縱向振蕩波形完全一致,如圖6(b)所示,兩組波形間逐點差值為隨機噪聲,標準差為0.15 ps,與測量系統縱向相位分辨率相當。如圖6(c)所示,優化前后軟件處理得到的儲存束團在注入過程中的橫向殘余振蕩波形完全一致,如圖6(d)所示,兩組波形間逐點差值為隨機噪聲,標準差為20 μm,與測量系統水平方向位置分辨率相當。

如圖7所示,優化前后軟件處理得到的補注束團縱向阻尼振蕩波形完全一致,兩組波形間逐點差值為隨機噪聲,標準差為2 ps,與測量系統提取補注束團(電荷量小10倍以上)縱向相位分辨率相當。

圖7 補注電荷相位測量結果優化前后的差別Fig.7 Difference of refilled charge phase measurement before and after optimization

4 討論

以上優化方案在優化速度的同時,作為代價,犧牲了算法對于不穩定數據的兼容能力,對于儲存環中極少可能出現的縱向相位劇烈變化的情形無法準確提取信息,因此考慮到包括縱向相位的大幅波動在內的,有別于一般供光狀態的特殊情形,需要對軟件包進行進一步的優化和開發,還有束長等信息提取算法的集成等等,HOTCAP在功能上可進一步完善。計算效率方面,現階段已滿足使用需求,但隨著未來示波器的性能逐漸增強,數據量的逐漸增大,仍會對軟件包提出更高的要求,軟件設計上仍具優化空間,其中,現有算法的優化效果與儲存環諧波數有關,諧波數越少優化效果越明顯,若諧波數遠超720,優化效果下降,因此需要有更合理的算法設計,因涉及大量矩陣運算,因此也有著借鑒機器學習的方案,在圖形處理器(Graphics Processing Unit,GPU)上進行規模計算以提升效率的可能。

5 結語

為滿足上海光源在線實時測量及數據發布的需求,本文對電子儲存環逐束團三維位置信號處理軟件包HOTCAP進行了計算效率上的優化。采用運行數據作為樣本進行的評估測試表明:優化后總處理時間從50 min降低到2 min以下,橫向位置分辨率與優化前保持一致,縱向相位分辨率略有提高,完全滿足設計要求。

采用合肥光源運行數據測試了優化后軟件包的通用性,結果表明,優化后的軟件包同樣可以在不同高頻頻率、不同諧波數的電子儲存環上應用,同樣可在不降低分辨率的條件下大幅縮短數據處理時間,非常有利于在世界范圍內進行推廣應用。

作者貢獻聲明楊星負責算法的設計、實現及優化、數據的采集和分析處理、文章的起草和最終版本的修訂;冷用斌負責對方案的指導,文章的知識性內容作批評性審閱,最終版本的修訂,項目的監督和管理,指導實驗數據的收集;周逸媚負責對文章的知識性內容作批評性審閱,獲取研究經費,行政、技術或材料支持,指導實驗數據的收集。

猜你喜歡
響應函數束流電荷
一類具有Beddington-DeAngelis響應函數的階段結構捕食模型的穩定性
電荷知識知多少
電荷守恒在化學解題中的應用
高能同步輻射光源低能束流輸運線設計研究
中國散裂中子源加速器注入束流損失調節研究
相機響應函數定標的正則化方法
克服動態問題影響的相機響應函數標定
秦嶺太白山地區樹輪寬度對氣候變化的響應
ECR中和器束流引出實驗研究
靜電現象有什么用?
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合