?

基于人工神經網絡的地震動峰值加速度預測研究

2024-03-01 03:40蘇聞浩
安徽建筑 2024年2期
關鍵詞:人工神經網絡神經元神經網絡

蘇聞浩

(1.蘇州科技大學,江蘇 蘇州 215009;2.江蘇省結構工程重點實驗室,江蘇 蘇州 215009)

1 引言

地震動引發的地表峰值加速度(PGA)是建筑結構抗震、結構設計環節中的重要參數。一般來說,峰值加速度的預測模型分為參數模型和非參數模型兩種,參數模型一般有固定的函數表達式,其主要局限性在于需要預先定義一個表達式,并且隨著研究的不斷深入,表達式往往會引入更多的變量和系數,進而導致該函數表達式越發復雜。而非參數模型則是由大量數據驅動的沒有固定函數表達式的模型,這種類型的模型主要缺點在于其沒有固定的函數表達式形式,較難對其進行物理上的理解和分析。

現階段,人工神經網絡作為機器學習的一個重要分支,其在預測和分類問題上都取得了較大的應用進展和研究成果。在工程領域有結構位移響應、建筑模式分類等各式各樣的應用場景[1],在地震動峰值預測領域,已有不少研究人員使用人工神經網絡技術創建預測模型。Kerh 等[2]使用震級、震源深度和震中距的人工神經網絡來對臺灣的高雄捷運系統中兩個主干線上的PGA 進行估算,將預測結果與回歸分析結果作比較,結果表明,神經網絡的預測值更加接近實際地震記錄。Thomas 等[3]提出了自適應神經網絡預測系統,利用NGAwest 數據庫中的2815 條數據記錄對PGA 進行預測。在之后的研究中,Dhanay等[4]在之前的神經網絡上又綜合考慮了場地因素以及破裂機制,使用震級、震中距、破裂機制和場地Vs30預測PGA并同時驗證了模型性能。

在前期的研究中,研究人員主要考慮了地震的震級、震源深度等參數,隨后部分研究人員添加了場地地表下30m內的等效剪切波速(Vs30)來表征場地信息以增加模型精度。本文在這些研究的基礎上,添加了發生地震時地底的峰值加速參數,對地表峰值加速度進行更加精確的預測。同時還探究了不同軟硬場地情況下該模型的預測性能差異,為人工神經網絡技術在抗震設計等工程應用領域提供了一些參考。

2 人工神經網絡

人工神經網絡是對人腦的抽象、簡化和模擬,其中神經元又稱感知機,是神經網絡的最基本組成單位(如圖1 所示),每一個神經元都由一個線性層和一個激活函數組成。神經元輸出公式為:

圖1 單個神經元結構示意圖(圖片來源:作者自繪)

式中,wij指神經網絡中第i 層與i-1層神經元之間的權重;bj指神經網絡中第i 層第j 個神經元線性層的偏置;φ指激活函數。

神經網絡內部按照不同結構位置的劃分,包括輸入層、隱藏層、輸出層三個部分。其中,輸入層每個神經元對應一個變量特征,隱藏層為使用多個神經元進行的多層組合,針對回歸問題的輸出層有一個神經元。每一層的神經元通過前一層的加權運算和激活運算傳遞數值,并通過反向傳播算法實現各個權值參數的更新。若該網絡的第i 層與i-1層的所有神經元全連接,則該神經網絡被稱為全連接人工神經網絡(DNN)。

3 實驗與分析

3.1 數據收集與處理

日本KiK-net(Kiban Kyoshin network)是全世界范圍內應用范圍最廣的豎向臺網,其每個臺站都有地表、井下三分量高靈敏度加速度傳感器,同時公開了各個臺站場地的精確土層信息,是研究場地效應的優質數據來源[5]。參照董凱月[6]的數據處理與研究方法,筆者基于日本KiK-net 臺網提供的共計39200條地震數據記錄,通過基線校正和0.1~35Hz 濾波頻段處理,對數據進行整理,最終得到了本文的數據庫。數據庫中PGA 分布在1~2430cm/s2之間,PGA 分布最多的區間為30~80cm/s2,占據了數據庫總量的29.7%,10~30cm/s2之間的數據占據了29%,大于80cm/s2的數據占據了整體數據集的13%。

這些數據分布在497 個不同的地區,根據美國地震減災計劃中的分類標準(如表1 所示),通過Vs30進行場地類別劃分。最終統計得出本數據庫B 類場地共占比9%,C 類場地最多,達到了數據集的51.9%,D 類場地數據為37%,剩余數據為E 類場地數據,無A 類場地數據。

表1 地震減災計劃規范分類

3.2 人工神經網絡訓練

筆者選用人工神經網絡作為基本框架,選用震級、震中距、震源深度、地底峰值加速度和場地Vs30作為基本輸入變量,輸出變量為地震動引發的PGA。最終構建了一個5輸入、20個隱藏神經元、1 個輸出的全連接人工神經網絡,神經網絡模型如圖2所示。

圖2 神經網絡模型結構(圖片來源:作者自繪)

在進行神經網絡訓練時,將輸出PGA 取自然對數處理,這樣可以將目標值的分布范圍減小,加速神經網絡梯度的更新,有效提高神經網絡的收斂速度。同時筆者采用Adam(Adaptive Moment Estimation)優化器[7],該優化器使得超參數具有很好的解釋性,僅需微調,通過其可以自動調整學習率的特性達到快速收斂的目的。

在網絡優化過程中,通過分批次進行數據的輸入和訓練,可以有效加快學習效率。batch-size 為每個批次送入網絡模型的樣本量,輸入過小的batchsize 會導致每次網絡的訓練樣本數據過少,樣本不具有代表性,容易出現過擬合;過大的batch-size 則會使得神經網絡對樣本數據的改變不敏感,很有可能陷入局部最優解,使訓練效果變差。經過多次嘗試,本文最終確定的batchsize 大小為256。本文同時將數據集的80%作為訓練集,剩余的20%作為測試集,測試集的數據不參與訓練,僅在訓練完成后計算其各項評價指標以驗證模型的可靠性。

本文神經網絡模型代碼的實現基于Python3.9 環境和Pytorch 深度學習框架。

3.3 結果驗證與分析

在經歷了1500 次訓練迭代后,模型各方面性能趨于穩定,最終得到了訓練完成后的神經網絡模型。圖3 為該訓練完成的神經網絡模型測試集上目標值與預測值散點分布圖,圖中橫坐標表示PGA 取自然對數后的實測目標值,縱坐標表示網絡模型預測值,圖中實線表示預測值與實測值相等,為最佳訓練效果。對測試集數據進行線性回歸,回歸直線圖中以虛線表示。

圖3 神經網絡目標值與預測值關系圖(圖片來源:作者自繪)

圖3 中可見,該網絡模型預測值與目標值整體分布在最佳擬合曲線周圍,有較好的預測性能,在測試集上線性回歸得到的斜率為0.82,相較于最佳訓練效果,本模型在PGA 目標值較大時會產生相對低估的趨勢??赡苁怯捎跀祿熘蠵GA 在較高部分數據相對較少,模型的學習效果相對不充分。

為了定量地分析該模型的預測性能,將該神經網絡模型的目標值與預測值之差定義為該模型的誤差。在全數據集上計算其誤差,得到的誤差分布如圖4所示。

圖4 神經網絡模型誤差分布(圖片來源:作者自繪)

通過計算得出,該模型誤差的均值、方差和標準差為-0.022、0.237 和0.486。圖4 中可見,該神經網絡模型誤差呈正態分布,均值誤差接近于0,標準差較小,網絡模型的誤差整體呈現出無偏的特性,統計得到誤差分布在-0.5~0.5之間的比例占總數目的72%,展現出了良好的預測性能。

為了分析各個場地在該網絡模型中的性能表現,圖5 繪制了B、C、D、E 這四類場地上各自的誤差分布。由于場地類型較多,因此圖中僅給出了各誤差分布的包絡曲線。其中B 類場地為堅硬場地,E類場地為松軟場地。

圖5 神經網絡模型各場地預測誤差分布(圖片來源:作者自繪)

如圖5所示,各個場地的誤差均在0附近呈現出正態分布。通過統計可得,B、C、D、E 這四類場地誤差分布在-0.5~0.5 之間的比例分別為73.8%、67.7%、74.6%和83.0%。各場地的預測性能相對一致,其中E 類場地的預測性能相較于其余場地整體更好。

3.4 模型性能對比分析

本文使用機器學習任務中常用的均方誤差函數(MSE)(式2)和平均絕對誤差(MAE)(式3)作為損失函數及評價指標[8],同時計算了機器學習任務中最多使用的決定系數(R2)(式4)作為評價模型整體性能好壞的指標。通常,若R2的值越接近1,則說明預測模型對實測值的擬合程度越好,當R2>0.8 時,預估值和實測目標值之間就有很強的相關性。測試集的R2同時也可以表明模型在預測時的泛化性能是否優秀,一般認為當測試集的R2達到0.8 時,該網絡模型具有比較不錯的模型性能。

筆者在上述神經網絡模型的基礎上,將輸入變量調整為以往研究人員經常使用的震級、震中距、震源深度和場地Vs30這四個輸入參數,額外構建了一個用于對比網絡性能的神經網絡模型,將該模型作為對比模型。使用相同的數據和訓練方法對該模型進行訓練,并通過上文中的式(2)、式(3)和式(4)計算本文人工神經網絡和該對比模型在測試集上的各項評價參數,如表2所示。

表2 網絡模型各評價參數及決定系數

通過表2 可見,本文的人工神經網絡模型相較于對比模型,各項評價指標均有明顯提升,均方誤差和平均絕對誤差有一定的下降,決定系數R2由0.782提升到了0.812,提升幅度約為4%。同時,該人工神經網絡模型在測試集上的決定系數高于0.8,展現出優秀的模型性能。

4 結語

當前對于地表峰值加速度的各類預測模型均有一定的缺陷,由于引起地表峰值加速度變化的原因較多,傳統模型需要在考慮輸入參數的前提下加上衰減、阻尼和不確定性等各種影響系數,模型較為復雜且很難較為完整地考慮各個因素對其產生的影響程度,僅能給出諸如震級等參數與PGA 的正反比關系和一個相對籠統的范圍預測。

使用人工神經網絡,可以在不確定具體函數式關系的情況下,直接建立一個端到端的預測模型,該模型僅需考慮影響PGA 的關鍵因素,如地震信息和場地信息。網絡模型可以自動訓練并且收斂,無需人為地去確定各項系數。本文的神經網絡模型預測值與實測值整體較為接近,在神經網絡模型的誤差表現上,該神經網絡模型的誤差整體呈現出正態分布的特性,同時其均值誤差接近于0,在不同軟硬類場地上,該神經網絡模型也展現出了大致相同的預測性能,在各類場地中均可以較好地進行PGA 的預測。同時,還與以往研究中的網絡模型進行了對比,發現本文改進的模型在預測性能上具有一定程度的提升,為后續的神經網絡模型研究提供一定的參考。

本文同樣存在一定的不足和有待改進的地方。首先,基于數據來進行訓練的神經網絡模型其可靠程度主要取決于數據量的大小,本文中各類場地數據分布相對不夠均勻,較為松軟的E 類場地數據偏少,存在一定的訓練風險。其次,對于輸入參數的選取,本文借鑒了以往研究中普遍使用的參數,對于是否仍有其它重要參數會對PGA 產生明顯的影響,仍然是后續研究中需要討論的一個關鍵問題。

猜你喜歡
人工神經網絡神經元神經網絡
《從光子到神經元》書評
利用人工神經網絡快速計算木星系磁坐標
神經網絡抑制無線通信干擾探究
人工神經網絡實現簡單字母的識別
躍動的神經元——波蘭Brain Embassy聯合辦公
基于神經網絡的拉矯機控制模型建立
復數神經網絡在基于WiFi的室內LBS應用
基于二次型單神經元PID的MPPT控制
毫米波導引頭預定回路改進單神經元控制
基于支持向量機回歸和RBF神經網絡的PID整定
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合