?

基于HHT-LSTM的冬奧會臨時設施運行趨勢預測方法研究

2024-04-09 01:42常明煜田樂郭茂祖
智能系統學報 2024年1期
關鍵詞:希爾伯特時頻分量

常明煜,田樂,郭茂祖

(1.北京建筑大學 電氣與信息工程學院, 北京 100044; 2.北京建筑大學 建筑大數據智能處理方法研究北京市重點實驗室, 北京 100044)

臨時設施故障預測是學界研究重點之一,通過提前預判相關設施的狀態和未來一段時間的變化趨勢,有助于提高其安全性。在大型體育賽事中,因臨時設施具有安裝方便、拆卸容易、能重復使用的特點,因此會有大量修建的臨時設施,其中就包括臨時看臺、轉播塔、臨時橋架以及為偏遠賽場電力運營所建造的輸電塔等臨時設施結構。由此可見,臨時設施在我國建設體育強國中有著愈發重要的地位。

本文研究主要是基于2022年舉辦的北京冬奧會。為舉辦綠色奧運,勤儉辦奧,大量易于搭建和重復利用的臨時設施被大范圍采用,其中就有臨時看臺以及放置轉播設備的轉播塔等。臨時看臺主要承受人群荷載,當人群擁擠、搖擺、跳躍時,容易引發強烈振動,直接影響看臺結構的整體強度和剛度,導致該類結構安全事故可能發生,而轉播塔也可能由于施工缺陷、各種復雜荷載的作用或者桿件老化等原因,轉播塔結構在運行中會存在疲勞裂紋、螺栓松動等損傷。除此之外,轉播塔結構比較高聳,而且其最上面的平臺會放置轉播設備,使得轉播塔對風荷載、雪荷載、低溫環境等具有很強的敏感性。因此,有必要對看臺、轉播塔等臨時設施結構進行荷載和損傷識別,從而能夠為建立冬奧臨時設施結構安全智能預警提供關鍵技術支撐。

本文提出了以希爾伯特黃變換(Hilbert-Huang transform, HHT)和長短期記憶網絡(long shortterm memory network, LSTM)為基礎的一種全新的組合模型。希爾伯特黃變換由經驗模態分解(empirical mode decomposition, EMD)和希爾伯特變換(Hilbert)兩部分組成,通過EMD將給定信號分解成若干固有模態函數(intrinsic mode function,IMF),這些函數是滿足特定條件的分量;然后再對各個分量進行Hilbert變換得到瞬時頻率。相比于傳統的時頻分析方法,瞬時頻率和幅度都可以通過HHT得到,而且該方法所得時頻矩陣更精細,同時也不存在頻譜泄漏風險。

HHT具有自適應性和清晰的物理含義,是一種適合處理突變信號的方法,可以有效解決線性和平穩性束縛問題,可以有效提取到信號的時間、頻率、能量分布特征。

LSTM網絡也可以有效避免長期依賴性問題。所謂長期依賴的問題指的是隨著時空距離的增加,信號之間的相關性常常變得越來越弱,不確定性越來越大。傳統的神經網絡沒有記憶功能,而循環神經網絡(recurrent neural network,RNN)能夠連續不斷地進行信息循環,保證信息存在,RNN可以利用以前的信息對當前任務進行相應的操作,如果這次任務的有用信息與需要進行處理信息的地方之間距離較遠,容易導致RNN不能學習到有用的信息,導致推導任務失敗,造成梯度消失或梯度爆炸。LSTM可以避免RNN梯度消失解決長依賴問題,因此本文采用LSTM來解決臨時設施未來趨勢預測問題。該算法為臨時設施運行趨勢預測提供了一種有效的方法,實現臨時設施傾斜、振動等狀態信息的監測與智能分析需求,及時捕捉到異常點,最大限度降低安全隱患。

1 臨時設施預測方法相關工作

對于臨時設施趨勢預測主流方法包括時間序列預測、智能算法和組合模型等。其中,傳統的時間序列預測方法雖然對線性數據處理效果良好,但是處理非線性數據時該類算法的效果不佳。智能算法目前主要有機器學習和深度學習2類,其中常見的主要包括隨機森林算法[1]、BP神經網絡[2]、時頻分析[3]與特征融合方法、小波變換[4]、傅里葉變換[5]等。文獻[6]利用粒子群算法(particle swarm optimization,PSO)優化的BP神經網絡來對辦公建筑視覺舒適度進行預測,提供了一種高效準確的辦公建筑預測方法。在日常工作中,機械設備會產生特征性的振動、噪聲等信息,因此出現了很多以數據驅動和信號處理為基礎的方法。文獻[7]通過峭度解卷積降噪與經驗小波變換的方法,達到了診斷滾動軸承故障的目的。文獻[8]采取了時頻變換和特征融合策略,達到了診斷內燃機故障的目的。文獻[9]深入研究了以自適應經驗傅里葉分解為基礎的故障識別策略。文獻[10]以小波變換為基礎,實現了診斷液壓缸泄漏故障的目的。利用智能算法雖然能很好地處理非線性問題,但在處理大樣本數據時計算速度慢、計算效率低。就原理而言,組合模型通過對各個單一模型的組合,可以充分發揮各自優點,在提高效率的同時提高預測精度。此外,通過組合模型所得到的結果,比單一模型更加穩定可靠,這也是它能夠廣泛運用于經濟、工業等諸多領域的原因所在。文獻[11]通過人工神經網絡和卡爾曼濾波達到了診斷浮式風力機槳距系統故障的目的。文獻[12]充分結合了多點最優最小熵解卷積和增強倒頻譜技術,并將其運用到診斷風電機組齒輪箱多故障中。很多預測方法不僅應用于機電設備故障預測和辦公建筑領域,而且在電力負荷預測和價格數據預測領域應用也十分廣泛。文獻[13]利用PSO優化長短期記憶神經網絡(LSTM)模型的參數,大大提高了預測精度。文獻[14]結合LSTM模型處理長時間序列的優勢和支持向量機回歸(support vector machine regression, SVR)模型處理非線性問題的優點,并利用果蠅優化算法優化參數建立組合模型,預測了煙用白卡紙價格和短期卷煙銷量,并取得顯著成果。

除了設計各種模型,一些學者還結合了時頻分析豐富信號原始信息,最終達到增強預測準確性的目的。如Giulia等[15]提出了經驗模態分解與人工神經網絡(empirical mode decomposition-artificial neural network, EMD-ANN)分解-集成模型,大幅提高了預測準確性;Tayyab 等[16]則構建了離散小波變換-神經網絡(discrete wavelet transformback propagation, DWT-BP)和離散小波變換-徑向基神經網絡(discrete wavelet transform-radial basis function network, DWT-RBF)組合模型,預測效果也明顯提升;劉艷等[17]提出的傳統時序建模方法(auto regressive integrated moving average, ARIMA)組合模型也擁有不錯的預測效果;趙力學等[18]通過變分模態分解-反向傳播神經網絡(variational mode decomposition- back propagation, VMD-BP)模型完成了水位流量的非線性擬合,所得效果也很好;詹可等[19]針對海洋環境中非線性、非平穩的實際波高時間序列,提出了一種經驗模態分解與長短期記憶網絡(empirical mode decompositionlong short-term memory, EMD+LSTM)短期預報模型,相比于傳統的時間序列預測模型具有更高的精度;姚洪剛等[20]針對金融序列高噪聲以及非線性的特點,提出了一種EMD+LSTM的金融時間序列預測模型,取得了很好的預測效果。

在設計引入時頻分析的模型時,可能會存在以下不足[21]:

1)傳統的時頻分析方法在積分變換的過程中會產生頻譜泄漏,局部細節無法被很好地刻畫出來。

2)對一維信號進行轉化時,雖然可以得到豐富的特征,但是特征空間的維度也會增加,這樣就需要采用復雜的神經網絡去進行特征提取和處理,會導致梯度消失,不收斂等問題。

因此本文采用了HHT和LSTM構建了一種預測模型。通過HHT將一維信號轉換成二維的時頻矩陣。HHT與傳統的基于積分變換時頻分析方法相比,能獲得瞬時頻率和幅度,時頻矩陣更好地展示信號在不同時間和頻率上的特征而且不會發生頻譜泄漏。所以,HHT可以彌補傳統時頻分析方法的缺陷,更好地刻畫信號的局部細節。

2 HHT+LSTM的臨時設施運行趨勢預測

2.1 HHT+LSTM組合模型

本文實驗所使用的數據源于北京冬奧會延慶賽區高山滑雪中心臨時看臺支撐架上的加速度傳感器,所測得的數據信號有不同的振幅、形態和頻率存在。此數據的信號屬于一類非線性非穩態的信號時間序列。如果采用傳統的時頻分析方法,無法有效地提本文到此類非平穩信號的特征。HHT結合了EMD和希爾伯特變換,可以計算瞬時頻率和幅度,對于此類信號處理屬于最佳的選擇。因此,HHT的作用是將時域的信號進行轉換進而得到包含時域和頻域對應關系的時頻圖。首先采用EMD將振動信號進行分解,得到若干個內涵模態分量(IMF),然后通過希爾伯特變換計算出每個IMF的瞬時頻率和幅值。最后采用LSTM來處理精細的時頻特征信息完成最終的預測。

HHT+LSTM的預測模型整體框架如圖1所示。在HHT+LSTM的預測模型中,可以通過EMD把原始信號分解為諸多子序列,將分解后的IMF進行希爾伯特變換,該方法所得時頻分布的信號能量更加完整、精確,同時,還可以繼續得到信號的Hilbert邊際譜,從而達到精確反映信號幅值隨頻率變化規律的目的。通過信號處理方法得到的時頻特征,將其作為輸入送到LSTM網絡進行訓練和預測。下面將展開介紹希爾伯特黃變換和長短期記憶網絡。

圖1 HHT+LSTM的預測模型整體框架Fig.1 Overall framework of HHT+LSTM prediction model

2.2 希爾伯特黃變換

對于希爾伯特黃變換[22]而言,經驗模態分解和希爾伯特變換是其最重要的部分,這個信號處理方法利用了信號的局部信息,從而獲得信號某一時刻的瞬時狀態。信號處理的本質都是將接收的高頻實信號,結合已知的載頻信息,還原出基帶的復信號。在自然界中實際觀測到的都是實信號,復信號是觀測不到的。而在對信號處理方面,復信號相比于實信號處理起來非常容易。所以在趨勢預測的任務上,本文首先采用對采集到的信號數據進行處理,將其與深度神經網絡進行結合來實現更加準確的預測。

2.2.1 經驗模態分解

將原始信號x(t)通過EMD分解,得到若干個IMF分量,所有IMF分量都需滿足下述條件:1)極值點與零點數量之差應小于等于1;2)局部最大值與最小值的包絡線間均值必須是0。具體EMD計算過程如下:

1)用一條連續的光滑曲線將時間序列信號x(t)中全部極大值點進行串聯,形成上包絡線xmax(t),同上所述確定下包絡線xmin(t)。定義2條包絡線的平均線m1(t):

利用原始序列x(t)與m1(t)之差得到第1個分量h1(t):

2)對于不同的信號,h1(t)可能是一個IMF分量,一般來說它并不滿足IMF所需要的條件,此時將h1(t)當作原信號,重復上述步驟,則有:

3)判斷是否滿足IMF分量的條件,如果不滿足返回到極值計算,重新對信號進行極值和包絡運算;如果滿足條件,則得到IMF分量和差值。

4)判斷一個差值信號是否為IMF分量,需要有一個篩選過程終止的原則,通過利用2個連續的處理結果之間的標準差SD作為判斷依據:

5)當h1k(t)滿足SD的值要求時,稱h1k(t)為第1階IMF,記為c1(t):

6)從原信號x(t)中減去c1(t)得到剩余信號,即殘差r1(t):

然后將r1(t)看作一組新的“原信號”,重復上述經驗模態過程,通過多次運算得到全部的IMF和殘差ri(t):

式中:i=1, 2, ···,n,當ri(t)滿足判斷條件之一時,經驗模態分解過程終止,則原始的時間序列為

2.2.2 希爾伯特變換

EMD分解后,對每一個IMF(ci(t))分量進行希爾伯特變換,從而得到瞬時頻率和幅度[23]。

式中:P為柯西主值,t和τ為時間。

從式(9)中再得到相應IMF瞬時頻率和幅值:

式中:ωi(t) 和ai(t)分別為第i個IMF的瞬時頻率和幅度。通過對所得全部數據的歸納,就能夠得到所需的二維時頻圖。

2.3 希爾伯特黃變換

本文利用LSTM[24]來處理得到的二維時頻圖。LSTM可以避免長期依賴問題,能很好地解決時間間隔較長和延遲時間等問題,圖2為具體結構。在操作過程中,首先把不同序列輸入到LSTM,然后就可以利用門控單元讀取、調整隱含狀態向量和記憶狀態向量,最終達到對各序列進行預測的目的。LSTM是一種特殊網絡結構,依靠3個“門”結構可以令信息選擇性對循環神經網絡中每個時刻的狀態產生影響。相關計算如下:遺忘門是將上一層信息與輸入數據信息的加權之和,激活函數是Sigmoid,輸出0~1的值,直接控制了信息傳遞的比例。

圖2 LSTM神經元結構示意Fig.2 Schematic structure of LSTM neurons

輸入門也有一個激活函數Sigmoid,決定了哪些信息會被傳遞:

tanh激活層用于創建隱藏層的候選值:

最后記憶層:獲取隱藏層,是基于上一個隱藏層與現隱藏層的候選值,這2個值通過與遺忘門和輸入門相乘,決定通過多少信息:

輸出門也有一個激活函數Sigmoid,決定輸出哪些信息:

最后隱藏層:先經過一個激活函數,讓值控制在[-1,1],防止梯度爆炸,然后再與輸出層相乘決定輸出哪部分信息,即最后僅僅輸出我們確定輸出的那部分:

式中:σ為Sigmoid函數,Ft為t時刻遺忘門,xt為t時刻的輸入,W為權重矩陣,It為t時刻輸入門,Ht-1為t-1時刻隱含層狀態,C?t-1為記憶更新向量,b為偏置向量,tanh為雙曲余弦函數,Ct為t時刻的記憶單元狀態變量,Ot為t時刻的輸出門,Ht為t時刻隱含層狀態。

3 實驗結果與分析

3.1 數據來源

本實驗所使用的數據源于北京冬奧會延慶賽區高山滑雪中心臨時看臺支撐架上的加速度傳感器,在比賽現場,該傳感器的主要作用是檢測觀眾對看臺的施力狀態,所得數據是真實多元時間序列數據集,從占比來看,訓練集占比最大,為60%,測試集、驗證集則均為20%。

本數據集涵蓋了4個不同位置加速度傳感器在X軸、Y軸、Z軸方向的三維傳感器數據。采用的數據集長度為53 217,傳感器采樣頻率為500 Hz。相關設備每間隔10 min 采集10 s數據,并將所得數據上傳到云端。

3.2 評價指標

為合理評價模型性能,本文采用均方根誤差(root mean square error, RMSE)、平均絕對誤差(mean absolute error, MAE)和平均絕對百分比誤差(mean absolute percentage error, MAPE)3個評價指標。其中RMSE描述的是預測值和真實值之差的平方的均值開方,代表了預測的離散程度,能夠很好地反映出實驗數據具有更好的精度,使誤差的結果和數據是一個單位級別,可以更好地描述數據。MAE描述的是預測值和真實值之差的絕對值求平均,其值越小越好。MAPE用預測值與實際值之間的差去與實際值相比,看其中占比有多大,對預測的準確度表示更加直觀。上述性能指標定義為

式中:n為測試樣本,PMi為i時刻的實際數據,PPi為i時刻網絡的輸出數據預測值。

3.3 實驗設置

本文實驗數據集的劃分為訓練集、測試集和驗集比例為3∶1∶1。訓練模型使用的是Adam優化器,基本參數設置分別為學習率為0.000 8,一階矩估計的指數衰減率參數為0.9,二階矩估計的指數衰減率參數為0.999,權重衰減參數為1×105,訓練輪次為60,批處理訓練參數為512,將訓練集輸入到模型中進行訓練。本實驗均在Ubuntu系統上進行,GPU為Tesla V100,內存為128 GB。編程語言使用的是Python3.6,神經網絡的構建框架為Pytorch;數據的讀取和計算使用的是numpy和pandas庫;希爾伯特黃變換使用的是pyhht庫。

3.4 結果與分析

本文實驗數據采用的是冬奧會現場測得的私有數據集,本文選擇24個歷史數據來預測下一個時刻點的3個維度上的值。

通過HHT算法處理相關數據,再對所得數據進行經驗模態分解,可以獲得一個殘余分量r和12個固有模態函數IMF1~IMF12,IMF0定義為原始信號。分量IMF1不規則主要是因為數據序列存在非線性和非平穩性的情況。分解所得IMF1頻率和振幅都最大,且原始序列主要信息也被包含在其中,分量IMF2~IMF12的頻率和振幅都逐漸下降,只能展現原始序列局部特征,結果如圖3所示。

圖3 經驗模態分解Fig.3 Empirical mode decomposition

然后用HHT算法對每一個IMF分量進行希爾伯特變換,得到各分量的時頻圖,每個IMF分量均與相應頻譜圖對應,具體見圖4。表1~3列出了各分量平均瞬時頻率。從表1~3中可得,EMD分解所得IMF分量的頻率表現出逐步下降趨勢,而且進一步觀察還可以發現各分量平均頻率近似2倍關系依次降低。這樣就可以將原信號分解出高頻、中頻和低頻3種不同的信號。這也充分展示了希爾伯特的一個重要作用-頻分復用。簡單來說就是各個原信號在時域上共用,但在頻域上相互獨立的一個方式。這個方法能將各個原信號調制至不同的頻率段,使得它們互不干擾,并且通過之前類似的方法總能將調制信號中的各個原信號解調出來。EMD分解出來的信號處于高頻、中頻和低頻3種不同頻率,希爾伯特變換也能很好地處理不同頻率段的信號并且不會互相影響,避免了對后續預測的結果精度產生影響和偏差。

表1 高頻分量頻率Table 1 High frequency component frequency

表2 中頻分量頻率Table 2 Intermediate frequency component frequency

表3 低頻分量頻率Table 3 Low frequency component frequency

圖4 各IMF分量平均頻率Fig.4 Average frequency of each IMF component

在得到高頻、中頻和低頻3種分量后,將其輸入到LSTM網絡中進行預測,得到了X、Y、Z軸3個維度的預測值,該組合模型預測結果如圖5所示。

圖5 組合模型在X, Y, Z軸上的預測結果Fig.5 Prediction results of the combined model on the X,Y, and Z axes

采用所建立的組合模型以2021年11月19日20時26分前25個采樣點來預測精度,如圖5所示,組合模型在X、Y、Z軸3個維度上的預測精度較高,效果很好,這一結果說明此模型預測精度較高。

同時本文也將循環神經網絡(recurrent neural network, RNN)、長短期記憶網絡(long short-term memory, LSTM)、門控循環網絡(gated recurrent neural network, GRU)、雙向循環神經網絡(bi-directional recurrent neural networks, BiRNN)、雙向長短期記憶網絡(bi-directional long short-term memory,BiLSTM)、雙向門控循環網絡(bi-directional gated recurrent units, BiGRU)等傳統預測模型作為競爭模型進行了比較,同時為了驗證HHT法的貢獻,考慮了部分競爭模型在HHT作用下的預測性能,得到預測誤差結果如表4所示。

表4 預測模型結果對比Table 4 Comparison of prediction model results

相比較于RNN、GRU、雙向RNN、雙向GRU和LSTM等競爭模型,HHT+LSTM的RMSE分別下降了0.003 5、0.003 6、0.009 9、0.003、0.002 2;MAE下降了0.002 1、0.002 7、0.009 4、0.006 3、0.000 7;MAPE下降了73.4%、46.2%、229.9%、42.9%、22.2%。本文模型還與Informer進行了實驗對比,但是從指標結果來看,Informer雖然是目前很流行的時間序列預測模型,但是對于本實驗中真實數據集預測并沒有達到很好的效果,反而本文提出的模型在各項指標中表現得十分出色,達到了很高的預測精度。證明了該組合模型較其他預測模型在臨時設施運行趨勢預測任務中更加具有可行性和有效性。

本文還將RNN、雙向RNN和雙向LSTM與HHT算法進行了結合,與本文提出的組合模型進行比較,綜合表4結果來分析,證明了HHT與LSTM結合更加適用于此類任務,在預測精度結果方面具有更高的精度,效果更好。相比而言,本文提出的方法更有效地利用特征,并且根據表4中結果分析,HHT+LSTM性能優于其他傳統預測模型,本文方法的綜合性能也是最優的。算法中加入了時頻分析的方法,使原始信號的信息更加豐富,預測算法的性能得到了很大改善。與傳統的時頻分析方法不同,HHT可以獲得瞬時頻率和幅度且不會產生頻譜泄露,可以很好地刻畫局部細節。通過將一維信號進行時頻轉換得到更加精細的二維的時頻矩陣,豐富其特征?;诖艘隠STM有效地傳遞和表達長時間序列中的信息,并且可以解決梯度消失或梯度爆炸問題。將兩者算法的優勢結合,通過對比實驗可以直觀發現,本文提出的模型在臨時設施預測方面具有一定的可行性和有效性,并比傳統的預測模型表現得更加出色。不過,盡管該方法可以通過HHT時頻圖提供精細的信號信息,但相關模型訓練所需算力也更大。

3.5 消融實驗

本文進行消融實驗以驗證加入希爾伯特黃變換的有效性,實驗結果如表5。本文在LSTM中先加入EMD模塊時,實驗效果反而降低。在加入了希爾伯特變換后,預測精度得到很大提升,評價指標也進一步的提升,證明了希爾伯特黃算法提升了模型的性能,提高了預測精度。

表5 消融實驗Table 5 Ablation experiment

4 結束語

本文針對冬奧會臨時設施運行趨勢預測問題,提出了一種結合HHT和LSTM的方法,使用HHT來進行信號分解和提取時頻域特征, 應用LSTM神經網絡進行最終預測。本文通過運用HHT,將一維信號轉換為二維時頻圖,可以更加深入地挖掘信號的時間和頻率信息。通過利用LSTM可以有效解決長期依賴問題的優勢來進行臨時設施運行趨勢預測。利用冬奧會現場真實數據集的驗證,通過與多種傳統預測算法進行比較,證明了本文方法具有一定的有效性和可行性。但相比而言,本文方法需要相對較大的算力,在未來的研究中會繼續對其整體結構進行優化,提高其時頻域分析方法的性能,并將其應用于其他領域。

猜你喜歡
希爾伯特時頻分量
一個真值函項偶然邏輯的希爾伯特演算系統
帽子的分量
論《哈姆雷特》中良心的分量
分量
下一個程序是睡覺——數學家希爾伯特的故事
基于希爾伯特-黃變換和小波變換的500kV變電站諧振數據對比分析
基于希爾伯特- 黃變換的去噪法在外測數據處理中的應用
基于時頻分析的逆合成孔徑雷達成像技術
基于瞬時對稱分量法的三相四線制D-STATCOM控制研究
對采樣數據序列進行時頻分解法的改進
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合