?

基于CEEMDAN-SVR的公路隧道運營短期能耗預測模型研究

2024-01-10 04:26付立家陳光勇
公路交通技術 2023年6期
關鍵詞:步長分量能耗

王 鈞, 付立家, 尚 康, 陳光勇

(1.甘肅省公路航空旅游投資集團有限公司, 蘭州 730030; 2.招商局重慶交通科研設計院有限公司, 重慶 400067;3.重慶交通大學 交通運輸學院, 重慶 400074; 4.山東省交通規劃設計院集團有限公司, 濟南 250101)

近10年來,我國公路隧道每年新增里程1 100 km以上,目前是世界上公路隧道規模最大、數量最多、地質條件和結構形式最復雜、發展速度最快的國家[1-2]。公路隧道是能源消耗大戶,打造綠色智慧公路隧道是未來的發展趨勢,也是實現雙碳目標中重要的環節[1,3-4]。公路隧道節能減排不僅要考慮公路隧道在規劃、設計、施工階段能源消耗量,還要重視運營階段能源消耗量。工作中主要通過對公路隧道短期能耗量進行預測,明確下階段能耗水平,在保障隧道運營安全的前提下,針對高能耗單元制定能源管控策略、運營調度計劃和養護方案,實現節能減排和安全出行目標,同時不斷優化形成能耗預測模型。

能耗預測模型研究大多數集中在建筑能耗領域,如周峰等[5]采用SVM模型對大型公共建筑能耗進行了預測,并診斷了異常能耗數據;曾國治等[6]構建了CNN與RNN組合預測模型,實現了對辦公建筑能耗的預測;竇嘉銘等[7]采用等權重和優勢矩陣方式組合GA-BP神經網絡、RBF神經網絡和廣義回歸神經網絡建立了綜合預測模型,實現了對建筑能耗的預測。在交通領域能耗預測研究較少,主要集中在車輛、軌道和宏觀區域能耗預測方面,如劉強等[8]提出電動公交車能耗灰色關聯投影-隨機森林(GRP-RF)預測模型,并通過實例分析驗證了模型的準確性;呂承舉等[9]建立了ARIMA的柴油客車能耗預測模型;楊臻明等[10]建立回歸模型對城市軌道交通能耗進行了預測,并預測了上海軌道交通5號年能耗,誤差在5%以內;呂歡歡等[11]分別采用SVR與RF預測模型對地鐵列車牽引能耗進行了預測。

綜上分析,既有研究主要針對道路服務車輛的能耗進行了研究,對交通服務設施能耗預測研究報道較少,為此,本文依托公路隧道基礎服務保障設施能耗,參考建筑能耗預測模型建立隧道機電系統短期能耗預測模型,填補路端能耗預測研究空缺,為隧道運營決策、節能減排和低碳環保提供數據支撐和保障。

1 基于CEEMDAN-SVR的短期能耗預測模型

1.1 CEEMDAN-SVR模型預測流程

由于隧道能耗數據樣本量小且噪點較多,導致單一模型難以提取潛在的時間趨勢特征,預測效果不佳,因此本文采用CEEMDAN模型將公路隧道能耗數據進行分解,得到若干本征模函數IMF分量和殘余分量Res,再利用SVR的非線性擬合能力對IMF和Res分量分別進行訓練、預測和集成合并,從而有效預測隧道短期能耗數據。CEEMDAN-SVR預測流程如圖1所示。該流程包括原始能耗數據預處理、CEEMDAN數據分解和CEEMDAN-SVR預測。數據預處理是對公路隧道原始能耗數據的異常值識別與剔除、缺失數據的修復、能耗數據的標準化、測試集和訓練集的劃分;CEEMDAN數據分解模型對預處理后數據進行分解,提取能耗數據潛在的時間特征;CEEMDAN-SVR預測處理是根據最優輸入步長、輸出步長和訓練數據集訓練最終預測模型,并通過測試集驗證模型的準確性和可靠性。

1.2 公路隧道能耗數據預處理

1) 四分位法剔除能耗異常數據

四分位法識別異常數據是根據實際能耗數據進行異常點識別,不考慮數據分布情況,直觀反映數據狀態。其判斷異常值的標準以四分位距為基礎,四分位數具有一定的耐抗性,多達25%的數據可變得任意遠而不會很大地擾動四分位數[12]。四分位數是將升序排列的樣本X=(x1,x2,…,xn)均分為4等份,其3個分割點分別記作Q1、Q2、Q3。四分位數計算步驟如下。

Step1:計算第2個四分位數Q2。

(1)

Step2:計算第1和第3個四分位Q1和Q3。

按照式(1)將數據劃分為2部分,再分別計算其

圖1 CEEMDAN-SVR模型預測流程

中位數,即為Q1和Q3,且Q1

(2)

當n=4k+3時,計算公式如下:

(3)

Step3:計算異常值內限。

根據四分位數計算四分位距IQR,從而確定數據樣本X中異常值的內限為[F1,F2],處于內限以外的數據會被判定為異常值。

[F1,F2]=[Q1-1.5IQR,Q3+1.5IQR]

(4)

式中:IQR=Q3-Q1。

2) KNN修復能耗缺失數據

KNN(K-Nearest Neighbor)算法修復缺失數據具有操作簡單、無需假設分布、可處理多變量關系的優勢。KNN是以歷史數據為依據,通過比較待修復數據與歷史數據的最近鄰的K個相似值,求其平均值作為缺失數據的修復值,其計算步驟如下。

Step1:剔除缺失數據與異常數據,構建樣本數量為n的完整矩陣X=(x1,x2,…,xn)。

Step2:計算缺失數據向量xq與完整數據向量xi的歐式距離。

(5)

Step3:計算修復數據的最近鄰權重值wi。

(6)

Step4:計算缺失的修復值。

(7)

3) Z-Score標準化能耗數據

對修復后能耗數據進行標準化處理,能夠消除能耗數據量級影響和分布差異,從而提高模型訓練速度和精度。本文運用Z-Score標準化處理能耗數據,由均值和標準差將原始數據轉換為標準正態分布,其計算公式如下:

(8)

式中:z表示標準化后的能耗數據;x表示剔除異常值和修復缺失值的能耗數據值;μ表示能耗數據的均值;σ表示能耗數據的標準差。

1.3 CEEMDAN能耗數據分解模型

集合經驗模態分解模型(CEEMDAN)是針對經驗模態分解(EMD)和集成經驗模態分解(EEMD)的不足而提出的一種噪聲輔助數據分析方法。EMD可將原始信號平穩化,提取信號中不同尺度的波動模式,生成一系列具有不同時間尺度局部特征的數據序列,即為本征模態函數(IMF)[13]。與傳統的EMD與EEMD相比,CEEMDAN分解模型在分解階段加入自適應的高斯白噪聲,以進一步消除模態效應,因此具有更為優異的收斂性與自適應性[14]。利用CEEMDAN對能耗數據處理步驟如下。

Step1:利用EMD算法計算第1階本征模態分量,取其平均值作為第1個模態分量I1(n)。

(9)

Step2:計算step1中1階殘量信號。

r1(n)=y(n)-I1(n)

(10)

Step3:對信號rk(n)+εkEk(ωi(n))通過step1~step2進行模態分解,得到Ik+1(n)分量。

(11)

Step4:重復上述步驟,直到殘量無法繼續分解,至多有一個殘量極值時停止分解,原始序列為y(n)可分解為k個模態分量Ii(n)與r(n)。

(12)

式中:操作符Ek(·)表示經EMD算法得到給定信號的第k個模態分量序列;ωi為第i次添加的正態分布的高斯白噪聲;εk用于控制第k個信號與噪聲之間的信噪比。

1.4 SVR回歸預測模型

支持向量機利用結構最小化原理來提高其泛化能力,能較好地解決高維數、非線性、局部極小等現實問題,適用于在有限樣本條件下刻畫隱變量與其眾多影響因素之間的非線性關系[15]。支持向量機回歸SVR(Support Vector Regression)是用于解決回歸問題的支持向量機。假設給定訓練數據集T={(X1,y1),(X2,y2),…,(Xn,yn)},對于單樣本(Xi,yi)計算SVR模型的預測值與真實值間誤差,即|f(Xi)-yi|>ε時,計算損失值,以線性SVR模型為例,其目標函數與約束條件如下:

(13)

為求解上述模型的最優解,通過拉格朗日函數將其轉化為對偶問題,并求解對偶問題,得到如下最優解:

(14)

1.5 性能評估指標

以均方根誤差(RMSE)計算SVR預測模型訓練過程中的損失值,表征預測值與真實值之間差異程度,計算公式如下:

(15)

以均方誤差(MAE)和平均絕對百分比誤差(MAPE)衡量能耗預測模型的精度。MAE衡量預測值和真實值之差的絕對值的平均值,MAPE衡量平均預測誤差與實際觀測值的相對大小,計算公式如下:

(16)

(17)

2 實例驗證

根據CEEMDAN-SVR模型預測流程,以濟萊高速公路蟠龍隧道的歷史能耗數據進行實例分析,其模型預測步驟包括能耗數據預處理、CEEMDAN分解能耗數據和CEEMDAN-SVR能耗預測模型,最后對比分析不同預測模型用于驗證CEEMDAN-SVR能耗預測模型的準確性和有效性。

2.1 實例數據

蟠龍隧道全長2 447 m,雙向6車道,是濟南境內最長的高速公路隧道。隧道機電設備的用電能耗數據采集時間段為2023.01.29—2023.07.13,每天采集頻率為24 h,該隧道為特長隧道,在隧道供配電方案設計中采用進出口端分開供電,因此采集電能數據分2部分,合并為隧道整體用電能耗,如圖2所示。

2.2 數據預處理結果

從圖2可知,采集的電能數據存在缺失值與異常值,需對原始數據集進行異常值識別、剔除和修復處理。因此采用箱型圖識別并剔除異常數據、KNN插補算法修復缺失數據、Z-Score標準化能耗數據,逐步預處理能耗數據,使其符合能耗預測模型數據要求。

(a) 進出口端用電量

(b) 總用電量

1) 通過式(1)~式(4)計算四分位數及異常值內限,其箱型圖參數見表1,異常數據識別效果如圖3所示;2) 根據箱型圖參數確定圖3中隧道能耗異常值的內限為[2 054.57,3 422.99],將處于內限以外的數據判斷為異常值;3) 從圖3中剔除4個異常數據,形成一組缺失數據;4) 由式(5)~式(7)構建KNN算法,并對異常數據和缺失數據進行修復處理,結果如圖4所示。

2.3 CEEMDAN分解結果

由式(9)~式(12)逐步分解預處理后的能耗數據,計算得到CEEMDAN模型分解的5個IMF分量和1個Res趨勢項,如圖5所示。其中IMF5只有一個極小值點,符合CEEMDAN分解的終止條件(至多有一個殘量極值時停止分解)。通過分析Res殘差分量來判斷CEEMDAN分解效果,Res殘差分量在±5×10-13kW·h范圍內波動,分解剩余殘量的能量較小,表明能耗數據可較為完全地分解為IMF1~IMF5,分解效果較好。由于添加了自適應噪聲,克服了EEMD的殘量過大缺陷,同時避免了EMD模態混疊問題。

表1 箱型圖參數

圖3 異常能耗數據識別

圖4 異常、缺失數據修復

(a) IMF1分量分解結果

(b) IMF2分量分解結果

(c) IMF3分量分解結果

(d) IMF4分量分解結果

(e) IMF5分量分解結果

(f) Res分量分解結果

2.4 CEEMDAN-SVR預測結果分析

1) 模型輸入步長分析

為探究不同步長對CEEMDAN-SVR預測模型精度的影響,分別構建輸入步長為1 d~14 d和輸出步長為1 d的訓練數據集和測試數據集,在訓練集上進行訓練,測試集上輸出預測結果,并計算整體RMSE,如圖6所示。

圖6 不同步長預測結果

從圖6可知,時間步長為7 d時,CEEMDAN-SVR預測模型的最優輸入步長為7 d,即以前7 d能耗數據進行預測。

2) 模型輸出步長分析

為驗證本文能耗預測模型在不同輸出步長下的能耗預測精度,分別構建輸入步長為7 d和輸出步長為1 d~7 d的訓練數據集和測試數據集,在訓練集上進行訓練,測試集上輸出預測結果,并計算整體RMSE,見表2。

表2 多步長預測結果分析

從表2模型性能指標可知,隨著預測時間長度增加,CEEMDAN-SVR模型預測精度指標逐級下降,由于能耗數據的不確定性和隨機性波形,SVR模型難以捕捉中長期數據波動的依賴,導致模型準確率下降。而在短期能耗預測中,SVR模型利用輸入特征(前7 d能耗數據)與目標變量(未來1 d能耗數據)之間的關系,識別出能耗數據潛在的趨勢、季節性或周期性模式,并據此獲得高精度預測模型。

3) 模型預測結果分析

將各分量的能耗數據集劃分為訓練集和驗證集,分別應用SVR模型在訓練集上進行訓練,在測試集上輸出各分量預測結果,并集成加和整體能耗預測結果,最后輸出預測結果的性能指標MAE,如圖7所示。從圖7(a)可知,在測試集上預測能耗曲線總體上擬合于原始曲線,以均方誤差衡量單點擬合效果。從圖7(b)可知,最大誤差為63.78 kW·h,最小誤差為1.31 kW·h,且大部分擬合數據點誤差在30 kW·h以下。以MAE評估測試集整體預測水平,其值為18.452 8 kW·h,擬合效果較好。

(a) CEEMDAN-SVR模型擬合效果

(b) CEEMDAN-SVR模型預測誤差

4) 不同預測模型結果分析

為驗證模型的有效性和準確性,選取單模型移動平均模型(MA)、長短時記憶模型(LSTM)、門控循環單元(GRU)、隨機森林(RF)、支持向量機回歸(SVR),組合模型CEEMDAN-LSTM、CEEMDAN-GRU、EMD-SVR、CEEMDAN-RF與本文的CEEMDAN-SVR預測模型進行對比分析,以RMSE、MAE和MAPE指標對比各模型在測試集上預測結果,見表3。MAE指標反映預測值與真實值之間平均絕對差異程度,它能更好地反映模型預測的實際誤差情況,因此,以MAE指標為主、MAPE指標為輔評估模型預測精度與擬合效果。

表3 不同模型預測性能對比分析

從表3可知,無論是與單模型還是組合模型進行對比,本文所提出的CEEMDAN-SVR模型在RMSE、MAE和MAPE指標上均取得最優預測精度。

LSTM、GRU、RF、SVR四種單一模型預測精度不高,在使用CEEMDAN算法對預處理后數據進行分解,CEEMDAN-LSTM、CEEMDAN-GRU、CEEMDAN-SVR較單一模型的MAE分別提高了49.13%、11.55%、67.55%,驗證了分解模型能夠有效提升模型精度。

SVR模型對能耗預測準確率不佳,以EMD分解模型與SVR模型組合預測,在MAE指標下,EMD-SVR較SVR單模型預測精度提升57.8%。而以CEEMDAN替換EMD構建CEEMDAN-SVR模型,模型精度進一步提升23.1%。結果表明CEEMDAN能最大程度提升SVR預測模型的準確率。

3 結論

1) 基于CEEMDAN分解模型和SVR預測模型,能夠實現對公路隧道短期能耗數據的準確預測。

2) 基于公路隧道能耗原始數據,構建數據預處理方法(異常數據識別與剔除、缺失數據修復和標準化能耗數據處理),從一定程度上提高預測模型的泛化能力和預測精度。

3) 通過濟萊高速公路蟠龍隧道的實例數據,應用CEEMDAN-SVR預測模型,以RMSE衡量預測模型的輸入最優時間步長與輸出最優時間步長,結果表明,在輸入步長為7和輸出步長1的條件下,模型預測的精度最佳。

4) 選取時間序列預測模型和數據分解模型進行對比分析,驗證不同分解模型與預測模型的擬合效果,結果表明:基于CEEMDAN-SVR模型預測效果最佳,相較LSTM、GRU、RF單模型,預測效果分別提升76.77%、74.77%、67.82%、21.59%,相較SVR、EMD-SVR模型,CEEMDAN-SVR模型預測效果分別提升67.55%、23.1%。

猜你喜歡
步長分量能耗
120t轉爐降低工序能耗生產實踐
能耗雙控下,漲價潮再度來襲!
基于Armijo搜索步長的BFGS與DFP擬牛頓法的比較研究
帽子的分量
探討如何設計零能耗住宅
日本先進的“零能耗住宅”
論《哈姆雷特》中良心的分量
分量
基于逐維改進的自適應步長布谷鳥搜索算法
基于瞬時對稱分量法的三相四線制D-STATCOM控制研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合