?

融合周期變化和多尺度特征的組合模型園區能耗預測

2024-02-20 06:48梁文建石衛兵韓玉穩戴峰馬亞文
關鍵詞:能耗卷積園區

梁文建 石衛兵 韓玉穩 戴峰 馬亞文

1.中車青島四方機車車輛股份有限公司 山東 青島 266000

2.云南省機電一體化應用技術重點實驗室 云南 昆明 650031

3.南通市中央創新區建設投資有限公司 江蘇 南通 226010

4.元始智能科技(南通)有限公司 江蘇 南通 226010

世界范圍內的建筑能耗已超越了工業、交通等領域,世界各國的建筑能耗普遍約為33%[1]。我國建筑能耗已達到全國總能源消費的三分之一,工業園區能耗作為建筑能耗的主要組成部分,園區能源消耗精準預測對園區節能有著重要作用。目前,園區能耗預測模型方法主要分為兩種,一種是工程模型或正演模型,另一種是基于數據驅動模型。技術建模使用物理和熱力學函數來量化理論過程和系統的能耗。技術模型可提供精確的結果,但也需要詳細的輸入數據[2]。

數據驅動模型,其目的是能在缺少園區物理參數的情況下對園區能耗進行預測,是通過過去的數據以此來建立能耗數據驅動模型。當前,廣泛使用的機器學習方法有支持向量回歸(Support Vector Recovery, SVR)[3]、人工神經網絡(ANN)[4]和梯度漸進回歸樹(GBRT)等。然而,大多數機器學習方法用來降低數據的復雜性是需要大量的人為操作進行特征提取。

隨著數據規模的不斷擴大和技術不斷發展,基于數據驅動的模型正逐步從淺層向深層過渡[5],即在多層網絡中直接從數據中進行特征提取。與傳統的機器學習方法相比,深度學習的預測準確率隨訓練樣本數量的增加而持續提升[6]。在能源預測領域,循環神經網絡(RNN)和長短期記憶網絡(LSTM)等模型目前在園區能耗預測中占主導地位,而卷積神經網絡(CNN)則較少使用,因為CNN更能捕捉局部特征,能有效學習到影響園區能耗的變量之間的非線性關系。

針對目前園區能耗預測方法存在的問題和兩種模型各存在的不足和各自的優勢,本文提出了一種基于CNN-LSTM聯合模型的園區能耗融合預測模型。具體來說,這個聯合模型是用來對數據進行平穩分析的,再將數據輸入到ARIMA預測模型,得到一組預測值;將經過預處理的數據進行特征構造得到處理后的數據,然后用CNN-LSTM聯合模型對其進行擬合,獲得了預測結果。在此基礎上,利用卷積神經網絡的預測精度與ARIMA擬合趨勢的一致性,對預測結果進行加權融合,實現能耗融合預測的目的。為了驗證所提預測模型性能的有效性,本文利用某高鐵制造工業園區動力柜輸出用電數據進行實驗。實驗結果表明,本文提出的融合預測模型在能耗預測準確率方面均高于ARIMA模型和CNN-LSTM模型。本文的主要貢獻可以概括為:(1)將CNN和LSTM兩種算法結合起來,同時提取局部關聯特征和時序特征,實現更可靠的園區能耗預測;(2)采用stacking集成學習的模式,將深度學習預測結果與ARIMA預測結果進行融合;(3)利用深度學習模型預測的準確率和ARIMA擬合趨勢的吻合度進行權重分配。

1 模型原理

整體結構分成四個部分,第一部分是數據采集;第二部分是數據處理,對采集到的原始數據進行處理,該數據為本文實驗數據;第三部分是模型構建,第四部分給出了本文所建模型的預測結果。

1.1 卷積神經網絡

CNN通過處理輸入數據的局部相關性可以避免過多的參數模型,而卷積操作最重要的特點之一就是權值共享。

通常用全連接層、池化層和卷積層構成CNN。其中,卷積層的主要作用是從輸入數據中提取有用的信息,通過卷積核對數據進行特征提取,形成特征映射圖。

1.2 長短期記憶網絡

長短期記憶網絡(LSTM)是一種能夠學習并記憶序列長期信息的遞歸模型。LSTM的核心是由三個存儲單元組成,每一次都可以對輸入信息進行編碼。其運算公式如下所示,

其中x表示輸入向量,h表示輸出向量,⊙表示點乘運算符,矩陣表示待訓練參數。σ(·)表示sigmoid非線性函數,tanh(·)表示雙曲正切函數。

差分自回歸移動平均模型

差分自回歸移動平均模型(ARIMA)是時間序列預測常用的一種模型。ARIMA模型將時間序列數據默認為一組隨機序列,是非平穩的數據經過差分后趨于平穩,轉換為平穩的時間序列,并對以往數據間的線性關系構建模型,以預測數據未來值。ARIMA(p, d, q)模型的表現形式為:

式(2)中,yt為當前預測值,μ為常數項,p為自回歸的階數,q為移動平均的階數,tε為隨機擾動項序列。

1.3 CNN-LSTM預測模型

針對園區能耗預測領域,在CNN模型中,可通過卷積核構成高維特征;在LSTM預測模型中,LSTM模型有輸入門it、輸出門ot、和忘記門ft,信息流ct;CNN-LSTM組合模型是混合模型,分為兩層,第一層采用CNN網絡;第二層采用LSTM模型。CNN模型接受訓練數據的輸入,提取特征信息,最后輸出預測結果,將預測結果輸入到后端LSTM模型中,LSTM再對輸入進行訓練??梢蕴嵘W絡的非線性映射能力,同時避免過擬合。

1.4 SCLA融合預測模型

融合預測模型(Stacking CNN-LSTM ARIMA,SCLA)是將ARIMA預測模型和CNN-LSTM預測模型結合起來,在有限的數據上,提高模型的預測能力。該模型主要包含基于ARIMA模型預測、CNN-LSTM模型預測以及融合預測三個階段。

圖1 融合預測模型

2 數據表示和處理

2.1 數據集選擇

本文選擇了某高鐵制造工業園區動力柜用電2022年8月9日到2022年8月23日共358個電表讀數作為數據集,來進行訓練和測試。將2022年8月9日到2022年8月22日的數據作為訓練集,2022年8月23日的數據作為測試集。

2.2 異常值清洗

異常值是指在樣本中明顯偏離其他數值的樣本點,這些異常值與其他數據點相比具有顯著的差異。本文使用箱線圖對異常值進行處理。

2.3 模型評估指標

為了更好地評估模型的預測結果,本文選擇三個性能指標,利用均方誤差(MSE)、平均絕對誤差(MAE)和平均絕對百分比誤差(MAPE),以評估和比較模型的預測能力。MSE是真實值與預測值的差值的平方然后求和平均;MAE揭示誤差絕對值的均值情況;MAPE是統計預測準確性的一種方法。以上三類誤差均實數值越小表示模型預測效果越好。其方程如下

其中,表示預測值,yi表示真實值。

3 實驗分析

3.1 實驗數據處理

本文使用某高鐵制造工業園區電表讀數作為數據源,且需要對其進行處理,計算出其每小時的用電量。

3.2 箱線圖異常檢測結果

本文使用箱線圖檢測異常數據,其結果如圖2所示。從圖7中可以發現,數據集中各個時間段均存在異常值的情況,對于所檢測出的異常值,采用刪除異常值的方式進行處理。

圖2 異常數據檢測

3.3 ARIMA參數選擇

為了確定ARIMA模型的結束,本文應用AIC準則確定最終模型的階數。AIC準則是由日本統計學家Akaike提出的,該準則要求選擇使下式最小化的模型:

計算p,q取不同的值得到的ARIMA模型的AIC值,最小AIC值對應的p,q即為最優參數。本文所用ARIMA模型的最優階數是(3,0,4)。

3.4 模型預測效果對比

為了驗證本文所提模型的有效性和可行性,與ARIMA算法和CNN-LSTM算法進行對比分析。幾種模型的評估指標如下表所示:

從表1可知,本文所提SCLA模型的MSE指標、MAE指標和MAPE指標均低于ARIMA算法和CNN-LSTM算法。

表1 模型評估指標

為了更好的對比三種模型的預測效果,三種模型的預測結果的預測結果如圖3所示。

圖3 預測結果對比

由圖3可知,本文所提的融合模型SCLA的預測曲線更加平滑,相較于ARIMA模型和CNN-LSTM模型其預測結果更接近真實值,預測效果更好。

綜上,根據三個模型的預測結果和評估指標對比可以看出,本文所提SCLA融合模型預測的整體趨勢和真實值更吻合,特別是在峰值處的預測值和真實值十分貼近,預測效果更好。

4 結語

本文建立了基于ARIMA和CNN-LSTM融合模型的園區能耗預測模型利用高鐵制造工業園區能耗實測數據進行驗證和分析,并得出以下結論:

(1)利用ARIMA預測模型對數據進行平穩性檢測,并利用箱線圖檢測并刪除異常值得到了有利于能耗預測的平穩、完整的實驗數據。

(2)提出了CNN-LSTM組合模型,利用卷積神經網絡對提取局部關聯特征的能力以及長短期記憶網絡學習時序特征的能力進行能耗預測,以實現深度學習在預測公園能耗方面的重要性。

(3)提出了一種新的改進算法,該算法將ARIMA和CNN-LSTM預測進行了校準,該算法充分利用了周期性趨勢的優勢,使之能更好地反映實際的變化趨勢。實驗結果顯示,本文所提模型相較于ARIMA和CNN-LSTM的預測精度都大幅度提高。

猜你喜歡
能耗卷積園區
120t轉爐降低工序能耗生產實踐
能耗雙控下,漲價潮再度來襲!
基于3D-Winograd的快速卷積算法設計及FPGA實現
探討如何設計零能耗住宅
蘇通園區:激蕩開放潮 十年再出發
從濾波器理解卷積
園區的開放樣本
日本先進的“零能耗住宅”
從園區化到國際化
基于傅里葉域卷積表示的目標跟蹤算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合