?

基于GRA-NARX神經網絡的泵站站前水位預測模型

2022-11-11 01:33劉曉偉哈明虎雷曉輝張召
南水北調與水利科技 2022年4期
關鍵詞:泵站水位神經網絡

劉曉偉,哈明虎,雷曉輝,,張召

(1.河北工程大學水利水電學院,河北 邯鄲 056038;2.河北省智慧水利重點實驗室,河北 邯鄲 056038;3.中國水利水電科學研究院,北京 100038)

進行長距離輸水調度時,常在渠道中設置泵站等水工建筑物,以解除地形條件對輸水限制的影響。泵站在運行過程中需保持水位平衡,避免出現水位大幅上升或下降等問題。若水位隨時間發生較為急劇的變化,不僅可能造成泵站間棄水,甚至可能導致供水破壞或者引起整個系統的水力振蕩[1]。因此,對水位信息進行處理,建立合適的泵站水位預測模型,尤其是泵站站前水位預測模型,對泵站調控、水量調度、建筑物安全等都具有重要意義。

泵站站前水位預測的方法有很多種,包括基于物理機理的水位模擬和基于機器學習的水位預測等?;谖锢頇C理的水位模擬[2-3],主要以圣維南方程為控制方程的水動力模型模擬一維渠道水流為主,需要研究區較為完整的資料,因此這種方法的使用存在一定局限性。機器學習方法包括向量機RVM(relevance vector machine)模型[4]、灰色系統GM(1,1)(grey model)模型[5]、多元線性回歸模型[6]、神經網絡模型[7-20]等,其中向量機RVM模型、灰色系統GM(1,1)模型、多元線性回歸模型等的優點是適用復雜的預測任務,缺點是這些方法的預測精度有待提高。近年來,隨著人工智能技術的發展,神經網絡在泵站水位預測中取得了較好的效果,其中應用較為廣泛的是BP神經網絡。不過,BP神經網絡雖然能夠進行非線性擬合,但不具備反饋記憶功能。NARX(nonlinear auto-regressive model with exogenous inputs)神經網絡是CHEN等[21]基于線性回歸模型提出的一種非線性有源網絡結構,擁有輸入延遲和反饋記憶功能,能夠更好地對復雜的多輸入、多輸出系統進行逼近模擬。目前NARX神經網絡主要用于渠道流量預測、地下水位預測、旱澇預測等,如:EZZELDIN等[22]利用NARX神經網絡對灌溉渠道的分水流量進行了預測,預測結果優于RBF、CFD、FFBP模型;WUNSCH等[23]利用NARX神經網絡對德國西南部6眼觀測井的地下水位進行預測,預測結果好;WANG等[24]利用NARX神經網絡對長江流域旱澇進行預測,最后成功預測數據缺口期間的洪水事件;范哲南等[25]針對大壩變形時間序列的非線性及形變值累計特性,引入NARX神經網絡進行分析并實現變形預測,且預測結果比BP神經網絡好。然而,基于NARX神經網絡的泵站站前水位預測模型相對較少。同時,應用NARX神經網絡對時間序列預測時,使用的訓練算法大多為Levenberg-Marquardt(LM),而很少對其他算法進行分析,也很少有NARX模型在時間延遲方面的探索。此外,不管采用何種預測模型,第一步可考慮篩選影響因子,這樣可降低預測的復雜度并保證預測的精度。本文利用灰色關聯分析(GRA)和NARX神經網絡的各自優勢,構建一種新的基于GRA-NARX神經網絡的泵站站前水位預測模型,利用BR、LM、SCG等3種訓練算法及不同時間延遲分別給出密云水庫調蓄工程屯佃泵站站前水位的2 h預測結果,將模型預測結果與NARX模型和GRA-BP模型進行比較分析,并評估3種訓練算法及不同時間延遲對預測精度的影響。

1 基于NARX神經網絡的泵站站前水位預測模型

NARX神經網絡的全稱是帶有外部輸入的非線性自回歸神經網絡。它是一種有效的時間序列預測技術,是動態神經網絡中的一類。泵站站前水位預測的NARX神經網絡拓撲結構見圖1,包括輸入層、隱含層、輸出層等。輸入層向量為泵站當前時刻站前水位信息的影響因子,具體影響因子需經篩選后獲得,輸出層向量為泵站當前時刻站前水位信息。

圖1 NARX神經網絡結構Fig.1 Structure of NARX neural network

基于NARX神經網絡的泵站站前水位預測模型可表示為

式中:f為非線性函數;x(t)表示泵站當前時刻站前水位信息的影響因子,為輸入變量;y(t)表示泵站當前時刻站前水位信息,為輸出變量;d表示時間延遲。y(t)可由x(t)的前d個值和y(t)的前d個值,通過非線性映射得到。輸入層有n個神經元,網絡輸入為x1,x2,…,x n,各層輸出的計算公式為

式中:x i表示神經元的輸入;w ij表示層與層之間的權重;bj表示該層的閾值;f(f為f1,f2)表示激活函數。

2 基于GRA-NARX神經網絡的泵站站前水位預測模型

2.1 水位監測數據清洗與插補

受設備故障、天氣變化、人為干預等多種因素的影響,水情信息在采集過程中不可避免地會出現異常值。為保證預測的精度,首先需要對水情信息進行清洗。箱形圖法作為一種檢驗樣本中異常值的常用方法,與正態分布的拉依達準則、Z分數法、格拉布斯法等不同,它適用范圍廣,可以應用到不服從正態分布的樣本數據中[26]。

箱形圖中包含5個重要數據統計點,分別是被分析數據集的下四分位數S1、中位數S2、上四分位數S3、下限值、上限值。上、下四分位數之間的距離被稱為四分位距RIQ,上、下限值可分別用S3+1.5RIQ和S1-1.5RIQ表示,見圖2。在圖2中,分布在上、下限值以外的點即為箱形圖識別出的異常值。檢測出異常值后將其剔除,并對其和原有空值進行插補。

圖2 箱形圖Fig.2 Boxplot

2.2 水位信息的主要影響因子篩選

泵站當前時刻的站前水位信息往往受上、下游一定區域內前一個或多個時刻的斷面水位、泵站流量、泵站間流量差等多種因素的影響。這些因素對水位信息的影響程度不同,存在主次影響因子。為降低預測的復雜度并保證預測的精度,只考慮主要影響因子。GRA是一種分析系統中各因素關聯程度的量化方法,對樣本數量多少無嚴格要求,數據也無須有典型的分布規律,具有廣泛的適用性。具體步驟:

第一步 確定比較數列和參考數列。以被預測泵站當前時刻站前水位信息作為參考數列,泵站當前時刻站前水位信息的影響因子作為比較數列,比較數列有m個,評價指標有n個,參考數列為x0={x0(k)|k=1,2,3,…,n},比較數列為x i={xi(k)|k=1,2,3,…,n},i=1,2,3,…,m

第二步 對參考數列和比較數列數據進行無量綱化處理。

第三步 計算參考數列與比較數列的灰色關聯系數?;疑P聯系數計算公式為

式中:ρ為分辨系數,取值區間為(0,1)。一般情況下,分辨系數ρ越大,分辨率越大;分辨系數ρ越小,分辨率越小。當ρ=0.546 3時,分辨率最好,通常取ρ=0.5。

第四步 計算參考數列與比較數列的灰色關聯度。

第五步 將灰色關聯度按照大小進行排序,ri越接近1說明比較數列對參考數列的影響程度越高:當灰色關聯度小于0.6時,認為兩個數列無關;若灰色關聯度大于0.8時,則認為兩個數列的相關性很好。

2.3 GRA-NARX神經網絡預測模型確立

GRA-NARX神經網絡預測模型確立:首先對水位信息利用箱形圖法進行清洗,采用均值填充法進行插補;然后利用GRA法確定當前時刻、當前位置處的水位信息的主要影響因子;最后將主要影響因子輸入NARX神經網絡,確定NARX神經網絡的訓練算法、時間延遲、輸入層隱含層神經元個數等,進行網絡訓練?;贕RA-NARX神經網絡的泵站站前水位預測模型流程見圖3。

圖3 基于灰色關聯分析的NARX神經網絡模型流程圖Fig.3 Flow chart of NARX neural network model based on grey correlation analysis

2.4 預測結果評判標準

采用的評價標準為均方誤差MSE、均方根誤差RMSE和相關系數R。均方誤差MSE和均方根誤差RMSE反應的是預測值偏離實際值的程度,MSE和RMSE越小,表明預測效果越好。相關系數R反應的是預測值與實際值之間的相關程度,R越接近1相關程度越高。

式中:EMS為MSE值;ERMS為RMSE值;y i和f i為水位實測值和水位預測值;ˉy i和ˉf i為水位實測平均值和水位預測平均值;m為數據列長度。

3 實例應用

3.1 區域概況與研究對象

密云水庫調蓄工程于2015年5月投入運行,用以提高北京市水資源戰略儲備和城市供水率。該工程從頤和園內的團城湖取水,經9級泵站加壓,輸送至密云水庫(圖4),工程總長103 km,總揚程132.85 m。前6級泵站分別建在屯佃閘、柳林倒虹吸、埝頭倒虹吸、興壽倒虹吸、李史山節制閘和西臺上跌水節制閘旁,串聯京密引水渠輸水至懷柔水庫,不設調蓄工程,輸水流量為20 m3/s。后3級泵站從郭家塢泵站到溪翁莊泵站,全長約31 km,包括8 km原京密引水渠道、22 km直徑2.6 m的單排PCCP管道和約800 m的鋼管管道,后3座加壓泵站輸水規模為10 m3/s。

圖4 密云水庫調蓄工程示意圖Fig.4 Schematic diagram of Miyun reservoir storage project

本文研究對象為整個復雜輸水系統的第一級密云水庫調蓄工程屯佃泵站,該站位于海淀區京密引水渠屯佃節制閘北側,為渠道直接提升泵站,與屯佃節制閘配合運用,設計揚程1.71 m;距離上一個控制節點團城湖北閘8.1 km,沿程主要建筑物有安河揚水閘、農大分水閘、東干分水閘、北干分水閘、回民公墓揚水閘、五一分水閘、韓家川揚水閘、崔家窯分水閘和宏豐分水閘等;距離下一個控制節點前柳林泵站9.5 km,沿程經冷泉橋上揚水閘、太舟塢分水閘、三星莊分水閘、溫泉倒虹吸、北安河揚水閘、前柳林倒虹吸等。水流條件十分復雜,水位預測難度較大。

3.2 水位監測數據清洗與插補

選取屯佃泵站2016年3月11日至2016年11月10日的2 868個站前水位實測值為監測數據,數據的時間間隔為2 h。按照2.2描述的步驟,利用箱形圖法對數據進行清洗,其中,上四分位數為49.2,下四分位數為49.07,上限值為49.395,下限值為48.875,分布在上、下限值以外的點即為識別出的異常值,累計識別到20個異常值,見表1,再對異常數據和原有的空值利用均值填充法進行插補。

表1 監測數據中的異常值Tab.1 Outliers in monitoring data

3.3 水位信息的主要影響因子篩選、樣本選擇

考慮當前時刻的站前水位可能會受到上一個時刻的流量、上一時刻站前水位、上一時刻站后水位、上一時刻上一站閘前水位、上一時刻上一站閘后水位等因素的影響。以屯佃泵站當前時刻站前水位作為參考數列,比較數列為上一時刻(兩小時前)的已知值,共包括5個:r1表示屯佃泵站上一時刻流量;r2表示屯佃泵站上一時刻站前水位;r3表示屯佃泵站上一時刻站后水位;r4表示團城湖末端上一時刻閘前水位;r5表示團城湖末端上一時刻閘后水位。選取清洗好的2 868個監測數據作為分析序列,對數據進行無量綱化處理,消除量綱與單位的差異,按照2.2描述的步驟進行計算,結果見表2。影響因子相關性排序從高到低依次為:屯佃泵站上一時刻站前水位;屯佃泵站上一時刻站后水位;屯佃泵站上一時刻流量;團城湖末端上一時刻閘后水位;團城湖末端上一時刻閘前水位。選擇灰色關聯度大于0.8的影響因子為主要影響因子。

表2 各影響因子與當前時刻泵前水位的灰色關聯度Tab.2 Grey correlation grade between each influence factor and the water level in front of the pumping station at the current time

因此,將屯佃泵站上一時刻站前水位、站后水位這兩個主要影響因子作為神經網絡模型的輸入量,以屯佃泵站當前時刻站前水位作為NARX神經網絡模型訓練階段的輸出量,待預測量為屯佃泵站下一時刻(兩小時后)站前水位。

3.4 預測模型構建

3.4.1 GRA-NARX模型

將利用灰色關聯分析篩選出的主要影響因子作為神經網絡模型的輸入量,屯佃泵站當前時刻站前水位作為輸出量,由NARX神經網絡模型對數據序列進行訓練和檢驗。由于目前沒有成熟的理論為輸入數據的劃分比例、神經元個數、隱含層和輸出層的轉移函數、最大迭代次數等提供依據,故根據經驗及試錯法,確定輸入數據劃分比例為70∶15∶15,它們依次是訓練集、驗證集和測試集,神經元個數為20,隱含層和輸出層的轉移函數分別為“tansig”和“purelin”,最大迭代次數1 000,學習率10-3,其他參數設置為默認值。

3.4.2 GRA-BP模型

為了比較不同的神經網絡對相同輸入的影響,GRA-BP神經網絡的輸入因子與輸出因子、輸入數據劃分比例、隱含層神經元個數、隱含層和輸出層的轉移函數等均與GRA-NARX神經網絡一致,不同的是GRA-NARX神經網絡的輸出會反饋到下一個時刻的輸入。

3.4.3 NARX模型

NARX模型的輸入因子為屯佃泵站上一時刻流量、屯佃泵站上一時刻站前水位、屯佃泵站上一時刻站后水位、團城湖末端上一時刻閘前水位、團城湖末端上一時刻閘后水位,輸出因子為屯佃泵站當前時刻站前水位,輸入數據劃分比例、隱含層神經元個數、隱含層和輸出層的轉移函數等均與GRANARX神經網絡一致。

3.4.4 訓練算法

采用3種訓練算法對GRA-NARX模型、GRABP模型和NARX模型進行研究。第一種訓練算法是LM,它收斂速度快,且收斂速度穩定,廣泛應用于神經網絡的時間序列預測;第二種訓練算法是BR(bayesian regularization),一般情況下,LM算法速度快,而BR算法在復雜問題上效果更好;第三種訓練算法是SCG(scaled conjugate gradient),它是一種用于解決大型線性方程系統問題的迭代算法,收斂速度介于前兩者之間。

3.5 結果分析

表3為3種訓練算法的GRA-NARX模型和NARX模型不同時間延遲的預測結果。由表3可知:GRA-NARX-BR模型(訓練算法為BR的GRANARX神經網絡)比NARX模型的預測結果好;不同的時間延遲下,均是GRA-NARX-BR模型下的相關系數最高,均方誤差和均方根誤差最??;在GRA-NARX-BR模型中,隨時間延遲的增加,相關系數基本相當,均方誤差和均方根誤差越來越小,訓練時長越來越長。

表3 3種訓練算法的GRA-NARX模型和NARX模型不同時間延遲的預測結果Tab.3 Prediction of GRA-NARX model and NARX model of three training algorithms with different time delays

圖5為GRA-NARX模型和GRA-BP模型在不同訓練算法下實測值與預測值散點圖。由于GRA-NARX模型的訓練時長會隨著時間延遲的增加而增加,設置時間延遲為6,與GRA-BP模型對比。當訓練算法為BR時,GRA-NARX模型的R值為0.986 62,GRA-BP模型的R值為0.956 03;當訓練算法為LM時,GRA-NARX模型的R值為0.978 67,GRA-BP模型的R值為0.970 02;當訓練算法為SCG時,GRA-NARX模型的R值為0.969 13,GRA-BP模型的R值為0.946 71。由此看,3種訓練算法下的GRA-NARX模型,相關系數均優于GRA-BP模型,GRA-NARX-BR最優。

圖5 不同訓練算法的2種神經網絡實測值與預測值散點圖Fig.5 Scatter plots of measured and predicted values for two neural networks with different training algorithms

表4為GRA-NARX模型和GRA-BP模型在不同訓練算法下的均方誤差和均方根誤差,GRANARX模型的時間延遲設置為6。結果顯示:當訓練算法為BR時,GRA-NARX模型的均方誤差為1.348 4×10-4,均方根誤差為0.011 61,GRA-BP模型的均方誤差為8.741 6×10-4,均方根誤差為0.029 57;當訓練算法為LM時,GRA-NARX模型的均方誤差為3.855 1×10-4,均方根誤差為0.019 63,GRA-BP模型的均方誤差為9.584 1×10-4,均方根誤差為0.030 96;當訓練算法為SCG時,GRA-NARX模型的均方誤差為3.922×10-4,均方根誤差為0.019 80,GRA-BP模型的均方誤差為9.978 1×10-4,均方根誤差為0.031 59。以上分析說明,GRA-NARX模型的均方誤差和均方根誤差比GRA-BP模型的均方誤差和均方根誤差都小,GRA-NARX-BR模型的均方誤差和均方根誤差最小。

表4 2種模型不同訓練算法的均方誤差和均方根誤差Tab.4 Mean square errors and root mean square errors for two models of different training algorithms

4 結 論

本文利用灰色關聯分析(GRA)和NARX神經網絡的各自優勢,構建了一種新的基于GRANARX神經網絡的泵站站前水位預測模型,利用BR、LM、SCG等3種訓練算法及不同時間延遲分別給出了密云水庫調蓄工程屯佃泵站站前水位的2 h預測結果,將模型預測結果與NARX模型和GRA-BP模型進行比較,并評估了3種訓練算法及不同時間延遲對預測精度的影響,得到如下結論:

基于GRA-NARX神經網絡的泵站站前水位預測模型模型可降低預測的復雜度并保證預測的精度,具有廣泛的適用性,能夠很好地對復雜的多輸入、多輸出系統進行逼近模擬,模型適用調水工程的數據情況,相關系數最高達0.986 62,均方根誤差最小為0.008 6 m。

3種訓練算法下的GRA-NARX模型中,訓練算法為BR的GRA-NARX神經網絡(GRANARX-BR模型)能夠高精度預測屯佃泵站站前水位,表現最好,相關系數最高,均方誤差最小,預測精度高于NARX模型和GRA-BP模型,所提模型可作為其他泵站站前水位預測替代模型。

在GRA-NARX-BR模型中,隨著時間延遲的增加,相關系數基本相當,均方誤差越來越小,訓練時長越來越長。

由于影響密云水庫調蓄工程梯級泵站水位變化的因素比較多,今后將進一步考慮模型輸入的復雜性和多樣性對預測結果的影響。此外,如何更科學的選取模型參數也是下一步需要研究的工作。

猜你喜歡
泵站水位神經網絡
基于神經網絡的船舶電力系統故障診斷方法
基于人工智能LSTM循環神經網絡的學習成績預測
MIV-PSO-BP神經網絡用戶熱負荷預測
農業用中小型泵站運行存在問題及發展對策
一體化泵站在農田灌溉排水中的應用研究
雷波RMI泵站大修的技術控制點探析
三次樣條和二次刪除相輔助的WASD神經網絡與日本人口預測
泵站運行調度中的計算機技術
七年級數學期中測試題(B)
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合