?

水文水資源領域深度學習研究進展綜述

2021-12-09 02:17劉攀鄭雅蓮謝康韓東陽程潛
人民長江 2021年10期
關鍵詞:水文水資源數據挖掘深度學習

劉攀 鄭雅蓮 謝康 韓東陽 程潛

摘要:現代水文監測技術的迅猛發展產生了海量的水雨情數據,為深度學習理論助力水文水資源領域的研究和生產實踐帶來了機遇與挑戰。從水文模擬、水資源管理、水環境評價3個方面開展文獻調研,綜述了水文水資源領域的深度學習研究進展。歸納了深度學習方法的優勢及應用難點:無需構建物理模型并可深度挖掘數據特征,在物理機制不明晰的問題中具有顯著優勢;但在應用時存在模型訓練數據缺乏、超參數確定具有主觀性、可解釋性不足、與物理規律不符及泛化能力不足等難點問題。展望了可通過有機結合深度學習與水文物理機制模型,以融合經典水文規律,并開展遷移學習、強化學習以及對抗學習等應用研究,以更好地在水文資源領域探索運用深度學習方法。

關鍵詞:水文水資源; 深度學習; 數據挖掘; 數據驅動模型; 物理機制模型

中圖法分類號: P33

文獻標志碼: A

DOI:10.16232/j.cnki.1001-4179.2021.10.012

0引 言

水災害頻發、水資源短缺、水環境污染是水文領域長期面臨的難題。為此,國際水文科學協會(IAHS)于2013年7月啟動了“Panta-Rhei”十年科學計劃,目標是集成信息與經驗以解決全球水資源所帶來的難題[1]。因此,如何利用現有數據信息為水文領域提供決策建議,已成為研究熱點問題。

近些年,隨著無人機、衛星、雷達、無線傳感器等技術及安全監控系統的發展,“空-天-地”一體化智能監測信息系統逐步建立,水文領域擁有了海量的水雨情信息[2],通過建立輸入信息與輸出信息的映射關系,數據驅動模型逐漸成為物理模型的一種替代方法。數據驅動模型中的深度學習方法具有自動捕獲數據特征及分布的能力[3],在眾多領域的模擬、評價以及調控等方面廣泛應用,但在水文水資源領域,深度學習的理論與技術應用尚未系統總結。為此,本文概述了深度學習在水文水資源領域的研究進展,辨析了深度學習在水文水資源領域的優勢與難點,最后展望了應用前景。

1深度學習的基本概念

1.1物理模型與數據驅動模型

基于對真實過程的認知及假設,物理模型已廣泛應用于水文領域。由于真實過程在時間及空間尺度存在異質性,物理模型模擬結果難以與真實過程相符,并且,物理模型結構復雜、參數眾多,對建模者的專業知識要求較高。

基于統計分析的數據驅動模型對真實過程的假設較少,可從數據樣本提取物理過程的復雜關系,是傳統基于物理過程模型的有益補充。數據驅動模型可分為淺層學習模型與深度學習模型,20世紀80年代末期的人工神經網絡[4]與90年代的傳統機器學習模型[5]均屬于淺層學習范疇。2006年,Hinton[3]提出的多隱含層深度神經網絡結構給出了深度學習算法的主要框架,“逐層初始化”方法使該網絡具有優異的特征提取能力。

1.2深度學習

作為機器學習的重要分支,深度學習是一種基于概率論不斷遞歸進而尋求最優解的方法,其通過正反饋優化網絡參數,采用多個隱含層及非線性變換識別數據的特征。與傳統的淺層學習相比,深度學習的核心架構在于其強調網絡的縱向深度。通過構建包含多個非線性處理單元的隱含層,深度神經網絡能通過分層學習從大量數據集中挖掘復雜特征[6],相比之下,傳統的機器學習方法只進行一至兩層的數據轉換;在模型訓練方式上,深度學習模型采用逐層調整的模型訓練方法[6],從而更快地逼近最優解;在特征提取上,深度學習模型無需人為篩選特征,只需將數據集輸入深度神經網絡,利用多隱含層結構的逐層初始化方法便可提取淺層特征、中層特征、高層特征[7-8],進而降低人為篩選特征的主觀影響。深度神經網絡具體包括如下類別:全連接的深度神經網絡(如堆棧自動編碼器、深度信念網絡)、空間深度的卷積神經網絡、時間深度的遞歸神經網絡(如長短期記憶網絡、門控遞歸單元)等。

2水文水資源領域深度學習研究進展

深度學習作為新一代人工智能技術,在水文數據分析方面涵蓋時間分析及空間分析,通過挖掘序列數據,可為水文行業決策智能化提供技術支撐。時空序列分析問題需將具有時間及空間深度的深度學習方法結合,如卷積-長短期記憶網絡模型,其卷積神經網絡部分處理輸入數據的空間特征,長短期記憶網絡部分處理輸入數據的時間相關性;時間序列分析問題集中于對站點序列數據的回歸預測,主要應用的深度學習方法有長短期記憶網絡模型、深度信念網絡模型等。

水文水資源領域的研究問題包含水循環、水災害的形成及防治、水資源開發利用和保護等,既研究水量,又研究水質。本文將深度學習方法在水文水資源領域的應用按水文模擬、水資源管理、水環境評價3個部分劃分。

2.1深度學習在水文模擬中的應用

2.1.1深度學習在地表水中的應用

深度學習方法在地表水中的應用包含降水預報、徑流預報、洪水預報以及水災害預警等方面。

在降水預報問題中,研究主要集中于降水量的實時時空預報與定量降水量的估計,主要采用長短期記憶網絡、門控遞歸單元模型等。如Shi等[9]提出了降雨實時預報基準及具有學習循環連接結構能力的軌跡門控遞歸單元,以解決輸入和預報目標均為雷達圖的時空序列預報問題;Zhang等[10]將無監督學習與監督學習結合,建立了基于深度信念網絡的7種環境特征因子與未來24 h降水量映射關系的模型;如Chen等[11]基于卷積-長短期記憶網絡模型,由規范化、星形橋層、損失函數改進等方法提升模型收斂性能,結果表明,該模型在處理降水預報的時空序列問題時優于卷積-長短期記憶網絡模型;Kumar等[12]以月平均降雨量為隨機成分,建立長短期記憶網絡模型,結果表明,長短期記憶網絡模型具有數據分層預處理能力,且對訓練數據集較少的研究區域,網絡架構是影響模型穩健性能的重要因素;Yen等[13]基于堆棧的深度回聲狀態網絡,由小時氣象資料建立臺灣省南部地區降雨預報模型,通過改變輸入變量法檢驗輸入對輸出的影響,結果表明,降水量、氣壓和濕度是影響降水預報性能的關鍵參數。此外,有學者利用深度學習方法研究降水預報的降尺度及不確定性問題。如Scher和Messori[14]評估了深度學習方法描述降水預報不確定性的能力,基于卷積神經網絡,以確定性降水預報的誤差及集合預報結果為訓練集,輸出降水預報不確定性的標量值;Wang等[15]將遞歸神經網絡與隨機極端降水耦合,提出基于深度學習的氣象要素降尺度方法,并運用SWAT模型評估降尺度要素的水文響應,結果表明,該降尺度方法能使日尺度徑流和蒸散量的模擬精度顯著提高。

徑流預報相關研究以降雨徑流模擬和水庫入庫徑流模擬兩類為主。在降雨徑流模擬問題中,大部分學者聚焦于單流域或單站點的徑流模擬問題,少部分學者開展了區域尺度的降雨徑流模擬研究。對于單流域的徑流模擬,Xiang等[16]基于序列到序列的長短期記憶網絡模型,預測未來24 h逐時段徑流,結果表明,該模型可模擬屬性未知的流域降雨徑流過程;Kao等[17]提出了一種適用于多步預測的編碼器-解碼器長短期記憶網絡模型,能準確預報多峰降雨引起的洪水事件。Liu等[18]將卷積核與注意力機制引入長短期記憶網絡模型,從模型組件、參數及輸入的角度分析模型在徑流模擬中的有效性,結果表明,卷積核的引入能促使模型學習數據的空間相關性,注意力機制能有效突出關鍵時間點的信息。在區域尺度的降雨徑流模擬研究中,Kratzert等[19]將長短期記憶網絡模型應用于解決降雨徑流模擬問題,由于區域尺度模型考慮了流域平均氣象情況,其結果優于物理模型SAC-SMA及Snow-17,結果表明,經預訓練的區域尺度深度學習模型能提高單流域模型的模擬性能;Kratzert等[20]建立了區域尺度的降雨徑流模型,基于實體感知的長短期記憶網絡模型,設置流域屬性特征層,將流域特征與特定地點動態聯系,以此增強長短期記憶網絡模型在無資料地區的預測能力;Feng等[21]提出了一種數據集成方法,通過卷積神經網絡降維方法,促使長短期記憶網絡模型吸納前期徑流數據,提高了年內徑流量變化較大流域的徑流模擬精度,結果表明,卷積神經網絡降維方法有利于改善模型的過擬合問題。對于水庫入庫徑流模擬問題,Bai等[22]提出了一種基于深度學習的聚類融合框架,模型包含屬性域-深層域-綜合域三個部分。在屬性域,運用變分模式分解法將水庫日入庫流量序列分解為多個模式,而后利用模糊C-均值聚類方法對多個模式進行聚類;在深層域,由深度信念網絡得到每一類別的預測值;在綜合域,利用隨機森林方法將深層域每一類別的預測值融合為水庫入流預測值。Li等[23]基于深度信念網絡及堆棧自動編碼器網絡,研究三峽水庫及葛洲壩水庫的日入庫流量預報問題,結果表明,深度學習模型優于前饋神經網絡、自回歸差分移動平均模型。此外,部分徑流預報研究對深度學習模型的輸入預處理、超參數優化問題進行了討論,如Zuo等[24]將3種結合不同輸入預處理方法(變分模式分解、集合經驗模式分解和離散小波變換)的長短期記憶網絡模型應用于徑流預報問題;Yuan等[25]基于蟻群算法和粒子群算法,優化了長短期記憶網絡模型超參數(隱含層神經元數量及學習率),進一步提升了模型性能。

洪水預報相關研究集中于對特定站點洪水水位、流量的時間序列模擬。如Indrastanti等[26]基于長短期記憶網絡模型,以河道上下游兩點降水及水位的時間序列為輸入,預報河道下游水位;Wang等[27]提出了基于擴展因果關系的卷積神經網絡模型,利用衛星圖像預報臺風期間警報系統的實時水位,結果表明,該模型能有效模擬洪峰水位,且能在較長的預見期內提供水位預測值;Li等[28]基于序列到序列的長短期記憶網絡,建立15 min尺度的城市徑流預測模型,該模型根據不同量級的降雨量輸入預測洪水來臨時的徑流,結果表明,當輸入為流域部分雨量站數據而非全部的雨量站數據時,模型的納什效率系數顯著提升。

水災害預警研究集中于災害檢測及洪災時空預警方面。災害檢測研究如Amit等[29]運用卷積神經網絡,開展基于衛星圖像的災害區域自動提取研究,訓練數據集來自日本及泰國的滑坡及洪水災害的災前航空影像、災后航空影像及災害偵測地面真值。洪災時空預警涉及洪水過程的時間及空間尺度的模擬,如Hu等[30]建立基于降階模型的長短期記憶網絡,分析洪水時空分布的聚集性,從而預測海嘯的發生,確定誘發海嘯的不確定因素,研究采用的本征正交分解和奇異值分解方法能降低大型空間數據集的維數;Alberto等[31]基于長短期記憶網絡,提出全球預報系統與短期徑流預報的耦合模型,以全球預報系統的氣象變量時間序列及流域屬性為輸入預測未來3 d逐小時的徑流,結果表明,該模型能有效模擬峰值流量,能滿足水文預警需求。

2.1.2深度學習在地下水中的應用

地表以下土層分為非飽和帶(包氣帶)及飽和帶(飽水帶),包氣帶和飽水帶內水體分別對應土壤水及地下水。深度學習方法主要應用于淺層土壤含水量的時空分布預測及深層地下水的水位及流量模擬問題。

在土壤含水量的時空分布預測問題上,Song等[32]提出深度信念網絡與宏觀元胞自動機結合的模型,解決土壤含水量的動態建模問題;Fang等[33-34]基于長短期記憶網絡,由土壤水分衛星產品學習土壤水分的動態變化,再現了根區土壤水分的多年趨勢;Cai等[35]由泰勒圖闡明解釋變量與預測變量的關系,基于深度回歸網絡建立土壤水分預測模型,結果表明,雙層的深度回歸模型具有良好的泛化能力和擴展性;范嘉智等[36]基于長短期記憶網絡模型,結合隨機采樣學習方法,預測未來6,12,24,48 h的土壤水分,結果表明,長短期記憶網絡模型能精準預測土壤水分動態;Chen等[37]基于改進的神經網絡方法,對2003年以來公認的11個微波遙感土壤水分衛星產品進行數據校正和數據融合,建立了2003~2018年的全球遙感土壤水分數據集;Fang等[38]討論了水文時間序列在深度學習模型中的數據協同性,結果表明,由于輸入數據的多樣性,區域化模型比單一研究對象模型更具泛化能力,能學習不同研究對象的共性和差異。

對于地下水水位及流量預測問題,Zhang等[39]運用長短期記憶網絡預測河套市14個干旱區的地下水位,結果表明,該模型對缺乏地質資料地區的地下水位預測具有較好的峰值擬合效果;汪云等[40]采用多變量輸入的方式,以長短期記憶神經網絡預測地下水位,結果表明,基于多變量輸入的長短期記憶網絡模型能通過少量歷史數據準確預測未來地下水位的變化情況,并有效降低資料匱乏地區的預測誤差;梁澤華等[41]將氣溫、降水量、蒸發量及鄰近測站的地下水位作為影響因子,建立考慮空間影響的地下水位預測模型;Jeong等[42]針對地下水位數據的噪聲和異常值問題,在長短期記憶網絡模型的損失函數中應用多種防止“過擬合”的技術,結果表明,結合多種防止“過擬合”的長短期記憶網絡模型能對含有顯著噪聲和大量異常值的數據魯棒性進行預測估計;Wang等[43]提出理論指導的深度神經網絡,由觀測數據及科學知識(如控制方程、物理約束、工程控制和專家知識)構造損失函數,結果表明,理論指導的神經網絡可為物理模型的偏微分方程提供滿足物理及工程約束的參數估計結果。此外,Cromwell等[44]基于深度神經網絡,由流域出口站點的流量過程線估計流域地下土層的滲透性,結果表明,深度神經網絡能通過改進參數估計,準確捕捉土層滲透率與流量過程線間的非線性關系,可作為流域地表水與地下水綜合建模的輔助方法。

2.2深度學習在水資源管理中的應用

2.2.1深度學習在水庫調度中的應用

深度學習方法在水庫調度中的應用主要包含水庫蓄水和出庫流量決策2個方面。

利用深度學習方法研究水庫蓄水問題,主要通過預報湖泊或水庫的水位實現。如Hrnjica[45]采用長短期記憶網絡模型及前饋神經網絡,研究單個湖泊水位的預測問題,結果表明,在預測效果上,長短期記憶網絡模型優于前饋神經網絡及自回歸滑動平均模型;劉亞新等[46]基于長短期記憶網絡模型,以三峽水庫及葛洲壩水庫的前期水位及出力等監測數據,預測葛洲壩水庫的上下游水位,結果表明,該方法能實現未來3 h上游水位及未來6 h下游水位的準確預測;Zhu等[47]基于長短期記憶網絡模型及前饋神經網絡,研究地區內多個湖泊的水位預測問題,該研究表明,長短期記憶網絡模型及前饋神經網絡模型均表現較好,兩類模型效果相差不大,可能是因為該數據集及模型結構是特例所致。

利用深度學習方法研究水庫出庫流量決策問題,主要利用遞歸神經網絡實現。如Zhang等[48]比較了人工神經網絡、支持向量機和長短期記憶網絡模型對葛洲壩水庫小時、日、月3個時間尺度的出庫流量模擬效果,總結了網絡參數設置對模型性能的影響,結果表明,對于長短期記憶模型,應優先考慮最大迭代次數對模型性能的影響,且該模型能較好模擬低值及峰值流量;Zhang等[49]探討了一般的遞歸神經網絡、長短期記憶網絡、門控循環單元網絡對溪洛渡水庫出庫流量的模擬性能,總結了不同水文周期下出庫流量的影響因素;Yang等[50]利用分布式水文模型預報水庫入庫流量,并將此入庫流量作為遞歸神經網絡的輸入,模擬不同調節能力水庫的出庫流量,討論了遞歸神經網絡在極端入流情況下對多年調節水庫出庫流量模擬的適用性,結果表明,基于遺傳算法的非線性自回歸模型在極端洪水及極端干旱情況下模擬效果最佳,所構建的實時調度系統能解決水庫的短期調度問題。

2.2.2深度學習在水資源配置中的應用

水資源的合理配置需將供水管理與需水管理相結合,深度學習在水資源配置中的應用主要包含需水預測及配水管網異常檢測2個方面。

需水預測研究主要集中于不考慮水文氣象影響的短期需水預報。如Guo等[51-52]為解決15 min尺度的短時需水預報問題,分別建立雙向長短期記憶網絡模型與包含累積誤差校正模塊的門控遞歸單元網絡,考慮到15 min尺度需水量預測的水文氣象因素的影響較小,故以前期需水量作為模型的單一輸入,預測未來15 min和未來24 h逐時的需水量,結果表明,雙向長短期記憶神經網絡模型與門控遞歸單元網絡模型具有較好的穩定性與魯棒性。如Kuehnert等[53]將長短期記憶網絡模型用于未來24 h的逐時需水量預測,并對模型系統的在線學習及遷移學習能力進行了評估,結果表明,由于長短期記憶網絡模型能夠利用日期信息,因而優于一般回歸方法。

深度學習法在配水管網異常檢測中是將配水管網的壓力數據與管網異常情況建立映射關系,從而運用深度學習模型探究管網的異常工況。如Fang等[54]運用卷積神經網絡模型解決配水管網的多位點滲漏檢測問題,以配水管網的歷史壓力數據為輸入來預測傳感器壓力,最終判別管網位點是否發生泄漏;Xu等[55]提出長短期記憶網絡與深度神經網絡的集成模型,以測量點壓力、供水口壓力及流量的控制信息為輸入,檢測異常工況并預測供水管網壓力。

2.3深度學習在水環境評價中的應用

2.3.1深度學習在水質分析中的應用

深度學習方法的提出進一步推動了水質分析預測的相關研究,具體研究問題包含水體特征分類及水質指數預測問題。

針對水體特征分類問題,Yang等[56]基于堆棧稀疏自動編碼器模型,以水體遙感數據為輸入,提取研究區遙感圖像的像素特征矩陣,最終由特征擴展算法識別遙感圖像水體特征;Yu等[57]基于光譜和遙感影像,建立基于logistic回歸分類器的卷積神經網絡模型,對遙感圖像進行光譜空間規律的分層特征提取,最終提高水體特征的分類準確度。

針對水質預測問題,Solanki等[58]運用堆棧去噪自動編碼器及深度信念網絡,進行水質指數(融合了pH、溶解氧和濁度等水質參數)的無監督預測,結果表明,堆棧去噪自動編碼器及深度信念網絡能有效提高水質參數預測的魯棒性,并且能有效處理數據的異常值;Liu等[59]基于長短期記憶網絡,建立飲用水水質預測模型,預測未來6個月逐月的水質參數變化,結果表明,該模型能準確揭示水質變化趨勢,但模型只考慮水質參數的一維輸入,沒有考慮水質多維影響因素作用下的目標參數變化;Yu等[60]基于小波閾值法去噪與小波均值融合方法,建立考慮數據降噪處理的長短期記憶網絡模型,模擬流域葉綠素a的歷史變化過程,預測其未來的變化趨勢,并利用地理空間分析法對葉綠素a的時空變化特征進行了可視化展示;Liang等[61]基于長短期記憶網絡模型,以環境流體動力學方程生成的6個水質變量時間序列為輸入,輸出未來一個月的葉綠素a濃度變化,結果表明,由于模型輸入與環境流體動力學方程有其內在聯系,因此該長短期記憶網絡模型是帶有物理機制指導的深度學習模型;Zou等[62]基于雙向長短期記憶網絡,提出了一種多時間尺度輸出變量融合的水質預測方法,該方法將短、中、長期3個時間尺度的水質指標預測結果進行加權融合,并采用響應曲面(Box-Behnken)實驗設計方法對超參數進行系統調整,結果表明,與單獨使用長短期記憶網絡或雙向長短期記憶網絡相比,該融合方法能有效提高水質預測模型的性能;Zhi等[63]基于長短期記憶網絡模型,運用水文氣象數據、流域屬性及CAMELS數據集的溶解氧濃度數據,研究大陸尺度無資料地區的溶解氧預測問題,結果表明,流域水文氣象條件對溶解氧的水平具有主導控制作用,該模型在溶解氧變異性小、水流條件相對穩定的地區表現較好,能克服CAMELS數據集中74%流域的溶解氧濃度預測問題;Song[64]基于卷積神經網絡,以土地覆蓋及土壤圖等空間數據、降雨及徑流等水文數據為輸入,輸出流域的污染物負荷(生化需氧量及總磷),結果表明,該模型能有效估算無資料流域的污染物負荷。

2.3.2深度學習在污水排放中的應用

聯合污水管網系統是污水排放的重要輸送路徑,深度學習方法在污水排放中的應用包含聯合污水管網的流量監測、污水水位預測及故障檢測等。

針對污水管網的流量及水位預測問題,Zhang等[65-66]基于長短期記憶網絡和門控遞歸單元網絡,建立挪威德拉門市Muusfiya污水處理廠的污水流量預測模型,結果表明,長短期記憶網絡模型能捕獲Muusfiya污水處理廠的進水流量趨勢及峰值。另外,他還預測了未來多個預見期的管網污水水位,結果表明,長短期記憶和門控遞歸單元能捕捉污水水位的突變情況,并顯著緩解峰值預測的滯時問題,具有良好的多步預測能力。Karimi等[67]量化了地下水數據在污水處理系統進水流量預測中的價值,基于長短期記憶網絡模型,構建考慮城市不同空間位置信息的污水管網進水流量預測,并基于重采樣方法應對100 a一遇降雨情況的進水流量樣本較少的問題,結果表明,在模型中結合地下水數據及重采樣方法能有效地提高模型預測性能。

此外,部分研究開展了污水處理廠的故障檢測工作,如Harrou等[68]構建了深度信念網絡-支持向量機的無監督學習模型,利用深度信念網絡對污水處理廠數據復雜特征進行提取,利用支持向量機的預測能力分離正常特征和異常特征,從而檢測污水處理系統的故障,結果表明,該模型能夠對污水處理廠的異常情況進行有效預警。

3難點與展望

目前,深度學習方法在水文領域已取得不少研究成果,但總體上還處于起步階段。由于水文監測數據多為時間序列數據,大部分研究集中于對單站點時間序列數據的預測與模擬,主要通過與傳統機器學習方法進行效果對比,驗證深度學習方法在解決水文問題中的可行性,采用的深度神經網絡主要是卷積神經網絡與長短期記憶網絡,對生成對抗網絡、門控遞歸單元網絡等架構應用較少。

為此,需要跟蹤深度學習技術的發展趨勢,根據水文領域存在問題的特點,完善和發展深度學習方法,逐步形成解決水文領域關鍵問題的深度學習方法。

3.1深度學習應用難點

3.1.1模型訓練數據方面

從本質上來看,深度學習方法是“數據饑餓型”模型,研究依賴于大量精細數據。目前,水文領域缺乏統一的數據存儲與共享系統[2],故難以獲得高質量的數據集。當訓練數據較少時,深度學習模型能被有限制條件及多參數的物理模型或結合變量先驗分布的傳統機器學習模型替代[47]。未來應構建大尺度的水文信息數據庫,通過實測數據及派生數據的收集,運用各類深度學習算法,建立起基于深度學習算法的大數據水文預報模型,實現水文精準預報。

3.1.2模型超參數優化方面

在深度學習方法中,深度神經網絡結構(隱含層數量、隱含層節點數、學習率、最大訓練次數等)的確定對模型的性能極為關鍵,如何確定最優化的結構是在當前研究中需解決的問題[25]。

3.1.3模型可解釋性方面

從廣義上考慮,深度學習模型仍屬于“黑箱”模型,難以深入分析模型性能優異的內在原因,無法得知物理因子間的作用過程,進而導致研究結果難以使人信服。目前,已有研究[19]通過分析長短期記憶網絡模型內部單元的細胞狀態值變化來顯示深度學習模型與積雪融化等物理過程的內在聯系,但如何進一步分析模型與氣象因素、水文特征的關系,并完善可視化過程,以揭示模型本質,仍需要進一步的探索。

3.1.4模型結果與物理規律不符方面

深度學習模型能建立解釋變量與響應變量的映射關系,但僅基于歷史數據,未考慮物理規律及過程,在某些特定科學問題的研究中,易導致模型結果出現異常值,難以與物理規律保持一致。已有研究[69]提出了幾種有機結合物理模型與數據驅動模型的方法,如在提供觀測數據標簽時,加入理論知識(由物理模型提取的控制方程、邊界條件)限制解集空間,或基于物理模型模擬結果對深度神經網絡進行預訓練,從而建立物理指導的深度學習模型。在深度學習模型中引入對物理過程的理解,能增加模型的可解釋性,使計算更加高效,存儲更加穩定,并與物理規律保持一致。

3.1.5模型泛化能力方面

針對特定研究對象構建的深度學習模型泛化能力有限的問題,目前已衍生出遷移學習方法,以提升深度學習模型的泛化能力[70]。遷移學習方法能將預訓練模型應用到另一個相似的任務中,若能在數據豐富地區建立水文信息數據庫,應用深度學習方法,自動化學習數據庫中多種研究對象的特征,并將此深度學習模型遷移應用至少資料或無資料地區,能夠給無資料地區的水文水資源分析計算提供新思路。

3.2展 望

在氣候變化及人類活動影響的背景下,水文過程的一致性受到影響,人類對水文物理過程的內部結構、邊界條件、影響因素尚未充分了解,因此,基于物理過程的模型難以處理非線性與多尺度、多因素作用的問題。深度學習模型未涉及與物理過程有關的參數,但其僅基于數據開展模型訓練,難以考慮物理過程及規律,因此,可考慮將深度學習與水文物理模型有機結合,以構建適用于解決水文水資源問題的集成模型。此外,若能實現深度學習模型可視化并開展可解釋性研究,深度學習方法不失為一種可從結果推斷模型驅動力、量化物理因素未知相互作用的方法。深度學習方法可望在水文精準預報、無資料地區水文研究等方面提供新途徑。深度學習并非機器學習發展的終點,為適應不同的應用場景,深度學習領域已衍生出小樣本元學習及遷移學習、強化學習、對抗學習等技術,相信在未來,更多的研究將集中于水文領域的關鍵問題,以深度學習方法為動力促進水文領域的建設與發展。

參考文獻:

[1]MONTANARI A Y G S H."Panta Rhei—Everything Flows":Change in hydrology and society—The IAHS Scientific Decade 2013-2022[J].Hydrological Sciences Journal,2013,58(6):1256-1275.

[2]陳軍飛,鄧夢華,王慧敏.水利大數據研究綜述[J].水科學進展,2017,28(4):622-631.

[3]HINTON G E,OSINDERO S,TEH Y.A fast learning algorithm for deep belief nets[J].Neural Computation,2006,18(7):1527-1554.

[4]RUSSELL,STUART J.人工智能[M].北京:清華大學出版社,2011.

[5]周志華.機器學習及其應用-2007[M].北京:清華大學出版社,2007.

[6]LECUN Y,BENGIO Y,HINTON G.Deep learning[J].Nature,2015,521(7553):436-444.

[7]TADDY M.Distributed multinomial regression[J].Annals of Applied Statistics,2015,9(3):1394-1414.

[8]HAIGH P A,GHASSEMLOOY Z,RAJBHANDARI S,et al.Visible Light Communications:170 Mb/s Using an Artificial Neural Network Equalizer in a Low Bandwidth White Light Configuration[J].Journal of Lightwave Technology,2014,32(9):170-181.

[9]SHI X,GAO Z,LAUSEN L,et al.Deep Learning for Precipitation Nowcasting:A Benchmark and A New Model[M]∥Guyon I,Luxburg U V,Bengio S,et al.Advances in Neural Information Processing Systems,2017.

[10]ZHANG P,ZHANG L,LEUNG H,et al.A deep-learning based precipitation forecasting approach using multiple environmental factors[M]∥Karypis G,Zhang J.IEEE International Congress on Big Data.2017:193-200.

[11]CHEN L,CAO Y,MA L,et al.A deep learning-based methodology for precipitation nowcasting with radar[J].Earth and Space Science,2020,7.

[12]KUMAR D,SINGH A,SAMUI P,et al.Forecasting monthly precipitation using sequential modelling[J].Hydrological Sciences Journal-Journal DES Sciences Hydrologiques,2019,64(6):690-700.

[13]YEN M,LIU D,HSIN Y,et al.Application of the deep learning for the prediction of rainfall in Southern Taiwan[J].Scientific Reports,2019,9:12774.

[14]SCHER S,MESSORI G.Predicting weather forecast uncertainty with machine learning[J].Quarterly Journal of the Royal Meteorological Society,2018,144(717B):2830-2841.

[15]WANG Q,HUANG J,LIU R,et al.Sequence-based statistical downscaling and its application to hydrologic simulations based on machine learning and big data[J].Journal of Hydrology,2020,586:124875.

[16]XIANG Z,YAN J,DEMIR I.A rainfall-runoff model with LSTM-based sequence-to-sequence learning[J].Water Resources Research,2020,56(1):e2019WR025326.

[17]KAO I,ZHOU Y,CHANG L,et al.Exploring a long short-term memory based encoder-decoder framework for multi-step-ahead flood forecasting[J].Journal of Hydrology,2020,583.

[18]LIU Y,ZHANG T,KANG A,et al.Research on runoff simulations using deep-learning methods[J].Sustainability,2021,13(3):580-591.

[19]KRATZERT F,KLOTZ D,BRENNER C,et al.Rainfall-runoff modelling using Long Short-Term Memory(LSTM)networks[J].Hydrology and Earth System Sciences,2018,22(11):6005-6022.

[20]KRATZERT F,KLOTZ D,SHALEV G,et al.Towards learning universal,regional,and local hydrological behaviors via machine learning applied to large-sample datasets[J].Hydrology and Earth System Sciences,2019,23(12):5089-5110.

[21]FENG D,FANG K,SHEN C.Enhancing streamflow forecast and extracting insights using long-short term memory networks with data integration at continental scales[J].Water Resources Research,2020,56.

[22]BAI Y,SUN Z,ZENG B,et al.Reservoir inflow forecast using a clustered random deep fusion approach in the Three Gorges Reservoir,China[J].Journal of Hydrologic Engineering,2018,23:970-981.

[23]LI C,BAI Y,ZENG B.Deep feature learning architectures for daily reservoir inflow forecasting[J].Water Resources Management,2016,30(14):5145-5161.

[24]ZUO G,LUO J,WANG N,et al.Decomposition ensemble model based on variational mode decomposition and long short-term memory for streamflow forecasting[J].Journal of Hydrology,2020,585.

[25]YUAN X,CHEN C,LEI X,et al.Monthly runoff forecasting based on LSTM-ALO model[J].Stochastic Environmental Research and Risk Assessment,2018,32(8):2199-2212.

[26]WIDIASARI I R,NUGOHO L E,WIDYAWAN,et al.Context-based Hydrology Time Series Data for A Flood Prediction Model Using LSTM[M]∥Facta M,Riyadi M A,Widianto E D,et al.2018:385-390.

[27]WANG J,LIN G,CHANG M,et al.Real-time water-level forecasting using dilated causal convolutional neural networks[J].Water Resources Management,2019,33(11):3759-3780.

[28]LI W,KIAGHADI A,DAWSON C.High temporal resolution rainfall-runoff modeling using long-short-term-memory(LSTM)networks[J].Neural Computing & Applications,2021,33(4):1261-1278.

[29]AMIT S N K B,SHIRAISHI S,INOSHITA T,et al.Analysis of satellite images for disaster detection[M]∥IEEE International Symposium on Geoscience and Remote Sensing IGARSS.2016:5189-5192.

[30]HU R,FANG F,PAIN C C,et al.Rapid spatio-temporal flood prediction and uncertainty quantification using a deep learning method[J].Journal of Hydrology,2019,575:911-920.

[31]DE LA FUENTE A,MERUANE V,MERUANE C.Hydrological early warning system based on a deep learning runoff model coupled with a meteorological forecast[J].Water,2019,11:1808.

[32]SONG X,ZHANG G,LIU F,et al.Modeling spatio-temporal distribution of soil moisture by deep learning-based cellular automata model[J].Journal of Arid Land,2016,8(5):734-748.

[33]FANG K,SHEN C,KIFER D,et al.Prolongation of SMAP to Spatiotemporally Seamless Coverage of Continental US Using a Deep Learning Neural Network[J].Geophysical Research Letters,2017,44(21):11030-11039.

[34]FANG K,PAN M,SHEN C.The Value of SMAP for Long-Term Soil Moisture Estimation With the Help of Deep Learning[J].IEEE Transactions On Geoscience And Remote Sensing,2019,57(4):2221-2233.

[35]CAI Y,ZHENG W,ZHANG X,et al.Research on soil moisture prediction model based on deep learning[J].Plos One,2019,14.

[36]范嘉智,譚詩琪,羅宇,等.長短期記憶神經網絡在多時次土壤水分動態預測中的應用[J].土壤,2021,53(1):209-216.

[37]CHEN Y,FENG X,FU B.An improved global remote-sensing-based surface soil moisture(RSSSM)dataset covering 2003-2018[J].Earth System Science Data,2021,13(1):1-31.

[38]FANG K,KIFER D,LAWSON K,et al.The data synergy effects of time-series deep learning models in hydrology[EB/OL].doi:10.1029/2019WR025326.

[39]ZHANG J,ZHU Y,ZHANG X,et al.Developing a Long Short-Term Memory(LSTM)based model for predicting water table depth in agricultural areas[J].Journal of Hydrology,2018,561:918-929.

[40]汪云,楊海博,徐建,等.基于長短期記憶神經網絡模型的地下水水位預測研究[J].節水灌溉,2019(10):73-77.

[41]梁澤華,劉亞平,胡宏昌.基于LSTM神經網絡的地下水位時空模擬[C]∥ 2020中國環境科學學會科學技術年會論文集(第三卷).南京,2020.

[42]JEONG J,PARK E,CHEN H,et al.Estimation of groundwater level based on the robust training of recurrent neural networks using corrupted data[J].Journal of Hydrology,2020,582:1170-1177.

[43]WANG N,ZHANG D,CHANG H,et al.Deep learning of subsurface flow via theory-guided neural network[J].Journal of Hydrology,2020,584:950-964.

[44]CROMWELL E,SHUAI P,JIANG P,et al.Estimating Watershed Subsurface Permeability From Stream Discharge Data Using Deep Neural Networks[J].Frontiers in Earth Science,2021,9:1120-1134.

[45]HRNJICA B,BONACCI O.Lake Level Prediction using Feed Forward and Recurrent Neural Networks[J].Water Resources Management,2019,33(7):2471-2484.

[46]劉亞新,樊啟祥,尚毅梓,等.基于LSTM神經網絡的水電站短期水位預測方法[J].水利水電科技進展,2019,39(2):56-60.

[47]ZHU S,HRNJICA B,PTAK M,et al.Forecasting of water level in multiple temperate lakes using machine learning models[J].Journal of Hydrology,2020,585.

[48]ZHANG D,LIN J,PENG Q,et al.Modeling and simulating of reservoir operation using the artificial neural network,support vector regression,deep learning algorithm[J].Journal of Hydrology,2018,565:720-736.

[49]ZHANG D,PENG Q,LIN J,et al.Simulating reservoir operation using a recurrent neural network algorithm[J].Water,2019,11:865.

[50]YANG S,YANG D,CHEN J,et al.Real-time reservoir operation using recurrent neural networks and inflow forecast from a distributed hydrological model[J].Journal of Hydrology,2019,579:124229.

[51]郭冠呈,劉書明,李俊禹,等.基于雙向長短時神經網絡的水量預測方法研究[J].給水排水,2018,54(3):123-126.

[52]GUO G,LIU S,WU Y,et al.Short-Term Water Demand Forecast Based on Deep Learning Method[J].Journal of Water Resources Planning and Management,2018,144.

[53]KUEHNERT C,GONUGUNTLA N M,KRIEG H,et al.Application of LSTM networks for water demand prediction in optimal pump control[J].Water,2021,13:6445.

[54]FANG Q,ZHANG J,XIE C,et al.Detection of multiple leakage points in water distribution networks based on convolutional neural networks[J].Water Supply,2019,19(8):2231-2239.

[55]XU Z,YING Z,LI Y,et al.Pressure prediction and abnormal working conditions detection of water supply network based on LSTM[J].Water Supply,2020,20(3):963-974.

[56]YANG L,TIAN S,YU L,et al.Deep learning for extracting water body from landsat imagery[J].International Journal of Innovative Computing Information And Control,2015,11(6):1913-1929.

[57]YU L,WANG Z,TIAN S,et al.Convolutional neural networks for water body extraction from landsat imagery[J].International Journal of Computational Intelligence And Applications,2017,16.

[58]SOLANKI A,AGRAWAL H,KHARE K.Predictive analysis of water quality parameters using deep learning[J].International Journal of Computer Applications,2015,125(9):29-34.

[59]LIU P,WANG J,SANGAIAH A K,et al.Analysis and Prediction of Water Quality Using LSTM Deep Neural Networks in IoT Environment[J].Sustainability,2019,11.

[60]YU Z,YANG K,LUO Y,et al.Spatial-temporal process simulation and prediction of chlorophyll-a concentration in Dianchi Lake based on wavelet analysis and long-short term memory network[J].Journal of Hydrology,2020,582.

[61]LIANG Z,ZOU R,CHEN X,et al.Simulate the forecast capacity of a complicated water quality model using the long short-term memory approach[J].Journal of Hydrology,2020,581.

[62]ZOU Q,XIONG Q,LI Q,et al.A water quality prediction method based on the multi-time scale bidirectional long short-term memory network[J].Environmental Science and Pollution Research,2020,27(14):16853-16864.

[63]ZHI W,FENG D,TSAI W,et al.From Hydrometeorology to River Water Quality:Can a Deep Learning Model Predict Dissolved Oxygen at the Continental Scale?[J].Environmental Science & Technology,2021,55(4):2357-2368.

[64]SONG C M.Application of Convolution Neural Networks and Hydrological Images for the Estimation of Pollutant Loads in Ungauged Watersheds[J].Water,2021,13(2):17-24.

[65]ZHANG D,HOLLAND E S,LINDHOLM G,et al.Hydraulic modeling and deep learning based flow forecasting for optimizing inter catchment wastewater transfer[J].Journal of Hydrology,2018,567:792-802.

[66]ZHANG D,LINDHOLM G,RATNAWEERA H.Use long short-term memory to enhance Internet of Things for combined sewer overflow monitoring[J].Journal of Hydrology,2018,556:409-418.

[67]KARIMI H S,NATARAJAN B,RAMSEY C L,et al.Comparison of learning-based wastewater flow prediction methodologies for smart sewer management[J].Journal of Hydrology,2019,577:701-714.

[68]HARROU F,DAIRI A,SUN Y,et al.Statistical monitoring of a wastewater treatment plant:A case study.[J].Journal of Environmental Management,2018,223:540-561.

[69]KARPATNE A,ATLURI G,FAGHMOUS J H,et al.Theory-Guided Data Science:A New Paradigm for Scientific Discovery from Data[J].IEEE Transactions on Knowledge & Data Engineering,2017,(99):1-15.

[70]MA K,FENG D,LAWSON K,et al.Transferring hydrologic data across continents-leveraging US data to improve hydrologic prediction in other countries[EB/OL](2020-09-02).http:∥doi.org/10.1002/essoar.10504132.1

(編輯:鄭 毅)

Abstract:With the rapid development of modern hydrological monitoring technology,massive hydrological data are obtained,which brings opportunities and challenges for deep learning in hydrology and water resources.This paper summarizes the research progress of deep learning in hydrology and water resources from three aspects:hydrological simulation,water resources management and water environment evaluation.The advantages of deep learning methods and their application difficulties are:deep learning method does not need to construct a physical model and can automatically recognize data characteristics,and has significant advantages in the problems without a clear physical mechanism;however,it faces defects such as lacking model training data,subjectivity in super-parameter determination,insufficient interpretability,inconsistency with physics laws and lacking generalization ability.At last,we propose prospects of deep learning in hydrology and water resources filed:combining deep learning and hydro-physical mechanism model to integrate classical hydrological laws and doing application researches such as transfer learning,reinforcement learning and adversarial learning to better utilize the deep learning method.

Key words:hydrology and water resources;deep learning;data mining;data driving model;physical mechanism model

猜你喜歡
水文水資源數據挖掘深度學習
數據挖掘綜述
軟件工程領域中的異常數據挖掘算法
水文水資源監測數據管理平臺研究
水文水資源管理對防洪減災的意義
關于水文水資源工作發展的分析
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
基于深度卷積網絡的人臉年齡分析算法與實現
基于R的醫學大數據挖掘系統研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合