?

基于多種評價法的磨盤山水庫水質評價

2024-03-20 06:33陳振宙楊鵬輝許文博
陜西水利 2024年3期
關鍵詞:水質評價方差分析法

陳振宙,楊 旭,楊鵬輝,許文博,張 弛

(1.黑龍江大學水利電力學院,黑龍江 哈爾濱 150080;2.哈爾濱市磨盤山水庫管護中心,黑龍江 哈爾濱150080)

0 引言

水是生命之源,在人類的生產、生活中起著重要作用。隨著人民生活水平不斷提高以及思想的不斷進步,對水的開發、利用以及保護的重視程度也顯著提高,因此水質評價變得尤為重要。對水庫的水質進行評價分析可以了解水庫整體的水體質量狀況,并為水庫水資源開發、利用和保護提供技術支撐。

對水質評價的方法大體上有單因子評價法、綜合指數評價法,模糊綜合評價法,主成分分析法,神經網絡評價法等。徐春霞[1]等人用單因子法和綜合法對秦皇島地下水質量進行了評價。梅學彬[2]對以往的模糊綜合評價法中權重確定方法進行了改進,并用實例分析其可行性。馬虹[3]用污染指數法和模糊數學法對哈爾濱醫藥集團公司地面水進行了評價。杜俊鵬[4]應用主成分分析法對長春市經濟開發區河流水質進行了評價。郭新強[5]運用主成分分析法和綜合水質標識指數法對福建某濱海地水質進行評價。張怡[6]等人利用BP神經網絡模型對大慶市紅旗泡水庫進行水質的富營養化評價。許燕穎[7]利用BP神經網絡和WPI評價法評價了桃江水質。本文以主成分分析法以及RBF神經網絡法對磨盤山水庫水質進行評價。

1 水庫概況及數據來源

磨盤山水庫位于五常市境內松花江一級支流,距離哈爾濱市約180 km,水源流域面積為1151 km2,多年平均徑流量為5.75×108m3,是一座以城鎮供水,農田灌溉為主,兼顧防洪,發電的綜合利用水利樞紐工程[8]。

本文以2022年12個月的磨盤山水庫監測數據為依據,選取溶解氧(DO),氨氮(NH3-N),化學需氧量(COD),總磷(TP),總氮(TN)的5個指標,按照地表水環境質量標準(GB 3838-2002)[9]中的對應標準限值,對水質進行評價。

2 主成分分析法

2.1 初始數據標準化

由于水質指標有不同量綱以及數量級,故在評價前先進行數據的無量綱化處理。

式中:tij為第i個評價對象的第j個指標;、Cj分別是第j個指標的樣本均值和樣本標準差,i=1,2,…,5, j=1,2,…12。

處理結果見表1。

2.2 指標相關性檢驗

由表2可知,氨氮與COD,總氮之間存在正相關,COD與總氮存在正相關,本文大多數指標存在較強的相關性,適合應用主成分分析法進行水質評價。

表2 水質指標間的pearson相關分析

從表3可知,KMO=0.618>0.6,Sig.=0.000<0.05,各水質指標間存在較強的相關性,運用主成分分析進行水質評價可以得到較為理想的結果。

表3 KMO與巴特利特校驗

2.3 確定主成分及建立主成分得分表達式

將方差解釋中特征值大于1且累計方差貢獻率大于85%為標準確定為主成分。

建立主成分得分表達式,見式(2)。其中,表示主成分中各變量的權重,可以基于式(3)建立得分系數矩陣。

式中:F為綜合得分;Cj為第i個主成分的方差貢獻率。

由表4可知成分1和成分2的特征值分別為3.383和1.054,對應的方差平方和分別為67.656%,19.071%。成分1和成分2的特征值均大于1,而且累計方差平方和高達86.728%,表明前兩個成分可以解釋數據的86.728%的信息,因此,可以選擇成分1、成分2作為主成分進行水質評價。

表5為成分矩陣,主要反映各個水質指標在主成分1和主成分2上荷載的分布情況,由表4和表5綜合分析可得,主成分1的貢獻率為67.656%,COD、氨氮、總氮、總磷在主成分1中占有較高的載荷,表明主成分1對水質狀況的影響較大,且主要反映水庫受有機物污染。

表5 成分矩陣

由表6可得出主成分1和主成分2的表達式分別為:

表6 得分系數矩陣

2.4 水質分析評價

基于式 (4)(5)(6),計算出磨盤山水庫1月~12月與地表水環境質量標準中規定的五類水質的綜合得分,并基于地表水環境質量標準中五類水質的綜合得分判定水庫各月份的水體質量狀況。從表7中可以看出,基于主成分分析法清晰的反映出水庫各月份的水體質量狀況:水質達到Ⅰ類水標準有1月、2月、3月、4月、6月,共5個月;5月、7月、8月、9月、10月、11月、12月水質狀況均為Ⅱ類。

表7 主成分分析水質評價結果匯總

3 RBF神經網絡評價法

RBF神經網絡的核心是函數逼近理論,是一種具有較強全局能力的前饋式神經網絡。RBF神經網絡主要由輸入層(input),輸出層(output)以及隱含層(implicit layer)三部分組成。結構見圖1。

圖1 RBF神經網絡示意圖

以RBF網絡建立水質評價模型,網絡的輸入x為某水樣中參與評價的種水質指標實測值的集合,輸出為該水樣的水質級別。同其它所有利用RBF網絡解決問題一樣,問題的關鍵集中在網絡結構的選擇、可調參數的優化方法、學習樣本的代表性上。

3.1 可調參數的優化方法

典型的RBF網絡中有3個可調參數:隱含層基函數中心t、方差σ,以及輸出單元的權值ω。

本文用聚類方法選擇基函數,可以各聚類中心作為基函數中心,而以各類樣本的方差的某一函數作為各個基函數的寬度參數。隱含層到輸出層的權值用最小二乘法求得,分級聚類可以看成是將N個樣本劃分成c個類的劃分序列。第一個劃分是把樣本分成N個類,每類包含一個樣本;第二個劃分是把樣本分成N-1個類,依此類推,直到第N個劃分時把樣本僅分成一個類。如果類數c=N-K+1,則稱這個劃分處于K水平。這種劃分序列具有如下性質:只要在K水平時樣本被歸入同一類后,在進行更高水平的劃分時,它們也永遠屬于同一類。這種分類方法較穩定,只要確定了類數,分類結果就是唯一的[10,11]。

3.2 學習樣本的代表性

訓練樣本一般為實測的或通過計算得到的一系列一一對應的(x,y), x為輸入,y為輸出。然而對于水質評價,目的就是根據一定的水質判別標準建立一種評價方法,從而對水質的優劣做出合理的評價。這樣就不能通過前述兩種方法獲取訓練樣本,因為實測數據只有水質指標的數值,沒有對應的水質級別;如果通過某種方法計算得到一系列輸入x對應的輸出y值,經過神經網絡學習后得到的網絡結構就變成對這種方法的模仿,那就失去了應用神經網絡進行評價的意義。所以對于水質評價訓練樣本數據只能從水質標準中獲取[10]。

以地面水環境質量標準為例,首先隨機產生一個1~5之間的整數,1代表水質類別為Ⅰ類,2代表水質類別為Ⅱ類,依此類推,5代表水質指標為Ⅴ類水標準。然后根據水環境質量標準在該水質類別的范圍為各水質指標隨機產生數值。

3.3 算法概述

3.3.1 數據標準化處理

使用MATLAB的zscore函數對訓練數據進行標準化處理,以便每個特征的均值為0,方差為1。z-score 標準化(正太標準化)是基于原始數據的均值(mean)和標準差(standard deviation)進行數據的標準化。將原始值x使用z-score標準化到x'。

3.3.2 建立訓練模型及預測

本文使用MATLAB的newrb函數訓練了一個RBF神經網絡,訓練輸出為trainY。我們對trainY進行了四舍五入操作,以便將其轉換為整數類型的標簽trainPred。然后,我們計算了訓練準確率trainAcc、平均絕對誤差trainMae、均方根誤差trainRmse和F1分數trainF1。

最后,使用訓練好的RBF神經網絡對測試數據進行預測,得到測試輸出testY。我們對testY進行了四舍五入操作,以便將其轉換為整數類型的標簽testPred。然后計算測試準確率testAcc、平均絕對誤差testMae、均方根誤差testRmse和F1分數testF1。

3.3.3 評價結果

利用上述模型進行評價,結果見表8。從表8中可以看出,基于主成分分析法清晰的反映出水庫各月份的水體質量狀況:水質達到Ⅰ類水標準有1月、3月、4月、6月、7月共5個月;2月、5月、8月、9月、10月、11月、12月水質狀況均為Ⅱ類。

表8 RBF神經網絡水質評價結果匯總

3.4 對比分析

由表7和表8分析可知,兩種方法在2月份以及7月份出現差異,造成此差異的原因在于兩者在評價過程中側重點不太一致。主成分分析法可以真實客觀地分析當地水庫水質,為水庫改進完善提供一定參考。RBF神經網絡只需要按照水質的各個分級標準傳造出所需的訓練樣本,用訓練完善的計算模型進行水質評價比較容易。該方法簡單,具有很好的實用性。兩種方法評價結果與實際結果相差不大,此研究可用作其他地區參考。

4 結論

本文應用兩種評價方法對磨盤山水庫進行了水質評價并對結果進行了比較,結果表明:

(1)主成分分析法相比于RBF神經網絡評價法可以直觀地反映水庫水質問題,為水庫改善提供一定參考。

(2)RBF神經網絡創建訓練樣本較為簡單,用訓練完善的樣本進行評價,結果更為準確,實用性也更好。

(3)水環境情況比較復雜多變,其評價方法種類豐富,因而評價結果也不盡相同。故需按照自身需求,結合當地情況,有針對性地選擇方法對水質進行評價。

猜你喜歡
水質評價方差分析法
方差怎么算
異步機傳統分析法之困難及其克服
概率與統計(2)——離散型隨機變量的期望與方差
計算方差用哪個公式
滻灞河水質評價方法研究
方差生活秀
基于時間重疊分析法的同車倒卡逃費探析
基于概率統計和模糊綜合評價法的水質評價模型及其應用——以拉薩河水質評價為例
層次分析法在SWOT分析法中的應用
基于SPAM的河流水質評價模型
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合