?

基于猶豫模糊集的水質評價方法

2024-02-03 13:10戴俊杰毛小燕劉鋒琴
寧波大學學報(理工版) 2024年1期
關鍵詞:水質評價模糊集測度

曹 磊,戴俊杰,毛小燕*,蔣 吉,劉鋒琴

(1.寧波大學 信息科學與工程學院,浙江 寧波 315211;2.寧波大學科學技術學院 信息工程學院,浙江 寧波 315300;3.慈溪市水利局,浙江 寧波 315399)

隨著人類社會經濟的飛速發展,水環境污染以及水生態退化等問題日益明顯,嚴重違反了可持續發展理念,背離了習近平同志“綠水青山就是金山銀山”的重要論斷.因此加強水環境治理已經成為各省政府的當務之急,而其中對水質的評價是所有事項中的重中之重,只有對水質觀測數據進行合理有效的評價才能引導制定科學有益的防治對策.從這方面來說,水質綜合評價的合理性將直接影響管理者的決策[1-2].

目前,國內外常見的水質評價方法有單因子評價、神經網絡評價、模糊綜合評價等.單因子評價是指采用目標水體中所有參與綜合評價的水質指標,選取其中最差的水質單項指標所屬的類別作為該目標水體的類別[3],其對水質的要求過于保護,無法客觀地反映水體的綜合狀態.人工神經網絡(Artificial Neural Networks)是一種模仿動物神經網絡行為特征,通過調節內部大量節點參數及其權重信息從而實現其擬合函數、處理信息等功能的算法.早在20 世紀末,就已經有學者將模型結構運用到水質評價任務中[4-5].雖然神經網絡具有很好的客觀性,精度也相較于其他方法要高,但其訓練過程需要大量帶標簽樣本數據,且特征選取會極大地影響最終模型的效果.近幾年也有學者對神經網絡予以改進,用于水質評價研究[6-7],但也不能達到令人十分滿意的效果.由于水質評價是一個多指標影響的復雜過程,且對污染程度的分級界限較為模糊,傳統方法很難刻畫這種不確定性,而模糊集理論為解決此類不確定性問題提供了新思路.模糊綜合評價[8]關鍵在于隸屬函數和指標權重的確定,常通過構造高斯隸屬函數[9]或梯形隸屬函數[10]來確定監測數據與各等級間的隸屬度,有效地解決了評價標準邊界模糊問題;而權重的確立方法主要有熵權賦值法[11]、超標倍數法[12]及層次分析法[13].在實際應用中,決策者在確定各屬性隸屬度值時,常會遇到多個數值之間難以取舍的問題.為處理這類情況,Torra 等[14-15]提出了猶豫模糊集概念,其允許選定多個數值作為隸屬度,能夠更真實地體現決策者猶豫不決的心理.因此本文也首次將猶豫模糊集應用到水質評價領域.

本文采用一種基于猶豫模糊集的水質評價模型,并提出一種新的基于線性插值的悲觀補齊方案,根據距離測度來評價水質等級.通過浙江省部分水庫的實際算例,進行穩定性和有效性檢驗,以期豐富水質評價方法,為水資源監管提供客觀科學依據.

1 指標篩選

研究數據來源于浙江省生態環境廳公布的地表水水質自動檢測數據.根據國家《地表水環境質量標準》(GB 3838—2002)規定,基本的水質評價指標有24 項.但由于指標過多且存在對評價結果參考意義較小的指標,因此需先對指標進行篩選和處理.

挑選慈溪市7 處水體,采集共計10 個月的監測樣本,并收集相應的水質等級數據.水體成分和外界環境因素(下文稱為特征)具體包含: 水溫、pH值、溶解氧、高錳酸鹽、總磷、總氮、硫化物等;對應的水質等級分別為1 級至6 級,等級越低表示水質越好,其中,6級表示水質指標嚴重超標,又稱劣V 類,即超出地表水環境質量標準規定的五類水質.首先初步剔除那些存在缺失值以及無任何參考價值的特征(如氣溫、水溫等),接著計算每個特征與水體等級之間的相關系數.水質特征及等級具體結果見表1.

表1 水質特征與水質等級的相關分析

通過相關性分析篩選出7 項顯著相關特征.特征與水質等級之間存在相關性,各特征之間也同樣存在高度相關性,比如“溶解氧”與“五日生化需氧量”以及“氨氮”與“總氮”.為避免選擇的特征之間相關性過高,通過查閱相關文獻,并結合《浙江省水資源公報》分析各水庫近年來的水質狀況,最終選取溶解氧(DO)、高錳酸鹽指數(CODMn)、總磷(TP)和氨氮含量(NH3-N) 4 項監測數據作為本文水質評價指標,并且以《地表水環境質量標準》(GB 3838—2002)作為評價依據(表2).

表2 地表水環境質量標準 mg·L–1

2 評價方法

首先構建水質的猶豫模糊標準評價矩陣,在《地表水環境質量標準》(GB 3838—2002)基礎上,采用專家打分值建立猶豫模糊矩陣,再通過猶豫模糊指數熵來計算各指標間權重,采用升維補齊方式統一猶豫模糊數的維度,最后使用加權猶豫模糊蘭氏距離測度方法計算參評水域猶豫模糊矩陣與標準評價矩陣各等級的距離,最終根據距離最小原則劃定水質等級,從而得出水質評價結論.

2.1 水質評價標準矩陣的建立

猶豫模糊集定義: 設論域X={x1,x2,…,xn},則X上的猶豫模糊集(Hesitant Fuzzy Set,HFS)定義為,其中hM(x)為猶豫模糊數,是[0,1]中一些數值的集合,表示集合X中的任一元素x對集合M的隸屬度.特別地,如果各猶豫模糊數有且僅有一個隸屬度值,那么猶豫模糊集退化為普通的模糊集.

水質評價指標的屬性集合X={溶解氧,高錳酸鹽指數,總磷,氨氮},并設置5 個不同等級,即等級屬性集合為G={優,良,一般,較差,差}.邀請3 名水環境評價方面專家組成水質評價小組,參照表2 規定的各水質指標值,對溶解氧、高錳酸鹽指數等評價指標進行打分,分值在0~1,且分值越高代表水質等級越高.最后對評價小組的分值進行合并,形成水質評價標準矩陣.由于不同專家可能有不同的專業知識、背景和偏好,導致分值可能存在差異;但每位專家的意見都需被考慮,因此水質評價標準矩陣中的每個指標值用猶豫模糊數表示為專家打分值組成的集合(表3).

表3 水質評價標準矩陣

2.2 指標權重計算

在指標權重信息未知的條件下,通常需要人為主觀給出.本文通過實際數據信息構造猶豫模糊指數熵的方式來確定指標權重,避免了過多人為主觀因素的影響.

定義一組猶豫模糊數:

根據定義計算猶豫模糊指數熵,運用信息熵最小化原則計算確定屬性權重:

2.3 距離測度計算

對于任意集合X={x1,x2,…,xn}上的猶豫模糊集M和N,距離測度d(M,N)需滿足以下性質:

常用距離測度的方式有多種,如豪斯道夫距離測度、海明距離測度、蘭氏距離測度[17].本文水質評價中,不同專家對參評水庫打分可能會出現一定差異性,如當遇到評價指標存在偏倚較大的數據,就會導致最終的評價結果偏離真實情況.因此本文將采用蘭氏距離進行測度分析,因其是無量綱,并且是采用比值方式來衡量數據之間的距離,減少了極端值的影響,能有效避免上述問題對評價結果的影響.

在進行距離測度計算時,常會遇到猶豫模糊評價矩陣與水質評價標準矩陣在各指標下隸屬度不等長的情況,導致無法直接進行距離度量.此時通常都會采用升維或降維的方式將猶豫模糊數長度統一,但降維方式會丟失過多的專家打分信息,因此這里選擇采用升維補齊方案,將長度略短的猶豫模糊數補齊至更長的猶豫模糊數.補齊數據的方式也有多種,如對情境樂觀的樂觀補齊法,可選用猶豫數中最大的隸屬度進行補齊;偏向于規避風險的悲觀補齊法,可挑選猶豫數中最小的隸屬度進行補齊[18].本文認為雖然補齊方式可以很大程度上保留專家們的可靠評價,但是無論是樂觀補齊法還是悲觀補齊法都未能較好地權衡所有專家之間的意見,鑒于水質評價是一個需要嚴格把關的問題,因此悲觀傾向是能夠被采納的.

所以本文提出基于線性插值的悲觀補齊法,它能很好地全面考慮各個專家之間的態度.具體操作如下: 設定一組猶豫模糊數和升維大小d,其中lxi≤d.為保證補齊方法偏向于悲觀,從hM(xi)中選取最小的兩個隸屬度,且,并且在兩者之間按照一維線性插值法插入共d-個隸屬度,從而達到補齊的效果.

在水質評價的實際運用中,經常會出現不同參評水庫有著相同猶豫模糊數的情況.例如一個6名專家組成的評價小組對甲、乙水庫的某項水質指標等級進行打分,假設其中專家小組對甲水庫的評分情況為4 名專家評分是0.8,另外2 名專家評分是0.6,用猶豫模糊數{0.6,0.8}表示評分值;專家小組對乙水庫評分情況為3 名專家評分是0.8,另外3 名專家評分是0.6,用猶豫模糊數{0.6,0.8}表示評分值.雖然甲、乙水庫的評價結果完全相同,但顯然不符合實際的評分情況.因此,需引入加權猶豫模糊數概念,對猶豫模糊數中每個隸屬度值都進行加權處理,且權重大小能反映出每個隸屬度的重要程度.但加權的猶豫模糊數也分為專家權重已知和未知兩種情形.在專家權重已知情況下,構造加權猶豫模糊數,設專家e1,e2,…,ep對應的權 重向 量wq=(w1,w2,…,wp)T,其 中,wk≥ 0,且

構造加權猶豫模糊數為:

但在絕大多數情況下,專家權重是未知的,此時則令每位專家權重都相同,結合加權猶豫模糊數概念,可給出加權猶豫模糊蘭氏距離公式.

假設任意xi?X的權重為wi,其中i=1,2,…,n,并滿足wi? [0,1],,則加權猶豫模糊蘭氏距離[19]:

由此運用加權猶豫模糊蘭氏距離測度方法計算猶豫模糊矩陣與標準評價矩陣的距離,并根據距離最小原則可以得出最終結論.

3 實際應用

使用上述方法對浙江省部分水庫水體進行水質評價,并對評價結果進行有效性檢驗,最后再與其他評價方法進行對比檢驗.

3.1 算例

出于保護水資源的戰略選擇,現對浙江省內5處(編號為A、B、C、D、E)水體進行各自的水質量評價.為保證評價結果的可靠性和專業性,邀請8 名水環境評價方面的專家,并根據5 處水體的各自情況分別進行打分評價,整理得到各水體的猶豫模糊評價矩陣,其相關數據見表4.

表4 猶豫模糊評價矩陣

根據表4 的猶豫模糊評價矩陣,利用式(1)計算出各水體指標的猶豫模糊指數熵.其中,以水體A 為例:

在得到水體A 在DO 指標上的猶豫模糊指數熵后,同理可構建出各水體相關指數的猶豫模糊指數熵矩陣,其相關數據見表5.

表5 猶豫模糊指數熵矩陣

接著可進一步計算出每個水體在單個指標上的平均模糊熵.再以表5 中DO 指標為例:

其中,E1表示第1 個指標DO 的平均指數熵.同理可得其余3 項指標的平均指數熵分別為E2=0.683(CODMn),E3=0.754(TP),E4=0.534(NH3-N).

通過每個指標模糊熵在總體上的占比,可以得到各個指標的具體權重數值.同樣,以DO 指標為例,并依照式(2)可得:

同理可得,w2=0.24(CODMn),w3=0.19(TP),w4=0.36(NH3-N).

由于5 處水體的猶豫模糊評價矩陣與水質評價標準矩陣在各指標下的隸屬度不等長,導致無法直接進行距離測度計算,因此需要分別對表3 和表4 進行升維處理.升維后的矩陣數據分別見表6和表7.

表6 升維后的水質評價標準矩陣

表7 升維后的猶豫模糊評價矩陣

最后根據式(3)計算各水體與各評價等級之間的距離測度,其結果見表8.由最小距離原則,本文將測度最小的等級作為該水體的等級評價,最終各水體的水質評價結果見表9.從表9 可以看出本文評價結果與官方評價結果基本一致,僅A 水體的評價等級與官方出現差異,但對于A 水體來說,從表8 可以看出,距離“良(II)”等級的距離為0.239 6,距離“一般(III)”等級的距離為0.223 0,兩者相差僅0.016 6,因此不論從后續改進還是總體準確性來說,本文方法都具備較好的可靠性.

表8 各水體與各評價等級之間的距離測度

表9 各水體的水質評價結果

3.2 穩定性分析

為驗證本文評價方法的穩定性,現將上述5 個水體另外相鄰3 d 的監測數據和對應的官方評價等級依次進行上述步驟處理,最終得到本文的評價等級,結果見表10.

表10 各水體連續3 d 的水質評價結果

從表10 可以明顯看出,水體在相鄰時間點的水質變化不明顯,并且本文的評價等級與官方評價等級基本一致,還能在不同時候保持兩者的高度一致性,這也同樣說明了本文方法的穩定性.

3.3 有效性分析

采用水質評價領域常用的BP 神經網絡和模糊綜合評價方法來驗證本文方法的有效性,其最終對比結果見表11.

表11 不同方法水質評價結果

根據表11 的對比結果可以看出,BP 神經網絡在水質評價中的結果與官方之間存在一定差異,并且神經網絡的訓練需要大量帶標簽數據,同時網絡輸出值也并非是離散值,而是連續值.因此如果取舍不恰當,容易造成最終結果的偏差.而模糊綜合評價則與官方評價出入較大,因其僅考慮一位專家的評價,雖簡單方便,但也容易導致大量極端值的出現,從而導致結果可信度的缺失.綜上所述,本文方法還是具有一定的優越性.

4 結論

水體環境監測是重要的民生大事,是關乎推動建設美麗社會開展的極大事宜,科學全面的水質量評價是其中的重要環節.本文通過篩選有效的水質評價指標,建立水體質量評價體系,并采用線性插值的悲觀補齊方案和蘭氏距離測度方法,提出一種針對水體質量評價的方法,通過自身和對比檢驗驗證了其穩定性和有效性,以期為日后的水質評價提供一定的參考.

猜你喜歡
水質評價模糊集測度
三個數字集生成的自相似測度的乘積譜
R1上莫朗測度關于幾何平均誤差的最優Vornoi分劃
基于上下截集的粗糙模糊集的運算性質
非等熵Chaplygin氣體測度值解存在性
Cookie-Cutter集上的Gibbs測度
滻灞河水質評價方法研究
基于概率統計和模糊綜合評價法的水質評價模型及其應用——以拉薩河水質評價為例
基于SPAM的河流水質評價模型
基于粗糙模糊集的輸電桿塔塔材實際強度精確計算
E-廣義凸直覺模糊集①
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合