?

呼倫湖2002–2021 年懸浮物濃度數據集

2024-01-11 10:40李含含許金朵隗曉琪黃澤暉馬榮華
關鍵詞:呼倫湖懸浮物湖泊

李含含,許金朵,隗曉琪,黃澤暉,馬榮華,5*

1.南京信息工程大學,遙感與測繪工程學院,南京 210044

2.中國科學院南京地理與湖泊研究所,湖泊與環境國家重點實驗室,南京 210008

3.國家地球系統科學數據中心,湖泊–流域分中心,南京 210008

4.中國科學院大學,北京 100049

5.草原生態安全省部共建協同創新中心,呼和浩特 010021

引 言

湖泊是地表極其重要的水資源,是人類活動與發展的熱點區域,為流域工農業發展和人類生活提供穩定而清潔的水源[1],監測湖泊水質變化尤為重要。習近平總書記十分關心內蒙古“一湖兩?!保ê魝惡?、烏梁素海、岱海)的生態綜合治理,而湖泊水質的變化監測為解決“一湖兩?!钡乃|改善和環境質量提高等問題提供數據支撐和科學依據。呼倫湖是內蒙古第一大湖泊,湖泊面積約為2339 km2,同時也是內陸同緯度地帶最大的草原型湖泊[2],作為我國北方寒冷干旱地區內陸湖泊的典型代表,在涵養水源、調節氣候、防風固沙及維系呼倫貝爾草原生態系統平衡乃至我國北方生態安全屏障等方面發揮著不可替代的作用[3]。

懸浮物濃度作為水色參數三要素之一,影響著水體的光學特性和物質交換,也是環境監測的一項重要指標,在一定程度上能綜合反映水體的水質特征和水體化學元素遷移、轉化和歸宿的特征和規律[4]。高懸浮物濃度會降低水體透明度,限制光在水體中的傳輸,限制水體浮游生物和沉水植被的生長,影響初級生產力,從而影響湖泊生態環境的變化[5]。因此,對懸浮物濃度進行動態監測具有十分重要的意義。

傳統的人工巡測由于時空尺度差且耗費巨大,難以在懸浮物濃度時空監測上發揮有效作用。衛星遙感具有高頻率、大范圍觀測等特點,能夠提供同一時刻區域面狀水域的遙感影像,因此在水環境監測中有其特有的優勢[6]。目前遙感估算懸浮物濃度的算法主要分為兩類:經驗模型與半分析模型,但針對不同水體類型的湖泊尚未有統一的可用模型[5]。曹志剛等(2016)[7]利用多波段組合建立模型,獲得了洪澤湖懸浮物濃度的長期變化;王卷樂等(2016)[8]利用MODIS(Moderate-resolution Imaging Spectroradiometer)數據的多種光譜指數,逐季建立光譜指數與懸浮物濃度的回歸關系,繼而選擇懸浮物濃度的反演模型,反演了鄱陽湖連續多年、季相尺度的懸浮物濃度。近年來,隨著計算機科學和人工智能技術的發展,機器學習被廣泛應用于懸浮物濃度的遙感反演中[9]。然而,多數研究集中于模型算法的研究,而很少形成長期可供科學界參考和使用的公開數據集。

呼倫湖懸浮物濃度與氣候變化、人類活動、水體富營養化等因素相關,懸浮物濃度數據集對呼倫湖大范圍水監測與評估、區域研究與生態保護等具有重要意義。本研究利用機器學習模型實現呼倫湖懸浮物濃度的高精度反演,以此為基礎,構建長時間、逐年月相尺度的懸浮物數據集。本數據集為掌握呼倫湖懸浮物濃度的總體時空分布、演變特征和驅動力因素提供基礎,為我國生態環境調查評估、區域環境管理等提供基礎數據。

1 數據采集和處理方法

1.1 實測數據采集和處理

呼倫湖地理坐標介于116°58′–117°48′E,48°33′–49°20′N 之間,是內蒙古第一大湖,湖面呈不規則斜長方形,其湖水主要來源于海拉爾河、克魯倫河、東部烏爾遜河和東北部新開河。本研究于2016 年8 月采集了均勻分布在呼倫湖的29 個樣點(圖1),樣點位置及實測SPM 如表1。每個樣點使用棕色采樣瓶(2 L)采集表層至50 cm 水柱內的混合水樣,放到裝有冰塊的保溫箱遮光保存,并于當天做過濾處理,后置于冰箱中保存;同時記錄測量時的天氣、水體透明度、風速、風向、水質狀況、采樣時間等輔助數據,并使用GPS 記錄采樣位置[5]。懸浮物濃度的測量使用“稱重法”,利用450°C 烘烤過后的47 mm 的GF/F 膜過濾水樣,過濾后的膜放至烘箱105°烘烤4 小時,用0.0001 g 精度的天平稱重計計算得到總懸浮物濃度[7]。

表1 實測點位置及SPM 濃度Table 1 The location of the measured points and SPM concentrations

圖1 呼倫湖采樣點分布Figure 1 Distribution of sampling sites in Hulun Lake

1.2 遙感數據下載與處理

1.2.1 MODIS 數據下載

以MODIS(Terra:1999 年至今;Aqua:2002 年至今)為代表的中分辨率海洋水色傳感器被廣泛應用于水質及物候監測[1]。MODIS 具有36 個光譜通道,分布在0.4–14 μm 的電磁波譜內,其空間分辨率為1–2 波段為250 m、3–7 波段為500 m 和8–36 波段為1000 m,可以實現一天覆蓋全球一次[10]。MODIS 的陸地波段(前7 個波段,光譜范圍為443–2130 nm)具有較高的空間分辨率(250–500 m)且在渾濁湖泊不飽和,故使用這7 個波段提取懸浮物濃度[1]。本文選擇從美國航空航天局海洋生物學處理組(Ocean Biology Processing Group,OBPG,https://oceandata.gsfc.nasa.gov)的數據網站下載呼倫湖區域2002–2021 年的MODIS Aqua Level-1A(L1A)數據。呼倫湖每年11 月至來年4 月為結冰期,因此只用5 月至10 月的遙感影像來進行處理分析。

1.2.2 數據處理

在SeaDAS 8.1 軟件中對下載的MODIS L1A 數據進行再處理,生成Level-1B 數據,然后進行處理以估算反射率。由于常用的水體大氣校正算法難以用于內陸湖泊,導致遙感反射率(Rrs)存在較大不確定性,因此選擇從傳感器的輻射度中去除水汽和臭氧的吸收以及瑞利散射,以生成瑞利校正的反射率(Rrc,公式1)[11]。事實上,Rrc已廣泛用于監測湖泊懸浮物濃度[12]。

使用SeaDAS 8.1 中的內部工具,將具有相對較高空間分辨率(250–500 m)的前7 個波段(469–2130 nm)與具有500 m 空間分辨率的最后5 個波段重采樣到250 m。采用掩膜處理來去除低質量的Rrc像素。

(1)云掩膜:在海洋水色處理中,默認的云掩膜標志(Rrc(859)>0.027)通常會將渾水等像素誤判而排除,造成大量數據丟失,這對呼倫湖效果尤為顯著。根據對過去研究的閾值測試,發現Rrc(2130)>0.021 的閾值適合于研究湖泊錯誤!未找到引用源。,但這樣特定的閾值仍會掩蓋一些藍藻浮渣和極端渾濁的水域。

(2)陸地掩膜:呼倫湖水體變動大,每景MODIS 數據根據歸一化差異水指數(Normalized Difference Water Index,NDWI)確定湖泊邊界,然后利用中國湖泊邊界錯誤!未找到引用源。對提取水體進行進一步篩選。此外還采用浮游藻類指數(floating-algae index FAI)的閾值(即-0.004)來去除藍藻水華像元干擾。為去除陸地鄰近效應,采用了Feng 等(2018)錯誤!未找到引用源。的方法移除近岸的4 個像素。

1.3 懸浮物濃度反演模型構建

考慮到SPM 存在較大的時空變異性,呼倫湖的實測數據難以獨立構建模型,因此本文使用Cao等(2023)[17]的機器學習模型從MODIS Aqua 獲取呼倫湖的懸浮物濃度。同時,我們使用前文所述的29 個實測點對該模型在呼倫湖反演的結果進行驗證(詳見節3 數據質量控制和評估)。簡單而言,Cao 等(2023)的模型基于支持向量機所開發,使用全國133 個湖泊采集的903 個樣點所構建。模型輸入變量包括了Rrc(469), Rrc(555), Rrc(645), Rrc(859) , Rrc(1240)和三個波段比率(Rrc(555)/ Rrc(469),Rrc(645)/ Rrc(555),Rrc(859)/ Rrc(555)),輸出變量為SPM 濃度。在模型訓練前,輸入變量進行標準化,并歸一化到0–1 范圍;懸浮物濃度亦進行標準化并使用log 函數進行轉換。采用網格搜索法來確定支持向量機的參數,最終獲得懸浮物反演模型。模型的主要參數如表2 所示。更多的細節參考Cao 等(2023)[17]。

表2 用于估算SPM 的支持向量機回歸模型參數Table 2 Hyperparameters for the support vector regression model to estimate SPM

2 數據樣本描述

基于上述SPM 反演模型完成2002–2021 年間的呼倫湖懸浮物濃度反演,形成年均濃度分布數據集(圖2)和月均濃度分布數據集(圖3)??傮w上,呼倫湖的懸浮物濃度較高(平均值53.6 mg/L,標準差為7.95 mg/L),表明呼倫湖水體較為渾濁。從空間分布上看,呼倫湖懸浮物濃度西南部比東北部變化明顯,最大值、最小值均在西南部。在人類活動、社會因素和自然因素的影響下,在2002年至2021 年期間,懸浮物濃度整體呈先上升后下降的趨勢,其中2006–2013 年較高,自2014 年逐步下降。2006 年為補充呼倫湖水量,從海拉爾河引水,外源的輸入增加,因此2006–2013 年懸浮物濃度維持較高狀態。2014 年以來懸浮物濃度下降與風速的下降和流域的植被恢復有關。

圖2 2002–2021 年呼倫湖年均懸浮物濃度空間分布Figure 2 Spatial distribution of annual mean suspended matter concentration in Hulun Lake from 2002 to 2021

圖3 2002–2021 年呼倫湖月均懸浮物濃度空間分布Figure 3 Spatial distribution of monthly mean suspended matter concentration in Hulun Lake from 2002 to 2021

在季節上,呼倫湖的懸浮物濃度7 月最低(平均值37.7 mg/L,標準差為6.95 mg/L),10 月最高(平均值74.9 mg/L,標準差為13.20 mg/L),這是因為呼倫湖為淺水湖泊(平均水深為5.7m),風速引起的底泥再懸浮作用是懸浮物濃度季節變化的主要原因[7]。呼倫湖秋季風速較高,因此在9 月和10 月具備較高的濃度。

3 數據質量控制和評估

將MODIS 遙感數據反演的懸浮物濃度與樣點實測值進行結果驗證,以保證各期模型在遙感數據上應用的有效性。主要采用決定系數(R2)、均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)驗證,計算方法如下。

其中N表示用于計算的數據個數,i代表數據的下標,X和Y則分別代表用于評價的數據變量。

將Cao 等(2023)[17]模型應用于呼倫湖獲取SPM 濃度。利用29 個實測點的位置提取SPM,與實測SPM 濃度對比評價模型的精度。結果發現該模型在實測樣點的精度較高(R2=0.71,RMSE 為9.6 mg/L,MAPE=16.5%)(圖4),在呼倫湖表現較好。鑒于模型在呼倫湖的相對誤差低于35%,高于業內對水色產品算法的精度要求錯誤!未找到引用源。,故可用該模型對呼倫湖懸浮物濃度進行遙感反演估算。雖然本次覆蓋了SPM 濃度20–80 mg/L 的范圍,具有一定代表性;但是,可能未覆蓋其他季節的極端情況,因此未來我們也將增加更多呼倫湖實測數據進一步驗證或優化模型。

圖4 支持向量機模型精度驗證圖Figure 4 Accuracy verification diagram of the support vector machine model

4 數據使用方法和建議

本數據集是基于支持向量機和星地同步數據構建的模型反演結果,其精度滿足要求。本數據集實體解壓后的tif 數據可使用專業的GIS 軟件打開和編輯再加工;其時間序列涵蓋了2002–2021 年的呼倫湖懸浮物濃度的時空分布信息,可為呼倫湖大范圍水監測和評估、生態保護等提供參考與數據支持。

致 謝

感謝美國航空航天局(NASA)提供MODIS 數據和處理支持,感謝湖泊–流域數據中心提供實測數據構建模型。

數據作者分工職責

李含含(1997—),女,河南開封市人,碩士生,研究方向為懸浮物濃度遙感監測。主要承擔工作:方案設計與實施,論文撰寫,數據處理。

許金朵(1982—),女,江蘇省睢寧縣人,碩士,工程師,研究方向為數據庫建設、數據共享與地理信息系統。主要承擔工作:數據準備,數據整理與上傳。

隗曉琪(2000—),女,陜西省西安市人,碩士生,研究方向為湖泊固有光學特性的遙感反演。主要承擔工作:遙感數據預處理,數據產品質量控制。

黃澤暉(1999—),男,河南省洛陽市人,碩士生,研究方向為湖泊藍藻水華的遙感監測。主要承擔工作:實測數據采集與分析處理。

馬榮華(1972—),男,山東臨沂市人,博士,研究員,研究領域為湖泊環境遙感、湖泊-流域數據共享。主要承擔工作:論文修改完善,數據方法指導。

猜你喜歡
呼倫湖懸浮物湖泊
懸浮物對水質氨氮測定的影響
坐在呼倫湖畔看星星
坐在呼倫湖畔看星星
新巴爾虎寫意(組詩)
你相信嗎?湖泊也可以“生死輪回”
“害羞”的湖泊
奇異的湖泊
廢水懸浮物國標檢測方法的修改建議
壓裂返排液中懸浮物去除的室內研究
雷州灣海域懸浮物濃度遙感監測研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合