?

基于CNN-CA 模型的地表覆蓋變化模擬

2024-01-11 09:12孔凡強劉柄宏葛瀟欽王品源張清琪
自然資源信息化 2023年6期
關鍵詞:自動機元胞鄰域

孔凡強,劉柄宏,葛瀟欽,王品源,張清琪

(1.浙江省測繪科學技術研究院,浙江 杭州 310000 ;2.紹興市上虞區自然資源監測中心,浙江 紹興 312000)

0 引言

地表覆蓋數據具有全覆蓋、無縫隙、無重疊、種類繁多等特征。它的預測對產業、人才布局具有重要影響。早期研究一般僅對地表覆蓋各地類相互轉化總量進行預測,比較常用的模型是馬爾可夫模型[1],它將地表覆蓋變化看作以年為單位的離散過程,且每年的轉化率相等,以此預測地表覆蓋數據。隨著計算機技術的發展,元胞自動機開始被引入該領域[2-3],從鄰域出發預測中心單元的變化規律。土地地類的轉化僅與鄰域相關,這與地理角度中的距離相關性不謀而合。這種方法取得了較好效果,隨之也帶動了矢量元胞自動機的發展[4]。但元胞自動機局部驅動土地變化,導致預測轉化總量會與實際差距較大,因此,CAMarKov 方法成為了主流方法。它將馬爾可夫模型與元胞自動機相結合,具備總量控制與局部驅動的雙重優勢[5-6],進一步提升預測精度。鑒于元胞自動機的參數確定存在人為主導的缺陷,許多學者結合元胞自動機與客觀方法研究地表覆蓋變化,如遺傳算法[7]、支持向量機[8]、系統動力學[9]、深度學習[10]等,通過已有的樣本預先訓練確定相關參數,進而預測未知的數據。這使得地表覆蓋變化預測方法進一步完善,精度越來越高。

綜上所述,地表覆蓋變化情況復雜,影響因子多,單一方法難以準確模擬。地表覆蓋變化受鄰域狀態變量和鄰域空間分布狀態的影響,元胞自動機無法實現通過鄰域狀態模擬復雜系統?;诖?,本文采用卷積神經網絡-元胞自動機模型(CNN-CA),利用卷積神經網絡提取元胞的鄰域空間分布特征[11-12],通過元胞自動機提取元胞的鄰域狀態特征,組合空間分布特征與狀態特征并模擬地表覆蓋變化。本文利用6 種卷積核和采樣窗口組合搭建神經網絡結構,分別模擬地表覆蓋變化,并對模擬結果的生產者精度(PA)、用戶精度(UA)、總體分類精度(OA)和Kappa 系數4個指標進行計算,分析卷積核與采樣窗口大小對卷積神經網絡計算質量的影響。CNN-CA 模型能夠顧及元胞空間分布特征,可以進一步提高CA 模型的模擬應用能力。

1 地表覆蓋CNN-CA 模型

CNN-CA 模型充分發揮卷積神經網絡和元胞自動機的優勢,通過卷積神經網絡計算各單元向各地類的轉化概率,并顧及元胞鄰域狀態,建立了模型框架,如圖1 所示,該模型框架包括輸入數據、卷積神經網絡、元胞自動機、模擬輸出4個部分。選取11 個影響因子作為輸入數據,對矢量數據進行柵格化,保持各個影響因子柵格單元的尺寸和坐標一致。通過模擬區域的界線提取柵格數據掩膜,形成一組范圍相同、行號和列號相等的數據。為了加快神經網絡訓練速度并保持各個特征的相同維度,還需要對柵格數據進行標準化處理,即每個單元格數值除以該層數據的最大值,使柵格數據范圍為0~1。模型搭建的卷積神經網絡包括2 個卷積層和2 個池化層;通過全鏈接層輸出轉化概率。元胞自動機用于計算元胞鄰域狀態空間,通過狀態空間計算元胞向每種地類的轉化概率。融合2 個模型計算概率并計算最終元胞的轉化方式。依據CNN-CA 模型結構,元胞向各個地類轉化的概率計算方法如公式(1)所示,隨機約束計算方法如公式(2)所示。

圖1 CNN-CA 模型框架

式中:Pm為元胞向m地類轉化的概率;為卷積神經網絡計算的元胞(i,j)向m地類轉化的概率;為元胞自動機計算的元胞(i,j)向m地類轉化的概率,即中心元胞鄰域m地類占鄰域的比例,若元胞鄰域不存在m地類,則Pm為0,這種情況與實際不相符,因此本文在占比的基礎上加0?5;為元胞(i,j)向m地類轉化的隨機約束;a為0~1 的隨機數;k為控制隨機強度的參數,本文令k=2。

2 CNN-CA 模型應用分析

2.1 研究區

本文研究區位于浙江省紹興市上虞區的曹娥街道和百官街道,地處浙江省紹興市東北部、錢塘江南岸,擁有高速公路、高鐵、鐵路、港口、運河等基礎設施。近幾年,研究區的經濟、農業、工業、商業產值均穩步提升,地表覆蓋變化較明顯。因此,本文以研究區為試驗區驗證模型的準確性。

2.2 數據來源和處理

本文試驗數據均來自浙江省地理國情監測項目,其中,2017 年、2019 年、2021 年原始地表覆蓋數據是1:1 萬矢量數據。本文將三級地類轉化為二級地類,研究區包括林草覆蓋、種植植被、房屋建筑(區)、鐵路與道路、構筑物、堆掘地表、水域7 種二級地類。將矢量數據轉化為20 m×20 m 柵格數據;將5 m 分辨率數字高程模型(DEM)重采樣為20 m 分辨率地形數據,由DEM 數據計算生成坡度、坡向數據;利用空間矢量數據計算距農村道路距離、距公路距離、距城市道路距離、距高鐵距離、距普速鐵路距離、距行政中心距離、距便民中心距離的歐式距離并按1 000 m 分級別的柵格作為影響因子,選取區政府和鄉鎮政府駐地為行政中心,以學校與醫院2 個類型計算便民中心。

2.3 參數確定與模型訓練

卷積神經網絡采樣窗口與卷積核的大小對模擬結果影響很大。本文在其他參數保持不變的情況下,采用9×9、17×17、23×23 采樣窗口與3×3、5×5 卷積核的兩兩組合試驗,形成6 種網絡結構。6 種網絡結構都是3 層結構,第一個卷積層采用55 個卷積核,第二個卷積層采用275 個卷積核,第三個卷積層采用1 375 個卷積核,每個卷積層后接入一個2×2 的最大值池化層壓縮數據。為保證輸入與輸出圖像一致,模擬前需對各個柵格數據進行擴展。網絡最后的全連接輸出層神經元有7 個,對應7 種不同的地表覆蓋類型。本文以研究區2017—2019 年地表覆蓋變化情況為整體樣本,通過采樣窗口共獲取212 790 個樣本;神經網絡訓練時將batch 設置為30,即每次對30 個樣本進行訓練;將epoch 設置為15,即總體樣本循環訓練15 次;采用交叉熵損失函數,通過梯度下降法優化網絡結構,不同網絡結構的運行效率如表1 所示。

表1 不同網絡結構的運行效率

由表1 可知,采樣窗口大小和卷積核大小都與訓練時間成正比。卷積核變大時需要計算的參數增多,每個5×5 卷積核比3×3 卷積核多16 個偏移參數和16 個權重參數;采樣窗口變大時參與運算的柵格數量增多,所花費時間也增多;模擬時間同理,模擬時間僅執行1 次運算,所以時間增加幅度小。另外,由訓練集精度可知,采樣窗口和卷積核的尺寸不是越大越好,尺寸過大會導致參與運算的范圍變大、冗余數據變多,產生過擬合的問題。9×9 采樣窗口、5×5 卷積核網絡的訓練集精度最高,9×9 采樣窗口、3×3 卷積核網絡的執行速度最快,23×23 采樣窗口、5×5 卷積核網絡的執行速度和訓練集精度均最低。

元胞自動機采用5×5 擴展莫爾型鄰域為模擬范圍,計算鄰域狀態對元胞變化的影響。

2.4 試驗結果與分析

本文利用6 個不同的CNN-CA 模型對研究區進行模擬。選取生產者精度、用戶精度、總體分類精度和Kappa 系數4 個評價指標進行模型評價。生產者精度表示某類別真實數據被正確分類的概率;用戶精度表示落在某類別的檢驗點被正確分為該類別的比例;總體分類精度表示所有正確分類的數量占總數的百分比;Kappa 系數用于分類的一致性檢驗,數值范圍為0~1,Kappa 值越大表示分類精度越高,一般75%以上的Kappa 值表示分類精度及可信度較高。計算方法如公式(3)~(6)所示。

式中:PAi表示i地類生產者精度;Ni表示i地類正確分類的數量;Oi表示真實數據中i地類的總數;UAi表示i地類用戶精度;Mi表示模擬數據中i地類的總數;OA表示總體分類精度;A表示正確分類的土地數量;Z表示總體土地數量;Kappa表示Kappa 系數;PO表示模擬正確的柵格數量占柵格總數的比例,為觀察一致性;PC為期望一致性。

生產者精度與用戶精度用于評價單一地類的模擬精度,總體分類精度與Kappa 系數用于評價總體的模擬精度。計算模擬結果與2021 年地表覆蓋數據的混淆矩陣,通過混淆矩陣計算6 個網絡模型的4 個評價指標。

模擬精度評價指標如表2 所示,模擬精度與訓練集精度類似。各地類模擬精度與總體精度的采樣窗口和卷積核尺寸都不是越大越好。6 種網絡結構的總體分類精度均達83%以上,除堆掘地表和鐵路道路的單個地類模擬精度達73%以上且大部分模擬精度高于85%,表明模型模擬精度很高;Kappa 系數均達79%以上,表明模擬結果一致性較好。以上結果說明,模型對地表覆蓋變化預測具有一定的可靠性,總體上各個地類的模擬都達到了比較滿意的效果。9×9 采樣窗口、5×5 卷積核網絡在各項指標中脫穎而出,除堆掘地表外指標精度都達90%以上,模擬效果最好。在9×9與17×17 采樣窗口中,5×5 卷積核的模擬精度總體比3×3 卷積核的模擬精度更高;在23×23 采樣窗口中,卷積核的尺寸與模擬精度沒有一定關系。這說明采樣窗口變大導致冗余數據增多,難以通過卷積核尺寸控制模擬精度,過大的采樣窗口不適于地表覆蓋變化模擬?;贑NN-CA 模型的鐵路與道路指標模擬精度最高,9×9 采樣窗口、5×5 卷積核網絡的鐵路與道路生產者精度和用戶精度分別達到0?982 和0?992,這是因為鐵路與道路具有變化周期長、分布穩定的特點。堆掘地表的6 種網絡結構模擬均處于較低水平,其中,生產者精度約60%,用戶精度基本處于40%以下。在地理國情監測分類中,凡是有堆積物的地表都被劃為堆掘地表,難以通過特征模擬其變化規律,這最終導致卷積神經網絡模擬精度低。

表2 模擬精度評價指標

3 結論

本文采用的卷積神經網絡-元胞自動機模型,在傳統元胞自動機模型的基礎上加入卷積神經網絡,將元胞鄰域的空間分布特征作為影響因子并納入計算。利用6 種不同網絡結構對研究區地表覆蓋變化進行模擬,對比分析不同卷積核和采樣窗口對模擬結果質量的影響。研究結果表明,地表覆蓋變化模擬卷積核和采樣窗口的尺寸不是越大精度越高,而是由實地特點確定。此外,本研究對模擬結果進行多個指標評價,討論了不同地類模擬精度的原因。結果表明,CNN-CN 模型在地表覆蓋變化模擬中的總體分類精度和單一地類模擬精度較高,且模擬效果的一致性較好。因此,該模型能夠較好地模擬地表覆蓋變化,在該領域具備一定的指導作用。

本文對于人為定義超參數的測試較少,如網絡層數與網絡學習率,這將是后續研究的重點內容。

猜你喜歡
自動機元胞鄰域
{1,3,5}-{1,4,5}問題與鄰居自動機
稀疏圖平方圖的染色數上界
一種基于模糊細胞自動機的新型疏散模型
一種基于模糊細胞自動機的新型疏散模型
基于鄰域競賽的多目標優化算法
基于元胞自動機下的交通事故路段仿真
基于元胞自動機下的交通事故路段仿真
廣義標準自動機及其商自動機
關于-型鄰域空間
基于元胞數據的多維數據傳遞機制
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合