?

資源型城市聚集區域PM2.5 影響因子分析

2024-02-27 11:51李紅雨
資源節約與環保 2024年1期
關鍵詞:資源型平原排序

李紅雨

(成都理工大學數學地質重點實驗室 四川 成都 610051)

引言

資源型地區是指依賴于本地區礦產、森林等資源的開發利用而發展并且以資源型產業為重要支撐的特殊地區。自2013 年《全國資源型城市可持續發展規劃(2013-2020)》正式發布以來,資源型城市地區的發展基礎不斷地改善,在產業發展、城市發展和社會民生等多方面都取得了顯著的成效。但資源型城市的主要產業一般是高污染、高消耗的產業,導致了生態環境污染問題的顯露。

2021年《推進資源型地區高質量發展“十四五”實施方案》正式獲批復,其中著重提到了推動新時代資源型地區綠色發展的多項要求[1]。張文忠[2]提出要推進資源型城市的生態文明建設,讓生態環境千瘡百孔的資源型城市的天更藍、山更綠、水更清、環境更優美,邁向生態文明新時代。

以資源型城市聚集的代表性區域汾渭平原為例,自2018 年6 月起汾渭平原被列為全國環境空氣質量狀況三大重點區域之一,因此研究汾渭平原大氣污染變化規律對改善全球資源型地區生態環境、建設生態文明具有重要的意義。通過文獻的總結,發現研究者們已經找到多個因素去探求影響大氣污染的原因,有助于從不同的方面去改善大氣污染問題?;诖?,本文著眼于研究資源型城市群PM2.5多個影響因素的重要性排序,首先對該地區PM2.5的時空特征進行簡要介紹,再對初步選取的15 個變量進行相關性分析,篩除掉部分相關性過強的變量后,最后對剩余的12個影響因素進行隨機森林特征重要性排序,探尋對濃度值變化影響最大的因素。

1 研究區概況、數據來源及數據預處理

1.1 研究區概況

汾渭平原是黃河流域汾河平原、渭河平原及其周邊臺塬階地的總稱,包括了陜西省的西安、寶雞、咸陽、渭南、銅川,山西省的晉中、呂梁、臨汾、運城,以及河南省的洛陽、三門峽11 個地級行政區,屬于綜合性資源型城市聚集區域。汾渭平原于2018 年6 月起被生態環境部列為大氣污染重點區域,根據最新數據,汾渭平原合計土地面積為153256km2,常住人口約5024 萬人,是黃河中游地區最大的沖積平原,氣候為溫帶季風性半濕潤區氣候。本文選擇汾渭平原作為研究區。

1.2 數據來源及數據處理

目前,針對于汾渭平原整體的統計數據并不多,本文通過其所處的地級市數據來整理出區域數據,詳見表1。PM2.5年均濃度數據主要參考LIU H等[3]的數據集,填補了目前研究中2013 年以前PM2.5濃度數據的缺失。

表1 數據來源

根據資源型城市產業特點及相關的總結,最終選取了15 個變量,其中自然因素主要對污染物的傳輸擴散、二次生成以及吸收沉降有緊密的聯系,而其他4個方面主要與污染物的產生相關[4]。部分數據存在少量缺失值,選擇了傳統的缺失值填補方法。

1.3 隨機森林特征重要性

目前,研究中有多項因子被證實對PM2.5有顯著影響。本文主要探討資源型城市污染物各影響因素的重要性,而隨機森林特征重要性計算方法正廣泛運用于各個領域,旨在從多個特征當中尋找到對結果或研究目標影響最大的幾個特征。隨機森林進行特征重要性評估的思想主要是通過計算每個特征在隨機森林中各組決策樹上所做的貢獻,取平均值,最后比較特征之間的貢獻大小,目前常用基尼指數或OOB 作為評價指標[5]。本文選擇基尼指數作為評價指標。

以VIM表示變量重要性評分,GI表示Gini指數,假設m 個特征X1,X2,X3,…,Xm,按式(1)計算出每個特征Xj的Gini指數評分。

式中K—K個類別;Pmk—節點m中類別k所占比例。

特征Xj在節點m的重要性,即節點m分枝前后的Gini指數變化量見式(2)。

式中GIl、GIr—分枝后兩個新節點的Gini指數。

假設特征Xj在決策樹i中出現的節點在集合m中,Xj在第i顆決策樹重要性,計算見式(3)。

假設在所建立的隨機森林中有n顆樹,計算見式(4)。

歸一化處理,計算見式(5)。

2 汾渭平原PM2.5 時空特征

2.1 時間演變

2000~2020 年汾渭平原所處的11 個地級市的PM2.5濃度年均值變化情況如圖1 所示。整體上看,各地級市變化趨勢基本一致,2000~2004年變化比較平緩,無明顯的上升下降趨勢,其中寶雞上下波動最大。2004~2008 年各區域都有比較明顯且統一的波動,前3 年呈上升趨勢,其中運城在2006 年最高達到年均PM2.5濃度約72.05μg·m-3,而汾渭平原當年區域均值約62.01μg·m-3,為2000~2015 年均濃度最高的年份。此外,自2012 年起,各城市PM2.5年均濃度值都有比較劇烈的變動,在2013 年短暫的上升后都在2014 年得到控制,有所下降,而2014~2017 年各城市都有較大的上升趨勢,其中臨汾最高上升到約81.99μg·m-3,汾渭平原全區PM2.5濃度年均上升到66.63μg·m-3左右,為近21 年最高。2017年后,該區域的污染物得到有效控制,PM2.5年均濃度均持續下降,除各年下降速率不同外,均在2020 年達到近21 年PM2.5污染物含量最低,其中下降最多的為臨汾,從2016 年的年均81.98μg·m-3下降到2020 年35.74μg·m-3。

圖1 汾渭平原時間演變

2.2 空間演變

選取汾渭平原2000~2020 年間相同間隔年份的大氣污染物PM2.5濃度進行空間演變分析,具體污染物濃度分布如圖2 所示。2000~2020 年汾渭平原各區域PM2.5濃度分布差異較大,高值區域主要集中在汾渭平原中部,低值區域主要集中在北部。整體看,全區的年均PM2.5濃度值在2000~2015 年間都有一個顯著的上升趨勢,在2015~2020 年間均有較大的下降趨勢。2000 年PM2.5濃度值高的區域主要集中在汾渭平原西部和中部地區,以咸陽、渭南和西安較為嚴重,北部地區和東部地區情況良好;2005 年污染物濃度值高的區域有所轉移,逐漸從中、西部轉移到中部及偏北地區,咸陽與運城成為污染物高值重點區域;2010 年所有區域均在2005 年的基礎上有輕微的上漲,尤其以咸陽與運城周邊的城市上漲較為明顯;2015年所有區域濃度值上漲更加明顯,濃度高值區域由局部拓展到所有區域,三門峽與洛陽所在的東南部成為濃度值最高的區域;2020年汾渭平原整體好轉,污染濃度下降至最低。

圖2 汾渭平原PM2.5 濃度分布圖

3 汾渭平原PM2.5 影響因素分析

3.1 相關性分析

特征重要性排序之前需要對各特征進行相關性分析,盡量消除兩兩變量之間的相關性,再通過隨機森林進行特征的排序及篩選。因此,先對15 個影響因素進行相關性分析,將相關性較高的變量篩選。通過相關系數,發現部分影響因子之間有著強相關的關系() 。在15 個變量中,保留了與其他因素均不相關或者弱相關的年均降水、年均氣溫、年均日照時數、全要素生產率及工業煙塵排放量5 個因素;人口密度只與其中2 個因素較相關且未達到極強相關(),因此將其全保留;考慮到區域特點,對地區生產總值、第二產業增加值、能源消耗總量、財政預算支出和科學及教育支出5 個因素進行保留。因此,總共剔除掉相關系數最高的3 個因素,保留了12 個因素。

3.2 基于隨機森林的重要性排序

特征選擇能夠有效降低數據維度,適用于高維度小樣本的數據訓練[6]。因而,將PM2.5年均濃度作為被解釋變量,以篩選過的12 個影響因素作為解釋變量,通過隨機森林構建模型,以此來探究所選的自然、社會經濟、資源、財政、科教5 個方面對大氣污染物PM2.5濃度的影響。由于2021 年、 2022 年各變量的缺失值過多,填補后效果極差,因此選取的分析時段為2000~2020 年。隨機森林模型構建中參數選擇依照平均絕對誤差最小且計算量較小的原則(選取參數為88),模型擬合優度約58.35%,詳見圖3。

圖3 重要性排序

圖3a 為PM2.5濃度值作為被解釋變量時,使用隨機森林對12個變量進行重要性排序的結果,判定排序中靠前的影響因素為PM2.5濃度值的主要影響因素。從整體來看,自然因素的4 個變量相較于其他變量總體重要性均更高,尤其是氣象因素中的年均氣溫重要性占到了第1,而歸一化植被指數、年均降水、年均日照時數分別排在第2、第4、第6,屬于重要性較強的影響因素。其他4個方面的影響因素中除人口密度和全要素生產率外,重要性都較低且差異不大。

人類社會中對自然因素所能進行的控制非常有限,且大部分自然因素也需要通過人類的社會活動來進行改善,因此在上文的基礎上將自然因素的影響因子剔除,單獨對除自然外的其他4 個方面的影響因素進行了重要性排序。依照原則與上文一致,模型擬合優度71.32%,具體排序如圖3b。在這4 個方面當中,社會經濟因素占主導地位,人口密度重要性尤為明顯,全要素生產率與工業煙塵排放量緊隨其后。但從圖3b 中可以看出,影響因子相互之間的相關性過強導致8 個影響因子被明顯劃分成5 個等級,除人口密度和科學及教育支出外,中間3 個等級的每個等級中的2 個影響因子重要性差距非常小。因此,在對主導影響因素進行選擇時,不能單純以排序為主,要盡量將重要性差距過小的影響因素再篩選。

結論

研究期內,汾渭平原PM2.5濃度變化顯著。通過分析該區域PM2.5的時空分布特征可知,2018~2020 年污染防治工作極大控制了污染物。自然影響因子整體重要性較強。在5 個大方面中,自然因素的影響因素重要性排序均靠前,但氣溫、植被覆蓋度是所選變量中最重要的,而在其他方面人口、工業、能源仍是主導影響因子,排除自然變量后,社會經濟占主導地位,但部分因素重要性差距不大,在特征選擇時還需注意。

猜你喜歡
資源型平原排序
那一片平原
江淮平原第一關——古云梯關探秘
排序不等式
平原的草
恐怖排序
資源型城市——湖南漣源市,未來可期
浪起山走
節日排序
資源型城市綠地系統規劃探討
山西資源型經濟轉型將有大動作
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合