?

基于多元線性回歸方程安順市四季AQI預報模型的建立與效果評估

2022-01-25 18:10曹青吳哲紅陳貞宏徐良軍
科技風 2022年3期
關鍵詞:效果評估多元線性回歸相關性

曹青 吳哲紅 陳貞宏 徐良軍

摘?要:對安順市2015—2019年包括日平均氣溫、平均相對濕度、平均本站氣壓、日照時數等18個地面氣象觀測要素和污染累積基礎(前一日AQI值)與當日AQI作相關性分析,選用強相關因子建立四季多元線性逐步回歸模型,運用等級評分、準確率、標準化平均誤差(NME)等6種參數對4個模型預報效果進行評估。得出以下主要結論:四季AQI與氣象要素值均表現出明顯相關關系,春、夏季預報效果優于秋、冬季,四季AQI預報模型均可以滿足實際運用需求。

關鍵詞:AQI;相關性;多元線性回歸;效果評估

中圖分類號:X513?文獻標識碼:A

Abstract:Correlation analysis was conducted for 18 meteorological observation elements,including daily average temperature,average relative humidity,average atmospheric pressure,sunshine duration,and pollution accumulation basis(AQI of the previous day)and AQI of the current day in Anshun from 2015 to 2019,and a multiple linear regression model was established with strong correlation factors.Six parameters,such as grade score,accuracy and normalization mean error(NME),were used to evaluate the prediction effects of the four models.The main conclusions are as follows:AQI in four seasons shows obvious correlation with meteorological element values,the forecast effect of spring and summer is better than that of autumn and winter,and the forecast model of AQI in four seasons can meet the practical application requirements.

Keywords:AQI;correlation;multiple linear regression;effect assessment

安順市作為中國優秀旅游城市,空氣環境質量是影響旅游發展關鍵因素之一[1]。通過對空氣質量與氣象條件的關系研究,可以依據對有關氣象要素的預報在一定程度掌握空氣質量發展趨勢[2]。

國內外學者開展了許多相關研究,對各類模型進行對比分析,葉斯琪等[3]闡述了統計模型在城市空氣質量預報中的應用優勢,結果表明:多元回歸模型平均準確率在4種模型中最高;宋丹等[4]運用多元線性逐步回歸和BP神經網絡方法,對貴陽市2015—2016年AQI建立模型,結果表明回歸模型優于BP神經網絡與CUACE模式;Shams等[5]使用2015年每日空氣污染指數和氣象要素建立空氣污染指數多元回歸預測模型,顯示與非線性模型相比,多元逐步回歸模型預測AQI的效果較好;Gogikar[6]對在印度阿格拉地區2011—2015年建立的PM2.5預報模型,得出多元線性回歸優于其他兩種模型的結論。

本文對安順市2015—2019年每日地面氣象要素與當日空氣質量指數(AQI)作相關性分析,建立多元線性逐步回歸模型,并檢驗模型預報準確率,對模型預報效果進行評估。

1 數據來源與分析

1.1 數據采集

日氣象觀測數據來自安順國家基本氣象觀測站,該站為集成式新型自動氣象站,在每日氣象觀測要素值中選出連續性較好且對氣象條件具有代表性的因子共18個,分為8類,其中平均氣溫、日最高氣溫、日最低氣溫作為氣溫類代表因子,平均濕球溫度、平均相對濕度、平均露點溫度、平均水汽壓作為濕度類代表因子,平均風速、最大風速、最大風速的風向(正北向記為1,順時針每30°記為1個整數,以最接近方向記為整數1到12)表征風要素,平均本站氣壓、日最高本站氣壓、日最低本站氣壓、平均海平面氣壓表征氣壓要素,降水量、平均總云量、最小能見度、日照時數則各自表征降水情況、云量、能見度和日照輻射情況。

每日AQI值由安順市4個國控空氣監測站點6種大氣污染物(SO2、NO2、O3、CO、PM2.5、PM10)每日24小時濃度均值計算得出。

1.2 數據分析方法

1.2.1 相關性分析

相關分析主要是研究兩個變量間線性相關程度的強弱,即密切程度。本文主要使用了Pearson與Spearman系數,Pearson系數主要用于定距變量(間隔變量)間相關分析,計算公式(1)如下:

Spearman系數主要用于定序變量間相關分析,計算公式如下:

1.2.2 多元線性回歸方程

在線性回歸中,如果有多個自變量與因變量呈線性關系,則稱為多元線性回歸分析,多元線性回歸的數學模型為:

其中ε表示由于隨機誤差或其他因素的變化引起的y的線性變化部分,其余部分表示由于x的變化引起的y的變化部分。根據相關數據求得線性方程后,再對方程進行F、t檢驗。

1.2.3 模型效果評估

等級評分用于衡量對空氣質量等級預報準確率:

等級評分=RARA+RB+RC+RD+RE+RF×100%(4)

其中RA表示預報等級正確的天數,RB、RC、RD、RE、RF分別表示預報等級絕對誤差為1~5級的天數[4]。

準確率用于評價預報值與實測值之間量化差異[7]:

準確率=1-預測值-實測值實測值×100%(5)

標準化平均偏差(NMB)反映的是模型預報值與實測值的平均偏離程度:

其中cf表示模型預報值,c0表示實測值。

標準化平均誤差(NME)表示兩者之間平均絕對誤差:

均方根誤差(RMSE)表示模型預報值與實測值偏離程度,越接近0,表示預測效果越好[8]:

Pearson相關系數(R)來評價模型預報值與實測值變化趨勢的相關程度與擬合效果,越接近1,擬合效果越好,R的計算見公式(1)。

2 結果與討論

2.1 四季AQI相關性分析

除選用18個日氣象觀測要素值外,將前一日AQI值作為濃度基礎的代表自變量。作相關性分析,結果如表1,其中“**”表示雙側檢驗的顯著性結果Sig值小于0.01,兩者呈強相關關系,“*”表示雙側檢驗的顯著性結果Sig值大于0.01小于0.05,兩者呈較強相關關系,其余表示兩者相關性較弱。

四季AQI與氣象要素值均表現出明顯相關關系:春季隨著氣溫類別因子、日照時數和前一日AQI值的升高,空氣質量越差;AQI隨著氣壓類別因子、濕度、降水量、云量的增大而減小,空氣質量變好;偏東方向的最大風速風向能使春季空氣質量得到改善。夏季隨著日最低氣溫、濕度類別因子、風速、降雨量、云量的增大而減小,空氣質量得到改善,且偏西方向最大風速風向有利于大氣污染的擴散。秋季AQI隨著日最高氣溫、氣壓類別因子、日照、前一日AQI增大,空氣質量呈下降趨勢;隨著濕度類別因子、風速、降水量和云量的增大,空氣質量好轉。與冬季AQI隨濕度、平均水汽壓、風速、降水量、云量的增大而降低,隨著氣溫類別因子、氣壓類別因子、最小能見度、日照、前日AQI的增大而增大。

2.2 四季AQI預報模型的建立

選定18個因子與前一日AQI值作為自變量,當日AQI值為因變量開展分析。除去個別含缺測數據的天數,春季共有460組數據,運用SPSS軟件,選取400組數據作相關性分析并建模,60組數據對模型預報效果進行評估;夏季共460組數據,其中400組建模,60組檢驗;秋季455組數據,400組建模,55組檢驗評估;冬季450組數據,400組做分析、建模,50組對模型進行檢驗。運用Excel中RAND函數對數據打亂,隨機選取各季分別用于建模與檢驗的數據。

運用SPSS軟件建立四季AQI預報模型分別為:

Y(春)=90.312-0.690E+0.370S+0.945R-0.001Q

Y(夏)=128.141+0.389S-0.708E-3.992C+1.710B-0.618J-2.640H

Y(秋)=94.185+0.506S-0.644E-7.491H-0.258O

Y(冬)=122.444+0.456S-0.833E-7.248H-0.001Q-1.103O

對四季模型進行F、t檢驗,F顯著性檢驗值均小于0.05,可知模型回歸效果高度顯著,對各回歸系數t檢驗顯著性高,表明各因子回歸系數可用,綜上,模型顯著性高,可作為預報方程。

2.3 模型預報效果評估

從模型評估結果(表2)來看,春季等級評分稍低,未達70%,其余季節均在70分以上,主要原因是春季AQI在臨界值50左右的天數較多,預測值凡超過50則被記入等級預報有偏差的天數,造成等級評分較低;NMB除秋季外均體現出預測值偏高于觀測值,但總體偏差低于10%;NME在15%左右,NME與RMSE秋、冬季均高于春、夏季,但RMSE均小于20mg·m-3;四季模型預測值與實測值相關系數高于0.7,在置信度為0.01時顯著相關。從評估結果來看,四季模型均可以滿足實際預報需求。

3 結論

(1)四季均與AQI呈強相關關系的有5個因子:日最高氣溫、平均相對濕度、降水量、日照時數和前一日AQI值。四季隨著日最高氣溫、日照時數、前一日AQI值的升高,大氣污染物之間進一步反應,空氣質量呈下降趨勢;而降水量、平均相對濕度、云量的增大,對大氣污染物起到濕沉降作用,同時抑制了光化學反應,空氣質量趨于好轉。

(2)對建立的四季模型預報效果進行評估,等級評分在68%~85%,準確率在70%~85%,NMB在-0.5%~7%,NME在15%~32%,RMSE在8.5%~17%,R在0.708~0.925,春、夏季預報效果優于秋、冬季,四季AQI預報模型均可以滿足實際運用需求。

參考文獻:

[1]伍小飛.安順城市旅游發展潛力評價[J].合作經濟與科技,2017,32(06):42-43.

[2]張岳軍,張懷德,朱凌云,何俊琦,韓照宇,馮坤.太原市PM2.5預報統計修正模型及其應用檢驗[J].環境科學研究,2018,31(07):1207-1213.

[3]葉斯琪,黃思遠,陳多宏,李紅霞,徐偉嘉,謝敏,沈勁,汪宇,潘月云,嵇萍.統計模型在城市空氣質量預報中的應用[J].環境工程,2018,36(S):309-314.

[4]宋丹,夏曉玲,何玉龍,張蕾,杜正靜.貴陽市空氣質量預報方法與效果檢驗[J].氣象與環境科學,2019,42(01):95-102.

[5]Shams R,Jahani A.Evaluation of the validity of multiple regression models in forecasting the air quality index(AQI)of Tehran[C].2018.

[6]Gogikar P,Tripathy M R,Rajagopal M,Paul K K,Tyagi B.PM2.5 estimation using multiple linear regression approach over industrial and non-industrial stations of India[J].Journal of Ambient Intelligence and Humanized Computing,2020,12(3):2975-2991.

[7]張婷.秦皇島市空氣質量預報方法研究[D].沈陽:東北大學資源與土木工程學院,2014.

[8]沈勁,鐘流舉,何芳芳,陳多宏.基于聚類與多元回歸的空氣質量預報模型開發[J].環境科學與技術,2015,38(02):63-66.

作者簡介:曹青(1989—?),女,漢族,貴州貴陽人,碩士,助理工程師,研究方向:大氣環境。

猜你喜歡
效果評估多元線性回歸相關性
基于組合模型的卷煙市場需求預測研究
基于多元線性回歸分析的冬季鳥類生境選擇研究
短期海外游學項目實施效果調查和建議
企業培訓效果評估策略探討
我國上市商業銀行信貸資產證券化效應實證研究
云學習平臺大學生學業成績預測與干預研究
基于Kronecker信道的MIMO系統通信性能分析
小兒支氣管哮喘與小兒肺炎支原體感染相關性分析
腦梗死與高同型半胱氨酸的相關性研究(2)
腦梗死與高同型半胱氨酸的相關性研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合