?

“兩塵四氣”空氣污染數據的校準模型

2024-03-26 04:57朱瑩姜道旭盛俊李建龍
環境科學導刊 2024年1期
關鍵詞:多元線性回歸

朱瑩 姜道旭 盛俊 李建龍

摘 要:通過Excel軟件對監測點收集的空氣質量數據進行拆分及構造函數的方法,擬合了“兩塵四氣”的六個方程,這些方程可用于對自建點數據進行校準。在對所收集的數據標準化后,利用SPSS軟件對“兩塵四氣”數據誤差產生的原因進行回歸分析,建立了多元線性回歸方程。方程顯示:壓強、溫度和風速更容易導致自建點數據誤差,可使用對上述三種因素不敏感的材質制造檢測儀的傳感器。以上使用Excel和SPSS軟件對大數據進行比對處理及建模的方法可用于環境監測、農業生產等領域促進高質量生態文明建設。

關鍵詞:“兩塵四氣”;Excel和SPSS;曲線擬合;多元線性回歸

中圖分類號:X51文獻標志碼:A文章編號:1673-9655(2024)01-00-06

0 引言

隨著國家對生態文明建設的大力推進,對以PM2.5、PM10、CO、NO2、SO2、O3為代表的“兩塵四氣”等空氣污染進行實時監測,可以幫助管理部門對不同的污染源采取相應改善措施。對空氣質量的監測分為國家監測控制站點(國控點)與民間自建監測點(自建點)。前者的優點是數據準確,缺點是布控點少,時間間隔大并滯后,監測儀價格昂貴;后者可對某一地區空氣質量進行實時網格化監控,并能同時監測溫度、濕度、風速、氣壓、降水等氣象參數。國外已有一些學者分別關注于空氣質量[1-4]、PM2.5、PM10[5-7] 、廢氣[8-9],

國內也有學者的研究涉及了空氣質量和數據監測,方法包括模糊-灰色聚類、分形模型等 [10-14];另有一些學者關注了空氣質量校準和優化[15-16],

研究雖有新意但并不太全面。本研究以2019年全國大學生數學建模競賽D題[17]為例,利用常規軟件Excel和SPSS[18-19],研究方法實現了用精確的國控點整點數據對近鄰自建點數據的比對校準,對導致自建點與國控點監測數據差異的因素進行了分析。因有些氣態污染物及天氣會對自建點檢測儀的傳感器產生干擾,影響數據的質量,所以在同一時間自建點數據會與相應國控點的數據存在差異,本研究既可提高自建點空氣質量檢測儀的傳感器精準度,又可以利用國控點數據對鄰近自建點數據進行校準。

1 材料與方法

1.1 國控點數據對其近鄰自建點數據校準建模

民間自主研發用于監測“兩塵四氣”數據的微型空氣質量檢測儀,其優點是監測實時且成本低,但核心部件電化學氣體傳感器長時間使用后會產生誤差,且天氣因素對傳感器也存在影響。在國控點附近自建點的微型檢測儀同一時間所采集的數據,與國控點的數據會存在一定的差異,因此將自建點數據通過適當數學模型進行轉化與校準。本研究實現了對二十多萬條的自建點大數據進行時間拆分和篩選,并根據賽題具體要求,構造了相關函數抓取整點前后5 min內所有數據,并取其均值。然后將處理所得數據與賽題所提供的國控點整點數據一一對應,分別對PM2.5、PM10、CO、NO2、SO2、O3用Excel建立數學模型的方法對自建點數據校準,并分別給出了擬合度R2。

圖1~圖6分別是PM2.5、PM10、CO、NO2、SO2、O3 自建點和對應國控點數據散點圖與擬合曲線,表1列出了上述6種物質自建點濃度(解釋變量x)與對應國控點數據(被解釋變量y)擬合的方程,以及每個方程的擬合度R2。其中PM2.5、PM10和O3的擬合度較高,這三種物質自建點的濃度可以通過擬合曲線的方程進行轉化;NO2、CO、SO2的擬合度較低,尤其是SO2濃度數據誤差很大;因為SO2會溶于水中,形成亞硫酸;若加上PM2.5作用,便會迅速生成硫酸(這也是酸雨的主要成分)[20],使得自建點傳感器受到強污染導致數據失真有關。

國控點附近自建點的微型檢測儀同一時間所采集的數據,與國控點的數據會存在一些差異,這些自控點數據可以通過上述表1模型進行轉化與校準,進而轉化為與國控點數據誤差更小的數據,以彌補國控點的布控不足,以上擬合度較高的是PM2.5和 PM10。

1.2 自建點數據與國控點數據差異成因分析

自建點使用的微型空氣質量檢測儀的傳感器是電化學氣體傳感器,溫度、濕度、風速、氣壓、降水等天氣因素對傳感器會帶來一定的影響。這些因素對傳感器讀取空氣中的“兩塵四氣”數據的真實影響有多大,可運用多元線性回歸方程模型,對自建點和國控點數據誤差進行探究性分析?!皟蓧m四氣”里PM2.5、PM10、NO2、SO2、O3濃度單位是μg/m3,CO濃度單位是mg/m3、

溫度單位℃、濕度單位rh%、風速單位m/s、氣壓單位Pa、降水量單位mm/m2,這些數據單位各不相同,因此先用公式Xi=(Xi-Xmin)/(Xmax-Xmin)對這些數據進行無量綱標準化處理,再用SPSS軟件進行多元線性回歸分析。

1.2.1 六種污染物誤差多元回歸模型的標準化殘差直方圖和P-P圖

圖7、圖9、圖11、圖13、圖15、圖17分別是PM2.5、PM10、CO、NO2、SO2、O3數據誤差的標準化殘差正態曲線直方圖。圖8、圖10、圖12、圖14、圖16、圖18分別是PM2.5、PM10、CO、NO2、SO2、O3標準化殘差的正態P-P圖,圖中點基本在直線附近或在直線上,說明變量之間呈現線性分布。

1.2.2 “兩塵四氣”數據誤差的多元回歸模型與分析

為簡化方程,誤差值、溫度、濕度、風速、氣壓、降水量分別用E、T、H、W、Pa和P表示。由多元回歸方程可知,濕度、壓強對PM2.5數據的誤差產生較大影響;濕度、壓強、溫度和風速對PM10數據的誤差影響較大;CO數據的誤差大多由溫度、壓強和風速產生;溫度、壓強、濕度、風速和降水量都對NO2數據產生影響;SO2由于數據失真,所以擬合度不高,壓強、溫度對數據有一些影響;溫度、壓強和風速對O3數據影響較大。綜合來看壓強、溫度和風速對數據讀取產生的誤差影響較大,空氣質量檢測儀的傳感器可以考慮選用對壓強、溫度和風速變化不敏感的材質來制造,或經常更換新傳感器以減少數據誤差。

2 結論

本研究契合美麗中國對生態的要求,環境美、生態優的高質量生態文明建設是全體國人的追求。本研究使用了常規軟件Excel和SPSS,數據拆分、構造函數、篩選、分類匯總、數據的標準化、公式等主要用于數據處理和曲線擬合;SPSS主要用于多元線性回歸,并根據所得回歸方程找出產生誤差的原因,以便將來使用抗干擾能力更強的傳感器獲取數據。針對國控點數據的缺失,為了減少其對建立數學模型的不利影響,可以使用缺失數據臨近時間的均值替代,或將自建點里面相關的數據剔除,這樣可以保證自建點和國控點數據的一一匹配。

3 展望

徹底消除“兩塵四氣”對環境的污染目前還很難實現,但人們依然可以有所作為。比如:為了降低PM2.5,可以減少使用化石燃料并禁止燃燒垃圾;多澆水可以控制揚塵并降低PM10顆粒;不使用煤爐,少用燃油車可以降低CO濃度;城市集中供熱可以減少鍋爐使用降低NO2;使用優質煤可以減少SO2污染;無紙化辦公可以減少復印機的使用,控制O3的污染等。

參考文獻:

[1] L.V.Klochkova,Yu.A.Poveshchenko,V.F.Tishkin.Mathematical modeling of air quality on the prolonged period of time[J].ZhurnalSrednevolzhskogoMatematicheskogoObshchestva,2012(14):2,67-73.

[2] Shakoor A,Chen X,Farooq T H,et al.Fluctuations in environmental pollutants and air quality during the lockdown in the USA and China:two sides of COVID-19 pandemic[J].Air Quality Atmosphere & Health,2020(13):1335-1342.

[3] Zou Z,Zhao J,Zhang C,et al.Effects of cleaner ship fuels on air quality and implications for future policy:A case study of Chongming Ecological Island in China[J].Journal of Cleaner Production,2020(267):122088.

[4] Sheng G,Dai J,Pan H.Influence of Air Quality on Pro-environmental Behavior of Chinese Residents:From the Perspective of Spatial Distance[J].Frontiers in Psychology,2020(11):566046.

[5] Li Xiao long,Fang Zongyi.Comparison between Two Dust Weather Process EffectingBeijing in 2006 [J].Climate and Environmental Studies,2007,12(3):320-328.

[6] Girolamo P D.Assessment of the potential role of PM2.5/PM10particles in intensifying the pandemic spread of SARS-CoV-2/COVID-19 in Northern Italy[J].Bulletin of Atmospheric Science and Technology,2020(1):515–550.

[7] Hatta M,Han H.Predicting indoor PM2.5/PM10 concentrations using simplified neural network models[J].Journal of Mechanical Science and Technology,2021,35(7):3249-3257.

[8] Liu X,Liu J,Chen J,et al.Study on treatment of printing and dyeing waste gas in the atmosphere with Ce-Mn/GF catalyst[J].Arabian Journal of Geosciences,2021,14(8):1-6.

[9] Koci K,Reli M,TroppovaI,et al.Degradation of Styrene from Waste Gas Stream by Advanced Oxidation Processes[J].Clean, 2019,47(8):1900126.1-1900126.9.

[10] 徐琴,王赪,汪宵,等.由光化學反應和排放清單判斷城市PM2.5首要污染源的方法[J].揚州大學學報(自然科學報),2018,21(1):68-72.

[11] 丁卉,劉永紅,曹生現.基于模糊-灰色聚類方法的城市空氣質量評價研究[J].環境科學與技術,2013(S2):374-379.

[12] 陳輝,厲青,楊一鵬.基于分形模型的城市空氣質量評價方法研究[J].中國環境科學,2012(5):954-960.

[13] 徐戈,李宜威.空氣質量對公眾感知風險與應對意愿的影響研究[J].系統工程理論與實踐,2020,40(1):93-102 .

[14] 汪發元,鄭軍,汪宗順.城市化水平、工業化水平對空氣質量的影響分析—基于湖北省16 城市2005—2017年數據的時空模型[J].長江流域資源與環境,2019,28(6):1411-1421.

[15] 雷耀建,王汝涼.最小二乘法在空氣質量數據優化中的應用[J].南寧師范大學學報(自然科學版),2020,27(1):51-56.

[16] 紀張偉.空氣質量數據的校準研究[J].太原師范學院學報(自然科學版),2020,19(3):44-48.

[17] 2019年高教社杯全國大學生數學建模競賽賽題[EB/ON].(2019-09-12)[2020-01-08].http://www.mcm.edu.cn/html_cn/node/b0ae8510b9ec0cc0deb2266d2de19ecb.html. 2019 Higher Education Association Cup National College Students Mathematical Contest in Modeling[EB/ON].(2019-09-12)[2020-01-08].

[18] EXCEL在基層統計工作中的應用[M].北京:中國統計出版社,2013:88-98.

[19] SPSS 21統計分析與應用從入門到精通[M].北京:清華大學出版社,2015:163-176.

[20] 韓軍彩,陳靜,王曉敏等.基于微波輻射計資料的石家莊市一次重污染成因分析[C]//北京:中國氣象學會年會,2016:1-10.

Calibration Model of Air Pollution Data "Two Dusts and Four Gases"

ZHU Ying, JIANG Dao-xu, SHENG Jun, LI Jian-long

(Yangzhou Polytechnic College, Yangzhou Jiangsu 225009, China)

Abstract: In this paper, by using Excel software to split and construct air quality data,six equations of "two dust and four gas" were fitted to calibrate the data of self-built points. After data standardization, multiple regression of SPSS software was used to conduct regression analysis on the causes of data errors of "two dusts and four gas", and a multiple linear regression equation was established. The equation showed that the pressure,temperature and wind speed have great influence on the error, and the sensor can be made with materials insensitive to the above three factors. The above data processing and modeling methods using Excel and SPSS software can be used in fields such as atmospheric environmental protection and agricultural production to promote high-quality ecological progress.

Key words: "two dusts and four gas"; Excel and SPSS; curve fitting; multiple linear regression

收稿日期:2022-10-31

基金項目:江蘇省種植養殖業安全環境技術及裝備工程研究中心開放課題(JSZY-2022-07);揚州市職業大學2020年校級教改課題“以問題解決為導向的數學微課資源研發與應用”(2020JG33)。

作者簡介:朱瑩(1973-),男,在讀博士生,副教授,江蘇揚州人,主要從事數學建模等方面研究。

猜你喜歡
多元線性回歸
我國銀行業股票收益影響因素實證研究
國內旅游收入主要影響因素的實證分析
基于灰色關聯和線性規劃的糧食種植面積影響因素分析
基于組合模型的卷煙市場需求預測研究
基于多元線性回歸分析的冬季鳥類生境選擇研究
我國上市商業銀行信貸資產證券化效應實證研究
云學習平臺大學生學業成績預測與干預研究
全國主要市轄區的房價收入比影響因素研究
宏觀經濟變量對上證指數影響的實證研究
利用計量工具比較東西部的經濟狀況
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合