?

基于空氣質量數據誤差及影響因素的數據處理分析探討

2020-09-30 07:15張春紅
科學咨詢 2020年41期
關鍵詞:折線圖空氣質量監測

張春紅

(湖南科技職業學院 湖南長沙 410004)

一、問題背景

為及時掌握空氣質量,我們可實時對“兩塵四氣”(PM2.5、PM10、CO、NO2、SO2、O3)濃度進行監測,對污染源采取相應措施。雖然國家監測控制站點(國控點)對“兩塵四氣”有監測數據,且較為準確,國控點布控較多。但是,由于我國地域廣闊,其覆蓋不全面,監測有限,有些地區數據發布時間滯后較長且花費較大,無法給出每個企業尤其是化工、醫藥、礦業、冶金、燃氣管道等企業和邊遠地區實時空氣質量的監測和預報。因此,我們可采用微型空氣質量檢測儀檢測數據作為監控空氣質量的另一種形式,實現相關企業的監測和邊遠地區空氣質量的檢測。微型空氣質量監測儀具有花費少、監測方便等優點,可對空氣質量進行實時網格化監控,并同時監測溫度、濕度、風速、氣壓、降水等氣象參數。由于所使用的電化學氣體傳感器在長時間使用后會產生一定的零點漂移和量程漂移,非常規氣態污染物(氣)濃度變化對傳感器存在交叉干擾,以及天氣因素對傳感器的影響,這就造成同一時間微型空氣質量檢測儀所采集的數據與真實值存在一定的差異。因此,我們需要對這些自建點數據進行誤差及影響因素的數據處理分析,才能進行下一步的差異分析和校準研究,實現既方便快捷又省時省力的精準監測、實時檢測所有地區和特殊企業的空氣質量狀況。[1]

本文數據以中國工業與應用數學學會提供的國控點和自建站數據為基礎。

二、問題分析

(一)數據的預處理以及選取

國控點數據以每小時為單位給出,而自建點的數據以時間間隔在五分鐘之內給出,數據量較為龐大,因此選取合適的時間點來進行模型的建立是本論文的基礎。一方面,通過觀察和比較分析,我們發現國控點的每日數據存在部分缺失,比如說2018年11月14日的數據就不是完整的24小時數據。這一類的數據,我們記為不完整數據,在我們取樣過程中不考慮這一類的數據。另一方面,空氣質量的評判可以看出一段時間序列,但正如我們知道,空氣質量受天氣的影響。附件所給的時間跨度半年多,因此,我們在選取數據時根據時間段選取2019年1月8日、2019年4月7日、2019年5月7日這三天的數據作為樣本進行可視化數據分析。選取這三天的原因是因為這這三天的數據完整,且處于不同的月份,涵蓋了不同季節氣溫對空氣質量的影響因素,具有較全面的典型性。我們在整篇文章里都以國建的數據視為標準數據來衡量自建數據的差異,對國建數據選取完畢之后對題目所要求的三個問題進行系統分析。

(二)數據分析

我們對自建點數據與國控點數據進行探索性數據分析。首先,我們根據前期所選取的國建三天的數據,找到相應的自建數據。自建數據所給的時間間隔為五分鐘之內,為了與國控數據的范圍統一,通過計算平均值的方法來計算出自建點每小時的值。其次,我們先通過折線圖來直觀反映選取的三天的每組數據的國控和自建的關系,如下圖。然后,根據每天的折線圖可以看出,自建監測點所測的數據在一定程度上還是可以反映出國控監測點的數據值。[2]

具體來看,1月8日PM10,PM2.5的浮動取值兩者基本一致,4月17日,PM2.5,NO2,O3,CO這些監測值的走勢基本一致,5月7日PM10,O3的監測值的走勢基本一致。這些都可以在一定程度上反映自建監測點所測數據的準確性。但根據折線圖,我們可以看到一些差異比較大的數據值,如SO2兩者的數據就差別較大。這可能跟風度、溫度、非常規氣態污染物(氣)濃度變化等其它因素有關系。[3]

根據上面的分析,我們引入空氣污染指數的計算公式來直觀地刻畫兩種模式下的空氣質量監控之間的差異。針對上面的差異,我們再用回歸模型對兩組數據的量進行回歸分析,得出了兩者之間的具體差異。

我們對導致自建點數據與國控點數據造成差異的因素進行分析,根據問題回歸分析所得出結果,仍將國控監測地的數據值作為標準,將風速、壓強、降水量、溫度、濕度等因素考慮進去。因所給的變量比較多,我們采用主成分分析法,選取影響比較大的幾個因素進行分析。

三、結論分析

(一)回歸分析

由于客觀事物內部規律的復雜性和認識程度的有限性,在遇到無法用機理分析建立數學模型時,我們通常采取搜集大量數據的辦法,基于對數據的統計分析去建立模型,其中用途最為廣泛的一類隨機模型就是統計回歸模型。[4]

回歸模型確定的變量之間是相關關系,在大量的觀察下會表現出一定的規律性,可以借助函數關系式來表達,稱為回歸函數或回歸方程。

我們先對第一問五個指標,以自建點數據“兩塵四氣”(PM2.5、PM10、CO、NO2、SO2、O3)濃度為X1、X2、X3、X4、X5,以國控點數據“兩塵四氣(PM2.5、PM10、CO、NO2、SO2、O3)濃度為Y1、Y2、Y3、Y4、Y5,探究Y關于X相對的函數關系;然后回歸分析,看看數據差異。

首先,我們使用SPSS軟件進行數據分析,給出PM10和NO2的分析樣圖,對2019年1月8日的數據進行單個量之間的相關性分析,證實自建點和國控點之間數據的相互關系。其次,我們根據折線圖來將檢測的數據值進行可視化分析,分析結果,X(i)與 Y(i)之間都有相關的性質,但是在某幾個因素中,相關度不高。最后,我們將自建點中的其他五個因素進行相關性分析,得到了如下結果。

我們通過以上分析發現:

風速與PM2.5濃度和PM10的濃度有一定關系,無風時PM2.5和PM10的濃度容易聚集,風速在一定范圍內會降低PM2.5濃度和PM10的濃度。近地面氣溫較高時,大氣對流作用加劇,可以降低PM2.5濃度和PM10的濃度;反之,大氣出現逆溫層時,PM2.5和PM10的濃度不易擴散。近地面氣溫較高時,NO2濃度容易聚集;反之,氣溫較低時NO2濃度容易擴散。近地面氣溫較高時,O3濃度容易聚集;反之,氣溫較低時,O3濃度容易擴散。降水有利于降低PM2.5濃度和PM10的濃度,利于水汽凝結,形成云霧和降水。

猜你喜歡
折線圖空氣質量監測
特色“三四五六”返貧監測幫扶做實做細
數據增加折線圖自動延長
讓折線圖顯示在一個單元格中
再多也不亂 制作按需顯示的折線圖
美化Excel折線圖表
車內空氣質量標準進展
重視車內空氣質量工作 制造更環保、更清潔、更健康的汽車
多功能空氣質量遠程檢測儀
網絡安全監測數據分析——2015年12月
網絡安全監測數據分析——2015年11月
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合