?

基于觀測與視頻數據的機場能見度預測研究

2024-01-13 08:36王新龍梁艷玲劉雪宇
長治學院學報 2023年5期
關鍵詞:能見度協方差殘差

王新龍,梁艷玲,劉雪宇

(1.長治學院 計算機系,山西 長治 046011;2.山西旅游職業學院 計算機科學系,山西 太原 030031;3.太原理工大學 計算機科學與技術學院(大數據學院),山西 太原 030024)

1 引言

在實踐中,我們通常以能見度作為在氣象、公路行車、飛機飛行中等領域中衡量大氣透明程度和空氣質量好壞的一個重要指標。在航空領域,習慣用跑道能見度反映機場附近霧和霾的大小,它被定義為從跑道的一端到目標物體的最大距離。一般情況下,當機場能見度只有400 m 左右時,會禁止航班起降。當機場能見度只有600-800 m 左右時,航班雖然可以正常起降,但出于安全考慮,機場會采取臨時控制航班流量的措施,拉大航班起飛間隔,但容易造成航班延誤。因此,能見度預測將直接影響交通運輸的安全和效率,成為交通管理部門和航空公司十分關注的問題[1,2]。

目前,已經有學者基于AMOS(Aerodome Meteorological Observation System)觀測數據對能見度進行預測,例如,李俊敏等[3]利用BP 神經網絡,通過選取氣壓、風速等特征對能見度進行預測;王雅雪等[4]利用主成分分析、多分類多元回歸模型等方法對能見度進行預測。然而,目前基于AMOS 觀測數據對能見度進行預測僅僅考慮了特征變量對能見度的影響,并無考慮特征之間的相關性并融合相關特征,因此準確率較低,難以滿足實際需求。

另一方面,測量能見度需要大量設備儀器進行測算,例如激光能見度儀等,若使用儀器測算對機場進行全覆蓋將耗資巨大,同時儀器還存在對團霧檢測精度不高、探測的范圍很小以及維護成本高等問題,從而在無設備區域易出現安全隱患,可能導致嚴重后果。近年來,基于視頻進行能見度的測量引起廣泛研究,宋梓庚等[5]提出了利用VGG 深度學習模型對能見度進行預測,RMSE 達到了14.5 km;千月欣等人[6]利用Squeezeenet 遷移學習模型對能見度進行預測,RMSE 達到85.012 m。然而,目前基于深度學習的視頻能見度預測方法中,盡管可以對視頻中每秒的能見度進行預測,但是由于這些方法大多數只選取少量數據中某些固有的特征,沒有很好地利用無監督的數據,估計精度不高,難以實際使用。

基于上述問題,文章通過機場觀測、機場監控視頻兩類數據,利用數據分析方法、深度學習算法和機器學習算法等技術構建模型,對機場的可見度進行預測。具體分為兩部分:(1)地面的氣象因素往往能反映出霧的大小,根據AMOS 機場觀測數據,選取合適的特征建立能見度與地面氣象觀測(溫度、濕度和風速等)之間的關系并導出關系式。(2)大部分現實場景中,地面的氣象因素信息往往很難獲得,通過機場監控視頻數據和能見度數據,構建基于視頻數據的能見度估計深度學習模型,并對估計的能見度進行精度評估。

2 基于AMOS 觀測數據的能見度預測模型

AMOS 觀測數據涵蓋氣壓、燈光、溫度和濕度等特征以及相應的能見度信息,通過該數據類型建立預測模型來描述能見度與地面氣象觀測之間的關系,并導出具體的關系式。由于篩選與問題目標具有強相關的輸入變量對于建立模型和解決實際問題非常重要,且原始的機場AMOS 觀測數據(HIS 格式)包含很多特征,所以需要對特征進行篩選。文章首先將數據進行標準化,隨后通過分析各變量之間的相關性,篩選出與能見度相關的特征,同時利用因子分析使得各特征之間的相關性變低。最后利用回歸分析方法,探尋能見度與地面氣象之間的關系。

2.1 數據預處理

數據標準化(歸一化)處理是數據挖掘的一項基礎工作。不同評價指標往往具有不同的量綱,數值間的差別可能很大,不進行預處理可能會影響數據分析的結果。為了消除指標之間量綱和取值范圍差異的影響,需要進行標準化處理,將數據按照比例進行縮放,使之落入一個特定的區域,便于進行綜合分析。文章采用了Z-score 標準化方式對數據進行了處理。Z-score 是對某一原始數據進行轉換,成為一個標準數據,該標準處理的數據均值為0,標準差為1。Z-score 標準化的計算公式如下:

2.2 特征篩選

在機場能見度預測的研究中,有多個環境因素可能影響機場的能見度?;跉庀髮W知識,文章選取了2019 年12 月16 日以及2020 年3 月13日兩天的數據作為實驗對象,初步篩選出與能見度相關的10 個特征,包括本站氣壓、飛機著陸地區最高點氣壓、修正海平面氣壓、溫度、相對濕度、露點溫度、燈光數據、2 分鐘平均風速、2 分鐘平均風向、2 分鐘平均垂直風速。表1 給出了10 個屬性及其對應的英文縮寫。

表1 初步篩選后與能見度相關數據屬性及其對應的英文縮寫

基于協方差矩陣的特征進行篩選。在統計學中,方差是用來度量單個隨機變量的離散程度,而協方差則一般用來刻畫兩個隨機變量的相似程度。通常,方差的計算公式為:

協方差的計算公式為:

根據方差的定義,給定多個隨機變量,計算隨機變量的方差和兩兩之間的協方差。利用以上方法,文章首先構建上述10 個特征變量。由式(3)和(4)可得,各變量之間的協方差矩陣為:

通過協方差矩陣可分析各變量與能見度之間的相關性,進而得到如下結論。

PAINS(本站氣壓)、QFE(飛機著陸地區最高點氣壓)和QNH(修正海平面氣壓)之間的協方差均為1,故根據實際意義可僅保留QNH(修正海平面氣壓)。露點溫度與MOR 協方差小于0.1,即露點溫度與能見度之間的相關性較弱,故不做考慮。

因此,通過協方差矩陣的分析可得,與能見度相關性較強的有7 個變量,包括修正海平面氣壓、溫度、相對濕度、燈光數據、2 分鐘平均風速、2 分鐘平均風向和2 分鐘平均垂直風速。表2 展示了氣象光學視程(MOR)、跑道視程(RVR)和篩選后的7 個變量的部分數據。

表2 氣象光學視程(MOR)、跑道視程(RVR)和篩選后的的7 個變量的部分數據

2.3 因子分析

本小節主要考慮各變量之間的相關性。由圖1 中的協方差矩陣可得,WS2A(2 分鐘平均風速)、WD2A(2 分鐘平均風向)和CW2A(2分鐘平均垂直風速)的相關性較高,通過降維的方法進一步減少變量。本小節采用因子分析方法[7]對三個變量進行降維,得到了兩個相對獨立的變量。

圖1 協方差矩陣圖

因子分析的思想是通過變量的相關系數矩陣,獲得能控制所有變量的少數幾個隨機變量,并能用其描述多個變量間的相關關系。該方法要求原有變量之間要具有比較強的相關性。由于WS2A、WD2A、CW2A 三個變量之間的相關性很高,可以采用該方法進行降維。文章采用R 型因子分析進行分析,該因子模型為:

其中F1,F2,…,Fm為公共因子,ε 為Xi的特殊因子。其矩陣形式可表示為:

下面對WS2A、WD2A、CW2A 三個變量進行因子分析。假設其公因子為風速和風向,然后對三個變量進行Z-score 標準化處理,最后利用因子分析模型可得兩個公因子與三個變量之間的關系。根據因子分析,兩個公因子可表示為標準化后變量的線性組合:

2.4 回歸分析

利用上述篩選好的特征變量,構建最終針對能見度的預測模型?;貧w分析可以對各變量進行擬合,主要用于預測輸入變量(自變量)和輸出變量(因變量)之間的關系[8]?;貧w模型表示從輸入變量到輸出變量之間映射的函數[9]。因此,回歸問題的學習等價于函數擬合,是監督學習的一個重要問題?;貧w問題可以分為學習和預測兩個過程(如圖2 所示)。首先給定一個訓練數據集:

圖2 回歸問題示意圖

Xi∈Rn,i=1,2,…,N是輸入,yi∈R是對應的輸出。學習系統基于訓練數據構建一個模型,即函數Yi=F(Xi)。根據新的輸入XN+1,預測系統所依據的學習模型Yi=F(Xi)。

依據上述模型可確定相應的預測值yN+1。文章采用線性回歸的方法對數據進行擬合,其線性回歸模型定義為:

其中W 是所要求的參數,X 是輸入的數據矩陣,Y 為數據集標簽,具體公式為:

這里Xi(j)表示數據集第i個樣本的第j個屬性值,數據集一共有N個數據,n個屬性。因為考慮常數項,所以在數據矩陣X的第一列全為1。線性回歸模型的目標是尋找一組參數W,使得Y=XW盡可能地逼近真實值。

下面對能見度進行回歸分析,構建能見度與各特征變量之間的關系。首先對6 個自變量和一個因變量組成的數據集進行Z-score 標準化處理;然后采用均方誤差作為損失函數進行線性回歸。根據實驗可得,各變量的回歸系數分別為-0.164,0.569,0.609,0.031,-0.838 和0.796,且 常 數 項為-0.001。因此能見度與各地面氣象觀測之間的關系可表示:

由表3 可得,該回歸模型預測能力良好,均方誤差(MSE)、均方根誤差(RMSE)、平均絕對誤差(MAE)分別達到了0.0685、0.2617、0.2172。三種反應預測值誤差實際情況的指標均證明了該回歸模型具有良好的預測能力。另外擬合優度R2為0.934。擬合優度是指回歸直線對觀測值的擬合程度。R2最大值為1,R2的值越接近1,說明回歸模型對觀測值的擬合程度越好,反之,R2的值越小,說明回歸模型對觀測值的擬合程度越差。因此,實驗結果表明回歸模型(12)的預測與擬合程度良好。

表3 線性回歸模型性能

雖然擬合優度R2度量了回歸模型與樣本觀察值之間擬合程度,但是R2本身卻不能反映回歸系數是否在統計上是顯著的。因此,需要對該模型回歸系數的顯著性進行檢驗。文章采用了驗證模型顯著性的F檢驗。假設模型為:

原假設和備擇假設分別為:

這里ESS、RSS 分別為回歸平方和、殘差平方和。自由度為k,n-k-1,其中為自變量個數,為樣本數。Yi,表Y^i示,Y第 個因變量表示i=1,2,…,n回歸模型對應的預測值,Y所有因變量的平均值。給定顯著性水平α=0.01,n=5755,k=6,將相關數值對應臨界值表可以得到臨界值Fα(k,n-k-1)=2.805。

由計算得知F統計量為20.739,F>Fα(k,n-k-1),拒絕原假設,因此原方程總體上的線性關系顯著成立。

3 基于視頻數據的能見度預測模型

3.1 視頻數據預處理

為了采用深度學習模型對視頻數據進行分析,需要進行如下的數據預處理:(1)缺失值、異常值等處理;(2)將視頻數據轉化為圖片數據;(3)給圖片數據賦予相應的能見度MOR 值,將其作為標簽。具體步驟如下。

文章選取2020 年3 月13 日從00:00 到11:48時間段的兩個場景的視頻數據。圖3(a)是場景一的截取圖片,圖3(b)是場景二的截取圖片,其中00:00 到08:00 時段具有能見度標簽。將此部分作為強監督數據集,其他部分作為無監督數據集。通過Python 將視頻數據轉換為圖片數據。對視頻進行分幀,按照每秒一張截取圖片,將圖片保存備用。

圖3 不同場景下的視頻圖片

給定圖片對應的能見度值。機場AMOS 觀測數據中每隔15 秒記錄一個能見度MOR 值,但是圖片按照每秒進行截取,因此將強監督數據集中每15 張圖賦予一個MOR 值作為15 張圖片的能見度值,如30-44 秒間的15 張圖片的MOR 值均為3000(30 秒時的MOR 觀測數據)。這種方法不僅利用了大量無標簽數據,同時考慮了時間關系,便于網絡收斂與提高精度。

考慮到能見度MOR 的增量以最少50 為量級,為方便計算將MOR 值都除以50,并將其作為標簽。同時,在預測時得到的值也需乘以50 作為最終的預測值。在增快了網絡收斂速度的同時增加了回歸的精度。

確定標簽后,將數據集以一定比例分為訓練集、驗證集和測試集。

3.2 深度殘差回歸網絡架構設計

在深度學習中,一般神經網絡的每一層都用來提取特征,深度越深,在不同層次上提取的信息就越多。但網絡的深化通常會出現梯度消失和梯度爆炸,使得深化網絡性能會變得更差。殘差網絡(Resnet)是何凱明在2015 年提出的一種網絡結構,它由多個殘差塊組成,且殘差塊使用跳躍連接。殘差網絡通過殘差設計解決了網絡深化帶來的性能下降和梯度問題[10]。圖4 展示了一個殘差塊結構,其中x表示輸入,F(x)表示殘差塊在第二層激活函數之前的輸出,即F(x)=W2σ(W1x),其中W1和W2表示卷積層1和卷積層2 的權重,σ表示 ReLU 激活函數。最后殘差塊的輸出是σ(F(x)+x)。

圖4 殘差塊

文章的深度學習模型主干選擇Resnet50。該網絡包括 50 個卷積層,每一個卷積層后接一個ReLU 和 池化層。每三個卷積層之間接一個跳躍連接。Resnet50 經過了4 個殘差塊,每一個殘差塊中分別有3、4、6、3 個Bottleneck。

在該深度學習模型中,采用隨機梯度下降法(SGD)進行更新。SGD 算法是從樣本中隨機抽取一組數據,訓練后按梯度更新一次權重,然后再抽取一組數據,再更新一次權重。假設模型函數與目標函數分別為:

令一個樣本的目標函數為:

則目標函數的偏導為:

參數更新為:

其中x(i)表示第i個樣本,y(i)為x(i)對應的函數值,i=1,2,…,m,θj為參數,xj是樣本的第j個分量,j=0,1,…,n,α為學習率。

由于Resnet50 最后一層Softmax 用來做分類,利用Softmax 層之前的框架來提取圖像特征,把提取到的特征值作為輸入向量,能見度作為輸出。對特征值進行線性回歸,得到能見度MOR 的預測結果。應用此手段,深度殘差回歸網絡利用Resnet50 網絡架構提取圖像特征,利用回歸作為預測輸出,將單一的分類結果替換為線性預測值,達到能見度預測的目的。

3.3 基于視頻數據能見度預測的實驗及結果

在訓練模型方面,為了驗證標簽和模型的準確性,挑選具有真實觀測的MOR 值的圖像作為測試集。表4 給出了文章所采用數據集的劃分方式。

表4 數據集概況

本實驗采用搭載了4 個NVIDIA Tesla V100 GPU 的服務器,在PyTorch1.1.0 框架下搭建神經網絡進行訓練。使用SGD 梯度下降方法,學習率為0.001。圖片壓縮到224*224,衰減率為0.2,且衰減間隔為20。以batch size 為128 訓練了80個epoch。具體訓練步驟如下。

(1)在強監督數據集上以上述參數進行訓練,得到初步能見度預測模型;

(2)將弱標簽數據集中的圖片放到初步能見度預測模型進行預測,得到弱標簽?;旌蟽煞N數據集,重新以8∶1 ∶1 的比例劃分訓練集驗證集與測試集進行訓練,得到最終模型。

(3)在模型評估階段,本小節采用MAE 誤差作為評價指標,表5 描述了測試集的具體評價情況。

表5 模型評價結果

從表5 可以看出:(1)對于強監督模型來說,本模型通過引入上下幀數據的標簽信息作為參考,在增大數據量的同時修正了標簽,在測試集上使平均絕對誤差達到了10.3 m,具有優秀的性能。(2)對于弱標簽圖像來說,通過加入偽標簽,大幅度增大訓練數據量,在與強監督模型相同的場景1 中將平均絕對誤差降低2.2 m。在場景2 中也具有較好的表現。(3)文章同時將兩種模型對部分測試集的預測和真實值的結果進行可視化用于定性判斷,如圖5 所示。筆者將強標簽訓練集訓練得到的模型定義為模型1,將弱標簽訓練集訓練得到的模型定義為模型2。從圖5 中可以直觀的看出深度學習模型在測試集中的預測結果與真實值極為接近,預測效果良好,模型性能優越。

圖5 深度學習模型預測能見度與真實值比較

4 討論與結論

文章針對機場能見度預測困難、設備成本高等問題,分別通過AMOS 觀測數據以及監控視頻數據兩種方式,構建模型對能見度進行預測。

首先,文章對AMOS 數據進行整合與分析,自主創建了兩項指標,并結合已有指標進行多項式回歸得到表達式。該表達式通過假設檢驗證明了有效性,線性回歸精度已經達到一個可觀值在實際應用中可以對能見度進行可靠的預測。但是由于缺乏特征之間更具體的關系,只能進行線性擬合,未考慮表達式的真實結構,未來嘗試對表達式進行基于真實現實意義的解析。

其次,文章通過對機場監控視頻進行創新性的處理,按照每秒對視頻進行畫面抽取并賦予標簽后,結合前一秒圖像與后一秒圖像對標簽進行調整。將單個視頻擴增到萬級圖像數據量的同時保留了視頻連續信息。提出了深度殘差回歸網絡提取特征并回歸預測,突破了傳統方法提取固有特征的限制,將平均絕對誤差(MAE)降低至10.22 m。同時將視頻中沒有標簽的部分進行預測,并與有標簽數據混合重新劃分訓練集測試集進行再訓練,進一步提升模型性能,將平均絕對誤差降低至8.11 m。該模型以極低的平均絕對誤差證明了該模型對視頻數據中變化的場景均有較好的能見度預測能力。但是由于文章采用數據的時間段為凌晨零點至早上八點,可見度范圍在50 m至1100 m,數據跨度較低,只能對未給標簽的數據近似預測,無法完整的對各種情況下(如霧氣較小的中午時間段等)的能見度進行準確的預測。未來嘗試搜集全時間段數據,構建完整的能見度預測模型。

綜上所述,文章在兩種數據下構建的模型均對能見度具有較好的預測效果,并對未來機場能見度預測的實際應用有著重大意義。

猜你喜歡
能見度協方差殘差
基于雙向GRU與殘差擬合的車輛跟馳建模
基于殘差學習的自適應無人機目標跟蹤算法
2005—2017年白云機場能見度變化特征及其與影響因子關系研究
基于遞歸殘差網絡的圖像超分辨率重建
多元線性模型中回歸系數矩陣的可估函數和協方差陣的同時Bayes估計及優良性
二維隨機變量邊緣分布函數的教學探索
低能見度下高速公路主動誘導技術的應用
不確定系統改進的魯棒協方差交叉融合穩態Kalman預報器
前向散射能見度儀的常見異?,F象處理及日常維護
前向散射能見度儀故障實例分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合