?

基于IOWA 算子的航班訂座組合預測模型

2024-01-17 12:48尚亞博潘?,?/span>吳靈珊
中國民航大學學報 2023年6期
關鍵詞:航班算子精度

樊 瑋,尚亞博,潘?,?,吳靈珊

(1.中國民航大學計算機科學與技術學院,天津 300300;2.廈門航空公司數字委員會,福建 廈門 361006)

航班訂座預測歷經近50 年的發展,早期重點關注預測結果在座位優化中的應用,回歸模型、乘法模型、增量模型、加法模型、指數平滑模型等是常用的經典方法[1-2]。近年來,隨著航空公司競爭的不斷加劇,國內外學者對航班訂座預測的研究不斷涌現。國外學者更關注預測精度的評估[3-4]以及對高艙低賣或低艙需求被擠兌行為的補償[5],國內學者則不斷嘗試各種新的預測方法在航班訂座預測這一問題中的應用,如神經網絡模型[6-7]、多元回歸模型[8]、聚類模型[9]等方法。

航班旅客訂座量受淡旺季、航司競爭、節假日及重大事件等多種因素影響,需求變化較大,歷史數據呈現較強的非線性特征,且預測期越遠,可獲得數據質量越差,各種模型適應性存在較大差異。組合預測模型可以綜合各單項預測模型的優點,因此被廣泛應用[10-11]。組合預測模型以單項預測模型的加權組合為主,如方差倒數模型[12]、均方誤差倒數模型[13]、二項式系數模型[14]、基于誘導有序加權平均(IOWA,induced ordered weighted averaging)算子的組合預測模型[15]等,這些預測模型對加權系數的確定基本以整體的誤差平方和或誤差絕對值之和最小為基準,但基于IOWA 算子的組合預測模型將預測精度作為單項預測模型的誘導值,傾向于在組合預測結果中增大各數據點預測精度較高的單項預測模型的權值,計算科學性明顯,在交通運輸[16]、經濟管理[17]、能源動力[18]等領域應用廣泛,張蕾[19]將其應用于民航客運量的整體預測,目前鮮有將相關方法應用于特定航班預測的文獻。本文結合在國內外航空公司得到廣泛應用的經典預測模型,構建了基于IOWA 的航班訂座組合模型,并結合航班旅客訂座數據的特點,改進了模型中IOWA 算子誘導值的計算方法,實驗結果表明,該模型能獲得滿意的預測結果。

1 數據分析與預處理

鑒于實際的應用場景,航班訂座數據在不同數據采集點(DCP,data collection point)取得,一般遠期數據采集間隔較大,近期數據采集間隔較小,本文選取采集間隔依次為航班離港前35、17、15、13、9、8、7、…、1、0 天。采集兩年內某航班在所有DCP 的數據,記t 為航班日期,第t 期航班的累計訂座量可記為ft=(DCPt,35,DCPt,17,DCPt,15,DCPt,13,DCPt,9,…,DCPt,1,DCPt,0),其中,t=1,2,…,n,n 為兩年內該航班總數。

考慮到銷售異常及座位數對高需求的抑制,在預測之前需要進行數據預處理,數據預處理在每個DCP單獨計算,首先統計2 年內所有航班在該DCP 的均值及標準差,刪除偏離均值超過3 倍標準差的數據,其次對客座率接近100%的航班,為了彌補固定座位數對高需求的溢出效應,對DCP0的數據擴大10%。對預處理之后的數據,比較各DCP 兩年同期數據后發現,航班訂座量的變化隨機性較強,但兩年對應時間段的變化趨勢相關性明顯,且同一個DOW(day of week)的航班,訂座量相關性比較顯著。

2 經典預測模型

航班預測的目標是依據t 期航班當前DCPt,i的訂座量預測未來DCPt,0的訂座量。增量模型、指數平滑模型、回歸模型是航班訂座預測廣為采用的經典模型,這些算法的基本思想是將每個DCP 的訂座量獨立于當前航班前期訂座量,算法參數學習都選取了同一航班同一DOW 的歷史數據,如對周一航班提前3 天預測模型的參數學習,就選取了同一航班倒推2 年的每個周一航班提前3 天的訂座量,且按時間順序自遠至近排列,以此類推。

q 為訓練集歷史航班總數(q

增量模型統計歷史航班DCPt,i到DCPt,0之間的訂座增量均值,對t 期航班處于第i 個DCP 的訂座量的預測結果為當前訂座量加上訂座增量均值,即

指數平滑模型自訓練集第1 條航班數據開始,逐條對訂座增量移動平均,t 期航班的預測結果同樣為該航班在第i 個DCP 的實際訂座值和t-1 期航班移動平均得到的值相加,即

式中,平滑指數?=0.65。

記X={x1,x2,…,xt,…,xq},Y={y1,y2,…,yt,…,yq},其中:xt=DCPt,i和yt=(DCP0,t-DCPi,t)分別表示第t 期歷史航班當前DCP 訂座量和訂座增量,回歸模型表示如下

3 基于IOWA 算子的組合預測模型

3.1 IOWA 算子定義

誘導有序加權平均算子IOWA 是Yager[20]早期提出的一種被廣泛應用的信息融合算子,其具備單調性、冪等性、介值性等,已被國內外學者廣泛應用于建立各種組合預測模型[21-22]。

定義1設〈v1,α1〉,〈v2,α2〉,…,〈vm,αm〉是m 個二元組,令則稱函數fW是由v1,v2,…,vm所產生的m 維誘導有序加權平均算子,記為IOWA 算子,vi稱為αi的誘導值,其 中,v_index(i)是v1,v2,…,vm中按從大到小的順序排列的第i 個數的下標,W=(w1,w2,…,wm)T是算子的加權向量,滿足

該定義表明IOWA 算子是對誘導值v1,v2,…,vm按從大到小順序排序后所對應的α1,α2,…,αm中的數進行有序加權平均,wi與數αi的大小和位置無關,而是與其誘導值所在位置v_index(i)有關。

3.2 基于IOWA 算子的組合預測模型

定義2令

則αi,t表示第i 種預測方法在t 期的預測精度;xt為訓練集第t 期實際值。將αi,t作為預測值的誘導值,這樣m 種單項預測方法在t 期的預測精度αi,t和其對應 訓練集的預測值就構成了m 個二元組〈α1,t,。設W=(w1,w2,…,wm)T 是各種預測方法在組合預測模型中的加權向量,則由預測精度α1,t,α2,t,…,αm,t作為誘導值所產生的IOWA組合預測結果表示如下

令t 期第i 種預測方法的預測誤差eα_index(i),t=xt-,則q 期組合預測誤差的平方和為

以誤差平方和為最小建立基于IOWA 算子的組合預測模型

式中,wi和wj為欲求解的單項模型權重。

3.3 組合模型的預測算法

按照3.2 節的組合預測模型,算法1 步驟如下:

(1)準備訓練數據集和測試數據集;

(2)用m 種單項預測模型在訓練集訓練預測參數,其中m=3,選第2 節3 種單項模型;

(3)根據得到的預測參數,分別用m 種單項模型繼續在訓練集進行預測,并根據式(5)得到各單項模型在各t 期的預測精度;

(4)將各t 期的預測精度作為誘導值,將各單項模型預測結果作為預測值,代入式(6),可得到以權重W 為變量的線性規劃表達式,即式(7)的目標函數;

(5)求解線性規劃表達式,得到賦予各單項模型的權重向量W;

(6)在測試集上,將第(2)步中得到的預測參數代入各單項模型,得到單項模型預測結果,設定新的誘導值,結合W,代入式(6),得到預測結果;

(7)預測結果評析。

需要注意的是,算法在學習階段的第(4)步,采用各期預測精度作為誘導值,在實際預測的第(6)步,無法得到預測精度,參考文獻[15],將最近TL期的可測量的各單項模型的預測精度的平均值(TL)作為誘導值,表示如下

式中,TL表示期末,即本期。

4 實例分析與算法改進

4.1 算法1 實例分析

本文以某航司某條商務航線上午9 時較為繁忙的一個航班為例,該航班每日1 班,選取2018—2019年的歷史數據,以2018 年1 月到2019 年10 月的數據作為訓練集,以2019 年11 月到12 月最后2 個月的數據作為測試集,分別在不同的DCPi進行預測,其中,i ∈{35,17,15,13,9,8,…,1}。本文不僅比較各算法在相同DCP 的預測效果,而且評估算法在航班離港不同提前期的預測效果。評價指標選擇平均絕對百分比誤差(MAPE,mean absolution percent error)和均方根誤差(RMSE,root mean squared error)表示如下

嚴格按照算法1,在訓練集上選取各t 期航班的預測精度作為W 估算誘導值,在測試集選取最近4 期(即按照DOW 選取歷史數據的最近1 個月的已離港航班)航班的預測精度平均值作為未來預測誘導值,即式(9)中TL=4,結果發現,組合算法幾乎在所有DCP都傾向于得到W=(1,0,0)的組合權值,僅在DCP3得到W=(0.902 6,0.097 4,0)的不同結果。也就是說,算法傾向于在不同的預測周期t 都選擇3 種單項預測模型中誘導值最大的模型,而非3 種單項預測模型的加權組合,這和文獻[15,23]的結果不謀而合。分析發現,以往期精度作為學習誘導值,該誘導值可以在每個周期t 準確地選擇最佳單項預測模型,進行權重參數學習,但對未來的預測,因為無法得到類似訓練集數據的精確預測精度,誘導值的設置不一定能符合實際的數據狀況。測試集組合預測結果也驗證了這一分析,不管在遠期DCP 還是近期DCP,都出現MAPE 及RMSE 高于其他模型的情況。

經2018 年全年數據測試發現,回歸模型、增量模型、指數平滑模型在所有航班上預測最好的情況分別占14.2%、18.5%、67.3%,但預測精度為0 的情況分別占5.90%、6.25%、13.19%,顯然,指數平滑模型整體預測較好,但個體預測精度最差,回歸模型反之。這表明數據隨機性變化對模型選擇的影響,即在訂座量突變情況下,回歸模型表現較好,增量模型適合比較平穩的季節,指數平滑模型對近期單調增減反應較快。

分別選擇2019 年全年52 周DOW=1 和DOW=5的DCP35和DCP5的實際累計訂座量,以觀測預售遠期、預售近期在不同DOW 的數據表現,如圖1 和圖2所示。顯然,預售遠期和預售近期數據在全年表現了基本一致的季節性趨勢,但數據的隨機性明顯。表1中2、3 列給出了各DCP 一年內數據的均值μ 和標準差δ,可見數據波動幅度較大,且最終訂座量在10~172之間波動,因此,算法1 第(4)步和第(6)步將預測精度作為誘導值,在預測結果相差甚微的情況下,也會優先選擇預測精度高的單項模型,這無法兼容隨機波動較大、數據變化幅度較大的航班訂座量數據,特別是第(6)步的誘導值設定具備一定的主觀性,對下期較大的數據波動適應性差。

表1 實際數據與預測偏差分析表Tab.1 Analysis of deviation between actual data and prediction

圖1 2019 全年周一遠期近期訂座對比圖Fig.1 Comparison of long-term and short-term reservations on Mondays in 2019

圖2 2019 全年周五遠期近期訂座對比圖Fig.2 Comparison of long-term and short-term reservations on Fridays in 2019

4.2 算法改進

為了解決算法1 對隨機波動較大數據的適應性,分別對算法1 第(4)步和第(6)步的誘導值進行改進。在第(4)步,由于歷史數據預測精度已知,但訂座量數據離差較大,為了平抑數據差異,采用tanh 函數對預測精度進行平滑處理,截斷小數點后2 位,并將其結果作為新的誘導值,即

式中,α′i,t如式(5)定義。

圖3 給出2018 年全年DCP35采用回歸預測的預測精度α35,t和誘導值之間的關系。式(12)可強制不同單項預測模型的預測精度相差較小時獲得相同的誘導值。但當2 個或3 個單項模型誘導值相同時,可修改預測值為其相應的平均值,用于算法1 第(4)步。

圖3 經tanh 函數變化后的預測精度曲線Fig.3 Prediction accuracy curve after function changing of tanh

不同于第(4)步,算法第(6)步的誘導值在輸入之時是預估的,鑒于航班訂座量較大的波動,且航班本期DCP 的訂座值和前期DCP 的訂座值相關性較大,同時受前3 日航班影響較大,為此,將算法第(6)步的誘導值設置如下,可在未來誘導值設定時考慮航班當前各方面的情況。

式中:t=1,2,3,代表前3 期航班;i=1,2,3,代表第i種預測模型;k 為DCP 下標表示第i 種預測方法對當期航班TL在DCPk預測時的誘導值和表示當期航班在前1 個及前2 個DCP 的訂座量除以總座位數,即客座率表示t 期航班預測值減去實際最終訂座值再除以總座位數;βt代表前3 期 航班影響權重,取為式(9)結果。

4.3 算法比較

進一步在測試集得到表1 所示結果。記算法1 為IOWA,4.2 節改進后的算法為IOWAn。不同于IOWA 在幾乎所有DCP 都得到W=(1,0,0)的結果,IOWAn在DCP1得到W=(0,0,1),在DCP2得到W=(0.54,0,0.46),在DCP3得到W=(0.944,0,0.056),在DCP15之前得到W=(1,0,0),其余DCP 都得到W=(0,1,0)的結果。顯然,IOWAn傾向在遠期選擇期望最佳的單項預測模型,在中期選擇表現中庸的模型,在近期更希望進行單項模型的加權組合,這和式(12)的設計初衷吻合。

從表1 可見,在DCP15之前,IOWAn和IOWA 傾向于選擇單項預測模型中最優模型,和指數平滑法結果接近,這驗證了遠期改進的誘導值對結果影響不大。在DCP1到DCP3,IOWAn綜合發揮了權值調節和近期航班擾動調節的優勢,在所有算法上是表現最好的,其余DCP 代表的中期預測方面,IOWAn整體表現優良,在DCP11稍遜于指數平滑法。整體上,IOWAn在航班訂座預測量問題上,優于IOWA 及其他單項預測模型,驗證了誘導值的合理設定對基于IOWA 組合預測模型的重要性。

航空公司實踐中很難保證數據的完整性,某航空公司實測數據集大約包含15%的不完整數據,上述回歸模型、增量模型、指數平滑模型的預測成功率分別約為93.4%、96.1%、67.9%。對于組合模型而言,當某一單項預測模型失效時,可將其權值均分給其他有效單項預測模型,其預測成功率接近100%,因此,組合模型在提高預測精度的同時,更能大幅度提高預測算法的健壯性。

5 結語

航班訂座量預測在航空公司有多方面的應用需求,也是航空公司業務建模的難點之一,本文以航空公司常用的回歸模型、增量模型、指數平滑模型為基礎,首先構建了一種廣泛應用的基于IOWA 的航班訂座組合預測模型,在此基礎上,結合IOWA 模型原理,深入分析航班訂座量數據獨有的季節性及非線性特點,改進了適合航班訂座特點的誘導值計算方法,不僅提高了預測的準確度,而且大幅度改進了預測算法的健壯性。本文提出的航班訂座量預測算法,已應用于航空公司的業務實踐,取得滿意的效果。

猜你喜歡
航班算子精度
全美航班短暫停飛
山航紅色定制航班
山航紅色定制航班
山航紅色定制航班
擬微分算子在Hp(ω)上的有界性
各向異性次Laplace算子和擬p-次Laplace算子的Picone恒等式及其應用
一類Markov模算子半群與相應的算子值Dirichlet型刻畫
基于DSPIC33F微處理器的采集精度的提高
Roper-Suffridge延拓算子與Loewner鏈
GPS/GLONASS/BDS組合PPP精度分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合