?

一種用于周期性事件預測的潮汐模型

2023-01-16 02:55景海波南京信息工程大學
消防界(電子版) 2022年22期
關鍵詞:平方和周期性次數

■ 景海波 南京信息工程大學

隨著我國經濟的高速發展,城市空間環境的復雜性急劇上升,各種事故災害頻發,安全風險不斷增大,消防救援隊伍的任務也越多。新時代的消防業務已經不僅僅局限于火災的防范和撲滅,在各種災難或事故現場都有消防隊員的出現[1]。消防隊員所承擔的任務呈現出多樣化、復雜化的趨勢。

ARIMA 季節性時間序列模型適用于短期預測[2],是用于單變量時間序列數據預測的最廣泛使用方法之一,模型十分簡單,只需要內生變量而不需要借助其他外生變量。

多項式回歸的最大優點就是可以通過增加x 的高次項對實測點進行逼近,直至滿意為止。事實上,多項式回歸可以處理相當一類非線性問題,它在回歸分析中占有重要的地位,因為任一函數都可以分段用多項式來逼近。但是當x 的次數越高時,擬合出來的方程就越復雜,可能導致往后預測的結果產生較大的誤差。

一、模型建立與求解

(一)ARIMA 季節性時間序列模型

把數據看作時間序列,用Box-Jenkins 方法中的ARIMA(差分整合移動平均自回歸模型)模型,對出警次數每月、每年的變化趨勢總體進行預測。已知由季節性因素或其他周期因素引起的周期性變化的時間序列,稱為季節性時間序列,對應本題即指出警次數按照12個月有季節性變化,符合此種情況,周期s=12。

設本題所給出警次數數據序列Xt, 使用ARIMA(p,d,q) 模型[3],表示為:

Step1. 計算自相關系數與偏相關系數,檢驗時間序列的平穩性

如果發現圖形有多于1 個不是截尾或拖尾,則說明Xt 不是平穩的,需要做差分運算[4]。

Step2. 進行差分運算,確保原序列變為平穩時間序列;

Step3. 進行模型定階,由差分后的自相關圖與偏自相關數據圖可知:自相關系數在滯后1 階后就快速地減為0,偏自相關系數同自相關系數,所以p=1,q=1;

Step4.擬合,估計模型參數;

Step5.用標準化殘差進行模型驗證。

(二)自新的潮汐模型

首先統計出2016—2020 年5 年內每個月7 類事件發生的次數,并取不同月份各類事件發生的年平均次數,初步判斷出第3 類、第7 類事件發生的頻率較高且具有一定的周期性。

接著使用最近鄰法對7 種事件數據作層次分析,得到事件歷年各月的系統樹圖。根據各類事件的系統樹圖,以最大標準距離的1/2 作為聚類的判斷標準,認為4 類族群以下的事件在發生次數上存在周期性變化,5 類族群以上的事件的發生次數受不同月份,即發生時間的影響較小,呈隨機分布。結果表明,周期性變化事件1、3、5、7,非周期性變化事件2、4、6。

為了確保模型建立的可靠性,選擇2016—2019 年的數據作為依據樣本,2020 年的數據用以檢驗擬合度,作為模型擬合效果的評價標準。

1.周期性事件1、3、5、7 的四種模型

(1)因為存在周期性變化事件的數據結構相對簡單,首先選用多項式回歸的方式進行擬合,鑒于當多項式次數達到11 時擬合曲線便與樣本曲線完全重合,在1—11 次多項式擬合中遍歷搜索擬合程度最優的多項式,發現10 次多項式的擬合程度最優,即與2020 年各月真實值的誤差平方和最小,為248。然而實際作出曲線后,顯然多項式無法較好地反映出各月次數的變化趨勢。

(2)于是我們針對第一類存在周期性特點的事件,建立一個新的反映數據周期性變化的模型。分別取2016 年—2019 年中每年相鄰兩月的事件發生次數變化率、各月結果的均值作為預測模型中相鄰兩月的變化率。對于模型中初始值,即一月事件次數,以五年間一月事件次數的最大最小值為上下限,在其中隨機取值。

為了尋找此模型對本題數據擬合的最優解,使用遍歷搜索方法找出模型的最優初值,使得與2020 年各月真實值的誤差平方和最小,其中誤差平方和為217,初值為14。得到圖像顯示擬合的效果仍不夠理想。

(3)考慮到前兩個模型是基于2016-2019 四年四組數據處理成的一組數據進行分析,必然在經歷數據壓縮處理后出現部分信息丟失的情況,為了避免這一情況,采用ARIMA 季節性時間序列模型,這既考慮到存在周期性影響因素,又利用2016—2019 年的全部數據對2020年12 個月的事件數據進行了預測。其擬合度相較于前兩種模型有較大提升,其誤差平方和為132,初值為8,然而這一模型依然存在部分數值與實際數值相差過大的情況。思考后認為這是由于建立ARIMA 模型所依據的數據量仍然太小,部分年份的周期變化中帶有的隨機干擾(白噪聲)被放大了,從而干擾了模型對數據變化周期的計算。

(4)對模型2 進行改進,以2016 年—2019 年4 組數據作相同月份的橫向對比,將絕對值大于同月份數據均值的絕對值的數值視為存在較明顯的白噪聲干擾,為了盡可能減輕影響,最大程度保留數據的變化趨勢,將此項數據高過均值的部分保留1/2。

模型改進后的擬合度比ARIMA 模型稍有增高,其誤差平方和為127,初值為12。但是由圖1 可觀察到預測數值與實際數值相差過大的情況顯著減少。

圖1 四種模型擬合效果對比

結果表示:1 類事件,改進后的周期模型擬合程度最好。

3 類事件,四種模型的誤差分別為820、1118、1232×10^4、1118。在擬合時發現2020 年的數據未體現出2017-2019 年間的數據特征,但是與2016 年的數據特征存在相似性,結合3 類事件是季節性事件,推測2016 年與2020 年未體現數據特征的原因在于這兩年是存在較強異常氣候現象的厄爾尼諾年[5],導致年內應出現的周期性氣候被干擾,災害增多,救援出警次數的數據特征減弱。

5 類事件,四種模型的誤差分別為7、37、19、16。結果表明使用改進的周期模型可以較好擬合數據,但是多項式擬合結果的數值誤差平方和要稍小于改進的周期模型,但是無法體現數據的周期性特點。

7 類事件,建立的四種模型對2020 年的擬合效果都不佳,誤差分別為290、246、648、382。通過觀察發現2020 年數據的變化趨勢符合模型擬合出的趨勢,但是變化幅度相對較小,認為此事件也受到2020 年厄爾尼諾現象影響,出現數據特征減弱的情況。

2.非周期性事件2、4、6 的兩種模型

(1)對于非周期性變化事件2、4、6,首先考慮多項式擬合,由于數據分布的隨機性,擬合趨向于一條直線。

(2)考慮非周期性變化事件的隨機分布,先以歷年數據的最小最大值為下上限,模擬事件次數在此區間的隨機分布。再基于2016 年—2019 年數據擬合分布系數,得到此類事件的隨機分布模型,在進行多次計算后選取誤差平方和小于多項式擬合的一組數據,作為此模型計算2020 年各月份事件次數的結果。

以2016—2019 年四組數據的平均數作為模型的均值,將極小概率出現的過大或過小數值賦以歷年數據中的最大或最小值,確保隨機分布模型給出的計算數據在合理范圍。

結果表示,2 類事件(1)和(2)兩模型的誤差分別為27、24。4 類事件(1)和(2)兩模型的誤差分別為137、123。而對于6 類事件,隨機分布模型的擬合效果始終無法優于多項式擬合,表明6 類事件也隨月份存在周期性變化,則使用周期性模型對數據進行擬合,得到四種模型的誤差分別為290、246、648、382。

二、結果分析

根據文獻[6],消防出警事件可分為火情,搶險救援,社會救助。

對于數量接近一半的7 號事件,考慮到其具有周期性且于2 月( 春節煙花爆竹) 與6 月( 夏季炎熱干燥)出現高峰,推測此事件為火情。2、4 為隨機發生的無周期事件,則認為其為開門取鑰匙,救助貓狗這類的社會救助類。其余1、3、5、6 類事件可定性為搶險救援,其中5 類事件由于其顯著的周期性特征,即事件發生集中于5—8 月,因此可推測是抗洪搶險事件。

三、模型推廣

本文以某地為例,分析了各類火警救援事件與時間的關系,從事件是否有周期性角度出發,對不同類型救援事件次數與時間進行了擬合預測,驗證了自新的潮汐模型應用于周期性事件擬合預測和消防救援出警次數統計分析是可行的。以上研究能夠幫助消防隊對其救援的事件有更深入的了解,提前做好培訓工作并制定更加有效的應對方案,還對政府實施社區宣傳預防措施有一定的參考價值。

猜你喜歡
平方和周期性次數
2020年,我國汽車召回次數同比減少10.8%,召回數量同比增長3.9%
慢速抗阻訓練:周期性增肌的新刺激模式
俄羅斯是全球閱兵次數最多的國家嗎?
數列中的周期性和模周期性
費馬—歐拉兩平方和定理
基于切削次數的FANUC刀具壽命管理
利用平方和方法證明不等式賽題
一類整數遞推數列的周期性
如何快速解答抽象函數對稱性與周期性的問題
探索性作戰仿真實驗重復次數控制研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合