?

RCA(1)時間序列模型均值變點的在線監測

2023-12-13 01:15賈偉亞魏岳嵩徐建中
關鍵詞:變點后驗樣本量

賈偉亞,魏岳嵩,徐建中

(1.亳州學院 教育系,安徽 亳州 236800;2.淮北師范大學 數學科學學院,安徽 淮北 235000;3.亳州學院 電子與信息工程系,安徽 亳州 236800)

0 引言

變點問題起源于質量控制領域,由于生產線中產出的產品總存在不合格產品,為保證產品質量,需將不合格產品及時抽出,不合格品出現的時刻就是變化點,這便產生對變點的研究。隨著變點問題研究的深入,其研究方法和分析模型也相應多樣化,從而被廣泛應用到金融、工業、醫學和水文等領域。如譚長春等[1]應用變點檢測分析金融傳染問題;周佳琪等[2]利用變點模型分析房地產價格的影響因素;尚云艷等[3]和仲建蘭等[4]應用變點模型研究控制圖的問題;張羽等[5]和張清杰等[6]在研究水文問題中應用變點分析法。

變點的在線監測問題是指在已有模型基礎上對新觀察數據進行在線監測,直到出現變點才停止[7]。許天明等[8]研究AR(p)(p階自回歸)模型中存在一個均值變點的估計問題;胡堯等[9]研究方差非參數回歸模型中均值與方差雙重變點的估計;朱慧敏等[10]研究方差變點模型CUSUM(Cumulative Sum)型估計量的相合性;胡丹青等[11]研究線性回歸模型多結構變點檢測方法;李美琪等[12]研究線性回歸模型中相依數據的多結構變點問題。Gombay等[13]引入有效得分向量,將變點的在線監測問題推廣到AR(p)(p階自回歸)模型中。薛義新等[14]對自回歸模型參數變點進行分析,構造殘差累積和監測統計量,給出監測統計量的極限性。齊培艷等[15]研究多項式回歸模型中系數變點的在線監測問題。Na等[16]討論變系數和變方差的在線監測問題。Qin等[17]研究線性過程方差變點估計強相合性。Aue等[18]對RCA(1)時間序列模型均值變點的監測統計量進行分析研究,得到統計量的極限分布性質。Li等[19]引入波動監測程序對RCA(p)模型中參數變點進行在線監測分析研究。窗寬參數在高頻數據波動率和短期負荷區間預測等分析中均有應用[20-21]。在變點問題的研究中,劉維奇等[22]對多元時間序列均值向量變點進行研究,引入窗寬參數構造殘差累積和統計量對均值變點進行在線監測。陳占壽等[23]和李佛曉等[24]通過引入窗寬參數分別對線性回歸模型和自回歸模型的參數變點進行修正后的在線監測。在變點的在線監測過程中,窗寬參數對變點監測運行時間有著重要的影響,故可通過引入窗寬參數來調整運行時間。

本文對RCA時間序列模型的均值變點進行研究,在模型中引入窗寬參數,并插入窗寬參數的一致估計,用來調整監測的起始時刻,以此來提高變點分析檢驗勢,縮短監測平均運行時間,給出一種改進變點監測方法。給出監測統計量在原假設和備擇假設下的極限分布以及其后驗檢驗,并對極限分布和后驗檢驗進行證明,得出極限分布的一致性,以及后驗檢驗提高檢驗準確率的有效性。數據模擬結果表明,可根據變點出現時刻與監測起始時刻的遠近選取適當的窗寬參數,以縮短平均運行長度,達到更有效檢驗效果,并通過后驗檢驗對歷史樣本數據穩定性進行分析,提高模型檢驗準確性。

1 模型假設

設隨機變量{Xn} 是一階隨機系數自回歸時間序列模型,滿足下列等式

這里Z 表示任意正整數,φ是待估系數,{bn} 和{en} 分別是白噪聲序列,且滿足如下條件

這里條件(i)保證{Xn} 的嚴平穩性,條件(ii)是{Xn} 二階平穩性充要條件??紤]隨機變量的均值模型

這里{ }Xn是RCA(1)時間序列模型。假設歷史數據前m個觀測樣本是沒有變化的,檢驗如下假設H0:Δm=0,H1:Δm≠0。當 |Q(m,k,h) |第一次超過g(m,k,h)時,拒絕H0并停止。因此,定義如下停止時刻

這里inf?=∞,Q(m,k,h),g(m,k,h)分別表示累積和監測統計量和邊界函數,定義為

引理1(RCA(1)時間序列的強不變性) 令{ }Xn是滿足式(1)中條件(i)和(ii)的RCA(1)時間序列,則存在k >2,使得。然后,存在一個維納過程{W(t)}t≥0,使得

這里t→∞,v >2,St=X1+X2+…+Xt,且令

證明 類似文獻[16]中5.1對定理2.1的證明方法可證得。

由于上述統計量中的參數σs未知,便需引入另一個合適估測參數來代替方差參數σ2s,為此通過RCA(1)時間序列模型參數一致估計引入參數估計,其中m∈N。

引理2 隨機變量{Xn} 是滿足式(1)中條件(i)和(ii)的RCA(1)時間序列,對任意m∈N,令和分別是參數φ,σ2和ω2的弱一致估計,有

其中m→∞,→P表示依概率收斂,是的弱一致估計。

證明 結合引理1,由可測映射定理和弱一致收斂原理可證。

2 極限分布定理

定理1 令{Xn} 是滿足式(1)中條件(i)和(ii)的RCA(1)時間序列,則存在k >2,使得<∞和E|φ+b1|k <1,則存在一個維納過程{Wˉ(t)}t∈[0,1],使得在假設H0下有

證明 由引理1和引理2,對任意k∈N 和,當m→∞時,有

又因為

其中m→∞,證明得

其中m→∞。令,其中維納分布和m是獨立的,得

其中=D表示等號兩邊函數分布相同。{W(t)} 和{W(t)} 是2個相互獨立的維納過程,由

其中0 ≤t<∞, →D表示依分布收斂。{Wˉ(t)}是一個維納過程,可得

結論得證。

證明 由文獻[15]中定理2,類似得證。

3 后驗檢驗

令Y1,Y2,…,Ym是隨機變量觀測值,考慮均值模型

這里{Xn} 是RCA(1)時間序列模型。應用基于固定數據m個觀測值的監測程序代替時間序列模型體系,檢測平均假設變化,假設H0:Δm=0,H1:Δm≠0,k*<m,構造累積和檢驗統計量

其中m→∞,σ?S,m定義在式(8)中。

證明 由引理1和引理2,存在一個維納過程{W(t)} ,且v >2 時,有

其中k→∞。因此

其中m→∞,則

其中m→∞。最后,由模型變換可得,其中{B(t)}t∈[0,1]表示布朗橋,類似①的證明,可得②也成立。

定理4 令{Xn} 表示滿足式(1)中的條件(i)和(ii)的RCA(1)時間序列,存在k >2,使得E|e1|k <∞和E|φ+b1|k <1,有

證明 令k?=m+k*,其中k*表示變點發生的時刻,由式(22)的累積和統計量的假設

4 模擬計算

4.1 模型檢驗模擬

應用python軟件對模型進行數據模擬檢驗,主要通過檢測統計量經驗水平、檢驗的勢和平均運行長度來說明模型優越性。表1是用5 000個服從標準正態分布的歷史樣本和10 000個檢測樣本經過10 000次循環得到的部分臨界值表cα(γ)?;谶吔绾瘮?/p>

表1 不同的檢驗水平α 和γ 的臨界值

令參數γ=0.00、0.15、0.25、0.35、0.45、0.49,顯著性水平α=0.01、0.025、0.05、0.1、0.25,可以由公式得到對于不同的檢驗水平α和γ的臨界值,如表1所示。

表2是由定理1經過2 500次模擬得到的經驗水平。采用數據生成模型Xn=(φ+bn)Xn-1+en(n∈Z),其中φ=0,w2=0.5,σ2=0.5。取歷史樣本量m=200、500,并且令窗寬參數h=0.0、0.1、0.2、0.3、0.4、0.5,邊界函數中參數γ=0.00、0.25、0.45,檢驗水平α=0.05,檢測樣本量q=m,q=2m,q=4m。由表2可以看出,當歷史樣本量m和窗寬h不變時,檢測樣本量q和參數γ在逐漸增大的時候檢驗勢也在逐漸增大,即誤報率在逐漸增大。當歷史樣本數據m在逐漸增大時,保持其他3個變量相同時的經驗水平值基本呈現減少趨勢。當γ=0.25,m=200,q=m,h=0.4;γ=0.25,m=500,q=2m,h=0.5 和γ=0.45,m=500,q=4m,h=0 時,統計量的模擬值和顯著性水平更接近,但是在其他給定參數下,兩者有一定的偏差。

表2 經驗水平

表3和表4分別是檢驗勢和平均運行長度。在數據生成模型中取k=0.1q和k=0.5q時加入變點,將均值在k處由0變到1,測試監測統計量,得到檢驗勢和平均運行長度。取歷史樣本量m=200,監測樣本量q=m,窗寬參數h=0.0、0.1、0.2、0.3、0.4、0.5,邊界函數中的參數γ=0.00、0.25、0.45,比較參數γ和窗寬h變化時監測統計量檢驗勢和平均運行長度變化。由表3 和表4 可以看出,當k=0.1q時,在不同γ和h取值下,檢驗勢基本相同,但是隨著h的增大,平均運行長度有所減小。當k=0.5q時,隨著h的增大,檢驗勢逐漸提高,平均運行長度逐漸減小。故在進行變點分析時,選取合適參數進行檢驗可以有效降低誤差,提高檢驗的準確性。與不加窗寬參數h原模型進行對比分析,加入窗寬參數后效果更顯著。

表3 檢驗勢

表4 平均運行長度

由表1~4綜合分析可得,引進窗寬參數以后,能夠調整監測起始時刻,提高檢驗勢,縮短平均運行長度,特別是在變點出現較晚時,效果更加顯著。在進行變點實際分析時,可根據變點與監測起始時刻距離選取合適γ和h。

表1~4中參數α,γ,h選取受監測樣本量和歷史樣本量影響而會有所不同。如文獻[7]所給邊界函數以及參數γ取值接近于0時,監測方法過于保守,使得監測樣本量相對較小時,會降低監測功效。實際變點監測問題中,監測過程遲早要結束,所以當監測樣本量相對于歷史樣本量較小時,可取較大γ值,反之可取較小γ值,從而使經驗水平接近于給定檢驗水平。

4.2 后驗檢驗模擬

由于模型監測中用到歷史數據,即監測中前m個數據是給定的,由上面對經驗水平表、檢驗勢和平均運行長度分析可知,歷史樣本量m對檢測結果有重要影響,并且前m個歷史數據也有存在變點可能,若存在變點則影響更大。故利用python 軟件對歷史樣本數據進行檢驗,通過后驗檢驗判別前m個歷史樣本是否存在變化。

表5 是基于定理3 經過1 000 次模擬得到的后驗檢驗表。數據生成采用模型1 ≤n≤m。取歷史樣本量m=200、500,并且令窗寬參數h=0.0、0.1、0.2、0.3、0.4、0.5,邊界函數中的參數γ=0.00、0.25、0.45。

表5 后驗檢驗勢

由表5可以看出,當歷史樣本量m和參數γ固定時,檢驗勢隨著窗寬參數h增大逐漸增大。當歷史樣本量m和窗寬參數h固定時,檢驗勢隨著參數γ的增大逐漸增大。但當窗寬參數h和參數γ固定時,檢驗勢隨著歷史樣本量m的增大呈現增大或者減小變化。并且當γ=0.45,m=200,h=0.3 和γ=0.45,m=500,h=0.3 時,統計量的模擬值和顯著水平更為接近。綜上,給定不同的參數值對分析結果有一定影響,并且本次模擬給定的前m個歷史樣本數據基本符合要求,可有效降低原模型檢驗錯誤率。故對于此類模型檢驗問題,可通過進行后驗檢驗判斷歷史數據穩定性,以提高模型檢驗準確度。

5 結論

本文給出改進變點監測方法,用于RCA(1)時間序列模型均值變點監測。通過在模型中引入窗寬參數,用來調整監測起始時刻,以此來提高變點分析檢驗勢,縮短監測平均運行時間。給出監測統計量在原假設和備擇假設下的極限分布以及其后驗檢驗,并對極限分布和后驗檢驗進行證明,得出極限分布的一致性。數據模擬結果表明,可根據變點出現時刻與監測起始時刻遠近選取適當窗寬參數,以縮短平均運行長度,達到更有效的檢驗效果,并通過后驗檢驗對歷史樣本數據穩定性進行分析,以提高模型檢驗準確性。

猜你喜歡
變點后驗樣本量
醫學研究中樣本量的選擇
回歸模型參數的變點檢測方法研究
正態分布序列均值變點檢測的貝葉斯方法
基于對偶理論的橢圓變分不等式的后驗誤差分析(英)
基于二元分割的多變點估計
獨立二項分布序列變點的識別方法
貝葉斯統計中單參數后驗分布的精確計算方法
航空裝備測試性試驗樣本量確定方法
Sample Size Calculations for Comparing Groups with Binary Outcomes
一種基于最大后驗框架的聚類分析多基線干涉SAR高度重建算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合