?

時間序列分解模型在山東省糖尿病門診量預測中的應用

2021-02-06 10:23焦晨黃艷然趙欽風冷安麗
中國農村衛生事業管理 2021年2期
關鍵詞:殘差季節門診

焦晨,黃艷然,趙欽風,冷安麗

1.山東大學齊魯醫學院公共衛生學院衛生管理與政策研究中心,山東 濟南 250012;2.國家衛生健康委員會衛生經濟與政策研究重點實驗室(山東大學),山東 濟南 250012;3.山東大學政治學與公共管理學院,山東 青島 266200;4.山東大學公共治理研究院,山東 青島 266200

1 研究背景

醫療服務數據反映了患者尋求醫療建議的時間,但不一定與癥狀發作的日期一致。尤其是患有輕度疾病的患者可能不會及時就醫,除非病程加重或出現并發癥[1]。因此,醫療咨詢的數量并不是患病情況的簡單衡量標準,而是疾病水平、疾病嚴重程度、醫療保健服務的可及性以及醫療衛生服務需求及利用能力的綜合體現[2]。許多醫療機構的就診數據都可以看到周期性或節假期效應。以往研究主要關注每周或每年的周期性變化,但忽略了公眾假期的影響[3]。國外專家把這種“節假日效應”歸咎于假期醫院員工減少,導致部分特殊治療和檢查不能進行[4]。迄今,關于糖尿病假日效應的文獻相對有限,且結果相互矛盾。對就診人次的周期性和節假日效應必須同時考慮,以便醫療保險管理和醫院管理者在節假日及其附近日期內對門診就診數據進行持續有效的監督。

時間序列可以幫助醫保和醫院管理人員每日監測就診情況,直觀識別出異?;顒覽5]。以往研究發現,在用于癥狀監測的醫療數據存在周期性和節假日效應,會掩蓋真正的疾病流行異常情況[6]。然而,以往采用時間序列分析方法的研究主要基于醫院健康信息系統數據,以季度或月度數據為統計指標進行門診人次或費用的預測,鮮有對醫療保險大數據的規律探索和預測研究。因此本文目的是采用“周”度數據,基于山東省2型糖尿病醫保門診人次構建時間序列分解模型,探索糖尿病門診就診規律,并對今后門診就診量進行預測。

2 資料與方法

2.1 資料來源

根據ICD-10疾病編碼,本研究提取山東省濱州、東營、菏澤、濟寧、萊蕪、聊城、泰安、威海、濰坊、煙臺、棗莊、淄博12個地級市醫療保險數據庫中2015年1月1日至2017年12月31日(共計156周)2型糖尿病患者門診數據。

2.2 研究方法

本研究應用時間序列分解法中廣泛的乘法模型建立數學模型。時間序列中每一時期的數據(Yt)是多種因素共同作用的綜合結果。這些因素通??煞譃?類:長期趨勢(T)、季節變動(S)、循環變動(C)和不規則變動(I)。即Yt=Tt·St·Ct·It。

2.2.1 時間單位的劃定 每年均從1月1日起,把每7天劃定為一“周”。2016年為閏年,為便于各年間統一比較,將2月29日歸入當年所在周(第9周)。另外將每年的12月31日歸入最后一周。每年均為52周。

2.2.2 時間序列分解模型的構建 使用時間序列分解法構建數學模型,為縮短預測周期,提高短期預測精度??苫凇爸堋倍葦祿M行預測,其過程如下:

①季節變動因素的計算

采用移動平均法計算季節指數。其步驟如下[7]:第一,計算52項移動平均數,作為該時期中間“周”的趨勢值,確定時間序列增長總趨勢;第二,計算3年內每周實際門診人次和趨勢值對比的修勻比率;第三,將各年同一“周”的修勻比率加以平均,得到各年同“周”的平均修勻比率(實際季節指數);第四,用修正系數進行修正,得到各“周”最終的季節指數St。修正系數=52/實際季節指數之和×100,季節指數St=修正系數×St'。

②ARIMA模型的構建

建模過程包括序列平穩化、模型識別、模型參數估計、模型預測和評價4個階段。其中,序列平穩性的判斷采用單位根(ADF)檢驗;p、q值的選擇,一般采取信息準則方法,本研究結合Akaike信息準則(AIC)、Schwartz貝葉斯準則(SBC)和殘差平方和評價擬合優度;模型參數顯著性假設采用t檢驗;模型適應性檢驗采用Ljung-Box Q檢驗并結合殘差自相關圖,判斷殘差序列是否為白噪聲序列。

③基于ARIMA和季節指數的時間序列分解模型

將季節指數St與剔除季節變動因素后的時間序列預測模型Yt'相乘,即得到關于原始時間序列的預測模型,即Yt=Yt'×St。

2.3 統計分析

采用Excel 2016、SPSS 22.0和Eviews 10.0軟件進行統計分析。以雙側檢驗P<0.05認為差異具有統計學意義。

3 結果

3.1 原始門診量時序特征

2015-2017年,山東省2型糖尿病患者門診人次分別為2 312 152、2 884 433、3 221 354,隨時間呈現不斷上漲趨勢,年均增長率為18.22%。每年2型糖尿病就診人次呈現一定的季節性特征,1-2月份呈現低谷,從2月份開始增長,3-11月小幅度波動,11-12月份又有一定幅度的增高。此外,門診人次也受到節假日效應的影響,春節和國慶周門診人次達到一年中最低水平。見圖1。

圖1 2015年1月-2017年12月糖尿病“周”門診人次時序圖

3.2 季節指數序列圖

實際季節指數之和為5 213.08,修正系數為99.75%,根據以上公式,計算得出最終季節指數St。由于春節和國慶節的節假日效應,圖中有兩個明顯的低谷,分別在第6周和第40周,季節指數分別為60.86%和74.01%。其后,在第9周和第41周,相繼出現兩個小高峰,季節指數達113.24%和115.31%。見圖2。

圖2 季節指數序列圖

3.3 構建時間序列分解模型

3.3.1 ARIMA模型的識別和診斷 單位根檢驗結果判斷一階差分后的序列為平穩序列(P<0.000 1)。其自相關函數圖和偏自相關函數圖見圖3。自相關函數在滯后2期以后被截斷,偏自相關函數的絕對值呈現衰減態勢,初步判斷樣本很可能服從MA(2)過程。結合Akaike信息準則(AIC)、Schwartz貝葉斯準則(SBC)和殘差平方和評價擬合優度,由低階到高階逐個試驗。其中,備選模型診斷的主要依據有:①模型參數通過t檢驗,即模型參數顯著異于零;②通過Ljung-Box Q檢驗和殘差自相關圖,確定殘差序列為白噪聲序列。最終擬合模型為ARIMA(2,1,2)。

圖3 一階差分序列自相關函數圖和偏自相關函數圖

3.3.2 ARIMA模型的參數估計和檢驗 由表1可知,模型系數均有統計學意義(P<0.05),R2=0.947。

表1 ARIMA(2,1,2)模型的參數估計

3.3.3 ARIMA模型的檢驗 圖4為模型殘差自相關圖,此模型殘差均落入95%置信區間內,初步判定模型已包含原始序列的所有特征。Ljung-BoxQ檢驗統計量為13.275,P=0.505,證明殘差為白噪聲序列。ARIMA(2,1,2)為最優模型。用公式表示為:Yt'=DYt'+Yt-1'=0.354DYt-1'-0.272DYt-2'+εt-1.579εt-1+0.706εt-2+224.451+Yt-1'

圖4 殘差自相關圖

3.3.4 包含季節變動因素的時間序列模型 2型糖尿病患者門診人次的預測模型為:

Yt=Yt'·St

=(DYt'+Yt-1' )St

=(0.354DYt-1'-0.272DYt-2'+εt-1.579εt-1+0.706εt-2+224.451+Yt-1' )St

3.3.5 模型的評價 用150-156周的門診人次回代檢驗模型的預測效果,根據預測值與實際值的相對誤差判斷模型的預測精度。模型回代顯示,預測值相對誤差的范圍為0.32%-9.71%,平均絕對百分比誤差(MAPE)為3.39%。進一步使用模型預測2018年門診人次為4 033 516,同比增長20.14%。

4 討論

4.1 ARIMA模型在門診量變化預測中的應用

ARIMA模型兼有回歸分析和移動平均的長處,是一種短期預測精度較高的方法研究,適合任何發展形態的序列,也是現代醫學統計預測最為常用的方法之一[8]。由于受到季節變動的影響,醫學領域的一些指標呈現一定的周期性和循環波動。為獲得更高的預測精度,本研究采取了時間序列分解法,將季節變動因素“暫時”剔除,用消除季節影響的時間序列建立ARIMA模型。研究結果表明,基于山東省糖尿病門診大數據而構建的ARIMA與季節指數組合模型擬合良好(R2=0.947),預測效果非常理想。

而且,本研究建立的ARIMA模型,采用的數據匯總了山東省12市醫保系統中2型糖尿病患者就診信息,樣本量大,數據來源可靠。以往基于單一醫院就診數據進行分析預測,所受影響因素眾多,波動較大,在針對某一疾病進行預測時不具有普適性,如季節性波動、長期增長趨勢、節假日效應等。本研究能較好地解決這個問題。

4.2 門診人次的預測

對門診人次進行預測,可以了解慢性病流行趨勢,為將來制訂工作計劃和合理配置衛生資源提供決策依據,提高社會效益和經濟效益。使用構建的季節組合ARIMA模型預測2018年山東省2型糖尿病門診量為4 033 516人次,同比增長20.14%;結合2017年度患者人數進一步估算年人均門診次數,結果為11.52次,相比于2017年的9.20次增長了2.32次。門診人次逐年遞增,可能的主要原因有[9]:①我國人口老齡化加劇,疾病譜發生轉變;②不健康的生活方式,包括超重或肥胖、體育運動不足、吸煙和不健康的飲食習慣,導致2型糖尿病及其相關并發癥的發生率增高;③物質生活水平的提高釋放了更多的醫療需求。

2型糖尿病患者年人均門診次數遠高于居民平均就診次數。就診不僅為患者帶來直接醫療費用經濟負擔,也會產生間接經濟負擔。因此非常有必要采取相應的政策干預,有效減少2型糖尿病的就診次數。此外,如結合2型糖尿病次均門診費用,可預測得到全省糖尿病門診直接醫療費用,為評估醫?;鹭摀峁﹨⒖?。

4.3 糖尿病門診量的季節性

每年2型糖尿病就診人次呈現一定的季節周期性和節假日效應,尤其是春節效應和國慶節假日效應。根據以往研究,寒冷的氣候可導致2型糖尿病患者糖化血紅蛋白水平升高,冬季(12-2月)也是糖尿病急性并發癥更易發生的季節[10]。然而,由于中國人最重視的傳統節日恰在每年的1-2月份,暴飲暴食、就診不及時等原因會致使患者血糖自我管理情況不佳,造成不良后果[11]。且冬季寒假期間的血糖控制不佳無法逆轉,其累積效應很有可能導致患者每年糖化血紅蛋白的升高[12],病情加重并出現并發癥。因此,建議基層醫療衛生服務中心加強在兩節之前的健康教育,提高糖尿病患者在長假期間的自我健康管理意識。

4.4 研究的局限性

ARIMA與季節指數組合模型雖有較高的擬合度和精確度,但無法回避移動節假日的影響。由糖尿病門診時序圖可知,每年糖尿病就診人次除了呈現一定的季節性特征外,還受到節假日效應的影響。此外,ARIMA模型比較適合短期預測,隨著預測期增加,標準誤差隨之增大,預測結果也會變得越不確定[13]。因此,要提高預測精度,需要通過新獲得的數值對模型進行更新或修正。

綜上,基于ARIMA與季節指數的時間序列模型對糖尿病門診人次發展變化規律的分析有較好的適應性和實用性,可以較好地擬合糖尿病門診人次并用于預測研究。另外,患者門診就診呈現顯著的季節周期性和節假日效應?;鶎有l生服務機構應采取針對性措施控制糖尿病門診醫療服務的過快增長。

利益沖突無

猜你喜歡
殘差季節門診
基于雙向GRU與殘差擬合的車輛跟馳建模
門診支付之變
基于殘差學習的自適應無人機目標跟蹤算法
我喜歡的季節7
基于遞歸殘差網絡的圖像超分辨率重建
季節蠕變
季節的變換
漢字小門診系列(四)
漢字小門診系列(九)
漢字小門診系列(八)
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合