?

季風轉換對深圳地區呼吸系統疾病的影響及預測研究

2024-01-09 03:10吳千鵬李興榮黃開龍蘇春芳王式功
沙漠與綠洲氣象 2023年6期
關鍵詞:深圳氣象神經網絡

吳千鵬,尹 立,李興榮,孫 羽,黃開龍,蘇春芳,王式功*

(1.成都信息工程大學大氣科學學院/環境氣象與健康研究院,四川 成都610225;2.攀枝花市中心醫院氣象醫學研究中心,四川 攀枝花617000;3.深圳市氣象局,廣東 深圳518040;4.海南省第二人民醫院氣候醫學研究中心,海南 五指山572299;5.汕頭市氣象局,廣東 汕頭515041)

呼吸系統疾病是人體最常見、多發的疾病之一,因其對天氣氣候變化有著較高的敏感度,致使人體極易患病影響健康,故又被叫做氣象敏感性疾病。隨著全球氣候變化對人類健康產生的影響進一步加劇,呼吸系統等相關氣候敏感性疾病發病率增加[1-3]。聯合國政府間氣候變化專門委員會(Intergovernmental Panel on Climate Change,IPCC)第六次評估報告指出,天氣氣候變化導致熱浪、干旱和洪水等極端氣候事件增多、天氣驟變加劇,相關氣象敏感性疾?。ê粑到y疾病等)發病率、死亡率逐年增加[4]。在氣候異常變化這一大背景下,天氣氣候因素很可能會對我國氣候敏感人群特別是老人、兒童或患有呼吸系統疾病等人群構成巨大威脅。

天氣氣候變化是誘發呼吸系統疾病的主要原因之一,即呼吸系統疾病等氣象敏感性疾病的發生發展與天氣氣候有著非常密切的關系[5-11]。在溫度、濕度、風速等氣象要素相對適宜的情況下呼吸系統疾病發病或死亡人數最少,超出舒適范圍人體均有不同程度的不良反應[11-17]。另外,大氣污染狀況及其變化也會對呼吸系統疾病的發病率及死亡率產生影響[17-21]?;跉庀蠛铜h境數據與呼吸系統疾病數據間的密切相關性,如何利用這些數據構建較優的呼吸系統疾病預測模型,為呼吸系統疾病醫療氣象服務提供一定的科學指導,非常重要。以往研究者傾向于使用回歸分析來反映氣象要素和敏感性疾病之間的關系[5,22-33],其中被廣泛使用的是多元回歸和逐步回歸??紤]到氣象環境條件變化和人體疾病發病間的非線性關系,且存在著一定的滯后效應,被最常應用的模型是廣義相加模型(GAM)和分布滯后非線性模型(DLNM)[24-31]。隨著科技的進步,機器學習廣泛應用于氣象領域,目前主要應用于氣象觀測、數值天氣預報、強對流天氣識別預警以及衛星資料應用等方面[34-38],同時也應用于對醫療就診人數的預測[9,10,45]。

深圳作為我國發展最快的一線城市,地處典型的東亞季風氣候區,在一年之中,季風在每年4 和9月轉換方向[39],季風預示著相關地區氣候狀況的大轉折,對當地工農業生產和人民群眾的日常生活產生重要影響。季風轉換會對居民健康產生何種影響?目前尚未見到國內外相關報道。因而這是非常值得研究的問題。健康氣象服務作為未來氣象服務領域拓展的重點方向之一,已將其列入2021 年11 月發布的我國氣象事業發展“十四五”規劃中,提出要建立疾病發生發展風險預測模型?;谪瀼芈鋵崌掖蠼】嫡呒皬V大民眾疾病預防的現實需求,研究構建呼吸系統疾病等氣象敏感性疾病預測模型顯得尤為迫切。開展季風轉換對呼吸系統疾病的影響研究,既是踐行國家全民大健康戰略實施的具體行動,又有重要科學價值,意義非凡。本文利用深圳地區風向風速等資料研究季風及其轉換對呼吸系統疾病的影響,基于不同季風影響期間內,下呼吸道感染疾病均對氣象和環境條件敏感性更強,利用BP 人工神經網絡和LSTM 網絡方法嘗試建立當地下呼吸道感染疾病發病風險預測模型,以期為深圳市呼吸系統疾病預防提供科學依據和技術支持,同時也可豐富季風及其轉換背景下的醫學氣象學理論內涵。

1 資料與方法

1.1 資料來源

呼吸系統疾病日就診資料來源于深圳市龍華區觀瀾中心醫院2015 年1 月1 日—2016 年12 月31日每日就診記錄,該院為深圳市三級甲等醫院,位于中心城區,具有一定的代表性。氣象數據來自中國氣象科學數據共享平臺提供的國家基準站常規氣象數據,包括氣溫、氣壓、相對濕度、水汽壓等;污染數據來自中國監測網(https://www.aqistudy.cn),包括PM2.5、PM10、CO、SO2、NO2等污染物質量濃度。

1.2 研究方法

1.2.1 相關分析

不同環境要素和當地呼吸系統疾病的就診人數之間有明確的相關性,描述變量間的相關程度,最常用的是Spearman 秩相關系數rs,本文利用Spearman相關分析環境因子與當地醫院就診人數之間的相關程度。計算方法為:

式中,rs為Spearman 秩相關系數,n 為樣本量個數,其中假定原始數據xi(環境因子)、Yi(疾病就診人數)已按時間順序進行排列,記為原數據xi、Yi在排列后數據所在位置的秩次之差

1.2.2 長短期記憶網絡(LSTM 網絡)

氣象要素對呼吸系統疾病發生的影響具有一定的滯后性[24-31,40-44],大多數氣象要素的滯后為1~3 d。LSTM 網絡(Long-Short Term Memory)由于其獨特的設計結構,適合處理和預測時間序列。

LSTM 網絡是循環神經網絡的一個變體,可以有效地解決簡單循環神經網絡(RNN)的梯度爆炸或消失問題[45-46]。這種網絡由輸入層、輸出層和之間若干層(一層或多層)隱含層構成,主要改進在2 個方面:一是引入一個新的內部狀態專門進行線性的循環信息傳遞,同時(非線性地)輸出信息給隱藏層的外部狀態。二是引入門控機制(Gating Mechanism)控制信息傳遞的路徑,總共有三個“門”:輸入門(控制當前時刻的候選狀態有多少信息需要保存)、遺忘門(控制上一個時刻的內部狀態需要遺忘多少信息)和輸出門(控制當前時刻的內部狀態有多少信息需要輸出給外部狀態)。

1.2.2.1 歸一化處理

樣本數據量綱、單位往往不同,進而會影響數據分析的結果。為消除樣本數據之間的量綱影響、消除奇異樣本數據導致的不良影響,且為滿足節點函數要求,提高網絡訓練速度和收斂性,歸一化處理公式為:

式中:xij為歸一化后的值,Xij為原始值,ximin為自變量Xi中的最小值,ximax為自變量Xi中的最大值;i、j分別為自變量序號和樣本序號。

1.2.2.2 隱藏層中的節點個數

由于學術界到目前為止沒有明確的理論規定隱藏層中的節點個數,通常情況下使用以下公式確定節點個數:

式中:m 為隱藏層節點數,n 為輸入層節點數,l 為輸出層節點數;α 為調節常數,為1~10。根據文中所選變量的個數,可以知道輸入節點為11 ,輸出節點為1,公式(3)可知隱藏節點為4~14。運用1 層LSTM模型,試驗并確定從4~14 個節點所對應的誤差率及誤差平方和,并以此來判斷模型的偏離程度。進而選取合適的隱藏層節點個數。

1.2.2.3 網絡結構

學習率設置成0.001,權重W*、U*與偏移向量b*,以上參數全部實現初始化隨機應用。為了更新權重與偏差度,需要不斷的訓練序列來實現。選用平均絕對誤差(MSE)表示所用LSTM 模型中損失函數的修正誤差,并使用Adam 優化器,促使網絡實現最優化學習。

1.2.3 試預報模型的評價

在構建呼吸系統疾病預測模型、進行預測模型優度檢驗時,主要使用平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)和預測準確度(P)等指標對預測模型的效果進行評價,其中Yi是實際值,yi是預測值,n 是樣本數,計算方法如下:

2 結果分析

2.1 呼吸系統疾病就診人數逐月與季節分布

通過整理深圳地區2015 年1 月1 日—2016 年12 月31 日呼吸系統疾病數據資料,發現每年2 月深圳地區呼吸系統疾病就診人數最少,這與春節期間深圳務工人員返鄉、外流人口較多有關聯。因此在分析深圳地區呼吸系統疾病就診人數的逐月分布時,剔除了2 月原始呼吸系統疾病數據,利用2 月前后2 個月的呼吸系統疾病數據對2 月的疾病數據進行訂正。圖1a 為訂正后2015—2016 年深圳地區呼吸系統疾病就診人數的年內逐月變化。深圳總呼吸系統疾病日均就診人數3 月最多,為288 人/d,總呼吸系統疾病日均就診人數8 月最少(187 人/d),3 月下呼吸道感染就診人數最多,6 月上呼吸道感染就診人數最多。雖然各類呼吸系統疾病就診人數呈現一定的波動性,但也有相同之處:即2—3 月總呼吸系統(ICD10 編碼J00-J99)、上呼吸道感染(簡稱“上感”,ICD10 編碼J00-J04,J06)和下呼吸道感染(簡稱“下感”,ICD10 編碼J10,J12,J15,J16 等)就診人數有明顯的增多,可能與冬季風持續影響及其累積效應有關,季節交替就診人數明顯增加,由于季節變換時氣溫、濕度等氣象條件出現突變,也可能是春節后深圳市人口增多的緣故。圖1b 中填色部分對應月(冬季1 月、秋季11 月、春季3 月)分別為遼寧北票、北京和深圳呼吸系統疾病高發月,北票和北京對呼吸系統疾病為冷效應,深圳為熱效應,2—3 月北票和北京在季風轉換前升溫快,而深圳升溫慢,回暖弱,所以北票和北京在秋、冬季呼吸系統疾病有峰值,深圳冬季風向夏季風轉換前呼吸系統疾病發病出現峰值。

圖1 深圳地區呼吸系統疾病日均就診人數和升溫率的逐月變化

深圳地處東亞季風氣候區,其風向會隨著冬季風、夏季風的控制及其轉換而變化。其中,由冬季風轉換為夏季風的過渡期一般發生在4 月,夏季風轉換為冬季風的過渡期一般發生在9 月[39]。

本文綜合2015—2016 年各月深圳平均10 min風速風向特征和各月主導風控制天數(表1)研究發現,2015—2016 年深圳地區季節轉換月分別出現在4 和9 月,其中,5—8 月主要受夏季風(偏南風)控制,10 月—次年3 月主要受冬季風(偏北風)控制。對照圖1 可看出,夏季風控制期間深圳地區總呼吸系統疾病就診人數一直減少,反映出中醫理論闡述的“春夏為陽”的養生氣候特征;相反,冬季風控制期間深圳地區總呼吸系統疾病就診人數一直在增加,反映出中醫理論中論述的“秋冬為陰”的氣候特征,此時需加強疾病預防。另外,上感與下感對季節轉換的響應略有差異。

表1 深圳地區2015—2016 年各月主導風控制天數占比

綜合圖1 和表1 可知:(1)每年9 月開始的冬季風對當地居民的冷脅迫效應會使相關人群總呼吸系統疾病發病人數波動式增加,直至次年冬季風為夏季風轉換前的3 月發病人數達到峰值。(2)每年4 月冬季風開始轉換為夏季風,整個夏季風控制期間對當地居民的溫熱效應使相關人群總呼吸系統疾病發病人數呈波動式減少態勢,直至夏季風轉換為冬季風之前的8 月發病人數達到谷值,比峰值減少35%。(3)去掉季風風向轉換月(4 和9 月),深圳地區夏季風主導期間總呼吸系統疾病日均就診人數比冬季風主導期間多7.26%。但上感與下感又有差異,其中夏季風主導期間上感日均就診人數比冬季風主導期間多22.93%,下感就診人數夏季風主導期間比冬季風主導期間少5.58%。

深圳地區3 月就診人數表現出較為明顯的階段性爆發,圖2 為2016 年3—4 月深圳地區24 h 變溫與呼吸系統疾病就診人數逐日變化。深圳地區24 h變溫與總呼吸系統疾病就診人數逐日變化關系密切,相鄰2 d 內氣溫變化趨勢相反(第一天升溫第二天降溫或第一天降溫第二天升溫)呼吸系統疾病就診人數都會增加。

圖2 2016 年3—4 月深圳地區冬季風向夏季風轉換期間24 h 變溫與呼吸系統疾病就診人數逐日變化

2.2 深圳地區呼吸系統就診人數與氣象和環境要素的相關分析

表2 列出了2015—2016 年不同季風影響期間深圳地區呼吸系統就診人數與各氣象環境因子變量之間的相關系數。氣象要素對呼吸系統疾病的發生有較為顯著的影響,整體來看,下感就診人數與氣象環境因子變量間的相關性更強。氣壓和氣溫與下感患病人數的相關性最好,水汽壓與下感患病人數相關性次之。下感就診人數與氣壓呈顯著正相關,與氣溫、水汽壓和風速呈顯著負相關。下感發病人數還與各污染物濃度呈顯著正相關。

表2 深圳地區呼吸系統發病人數與主要環境因子的Spearman 相關

2.3 深圳地區下感風險預測模型

因研究區域下感就診人數與環境氣象要素間的相關性更強,即下感發病對氣象和環境條件更敏感,且已有較多新的方法構建過上感風險預測模型[10,26],所以本文著重研究下感風險預測模型。夏季風控制期間內下感就診人數預報方程使用的氣象和環境要素為:平均氣溫、平均最高氣溫、平均最低氣溫、平均氣壓、平均最高氣壓、平均最低氣壓、水汽壓、最大風速、極大風速、PM2.5、PM10、SO2,冬季風控制期間內下感疾病就診人數預報方程使用的氣象和環境要素為:平均氣溫、平均最高氣溫、平均最低氣溫、平均氣壓、平均最高氣壓、平均最低氣壓、水汽壓、最大風速、PM2.5、PM10、SO2、NO2、CO。氣象要素對呼吸系統疾病發生的影響具有一定的滯后性[28,31-33],大多數氣象要素滯后為1~3 d,對疾病數據和氣象數據進行滑動平均處理,因空氣污染因子對呼吸系統疾病發生的影響是即時效應[15],所以未對污染數據作平滑處理。

深圳地區季風風向由冬季風(偏北風)轉為夏季風(偏南風)后,深圳地區受夏季風(偏南風)影響期間下感就診人數大體上隨時間一直減少,深圳地區季風風向夏季風(偏南風)轉為冬季風(偏北風)后,深圳地區受冬季風(偏北風)影響期間(剔除2 月的數據)的下感就診人數隨時間推移一直增多,因此本文構建下呼吸道疾病感染風險預測模型時,大致劃分為2 個時間段:夏季風影響期間(4—8 月)和冬季風影響期間(9—12 月、1 和3 月)。每年2 月呼吸系統疾病就診人數為最小值,這很可能與春節期間外來人口返鄉、加之流動人口也大幅度減少等有關,因此后續在構建預測模型時將2 月相關數據剔除,以便更好地排除其他人為因素干擾,抓取典型的自然氣候影響特征分析主要趨勢,利于提高模型的學習效果、改善其預報準確度。

2.3.1 夏季風影響期間下感風險預測模型

2.3.1.1 BP 人工神經網絡預測模型

將總樣本歸一化處理后的80%作為輸入、對應的就診人數作為輸出建立BP 神經網絡預測模型,輸入層神經元個數為12,輸出層神經元個數為1,傳遞函數選擇Purelin。隱含層為1 層,通過經驗公式和試湊法等確定隱含層神經元數目為6,傳遞函數為Logsig。深圳下感疾病就診人數的神經網絡預測模型結構為12-6-1,訓練精度為0.001。此時網絡穩定性達到最好,試預報和擬合效果也較好。經BP 神經網絡算法進行網絡學習訓練,建立下感人數與空氣污染物濃度的關系。把總樣本歸一化后剩余的20%樣本作為驗證樣本輸入到已經訓練好的網絡輸入層中,對驗證樣本進行仿真驗證。對仿真結果進行反歸一化,得到下感就診人數驗證樣本的仿真值(圖3)。對試預報結果進行統計分析,檢驗試預報方程效果:平均絕對誤差MAE 為14.72,平均絕對百分比誤差MAPE 為12.04%,均方根誤差RMSE 為21.93,預測準確率P 為87.89%。

圖3 深圳地區夏季風影響期間下感疾病就診人數的模擬值與實際值擬合曲線(BP 網絡)

2.3.1.2 LSTM 網絡(長短時記憶神經網絡)

將總樣本歸一化處理后的80%作為輸入、對應的就診人數作為輸出建立LSTM 神經網絡預測模型,夏季風期間輸入層神經元個數為12,輸出層神經元個數為1,隱含層為1 層,運用1 層LSTM 模型,試驗并確定從4~14 個節點所對應的誤差率及誤差平方和,并以此判斷模型的偏離程度,進而確定隱藏層節點個數為9。經LSTM 神經網絡算法進行網絡學習訓練,建立下感疾病就診人數與環境要素的關系。把總樣本歸一化后剩余的20%樣本作為驗證樣本輸入到已經訓練好的網絡輸入層中,對驗證樣本進行仿真驗證。對仿真結果進行反歸一化,得到下感疾病就診人數驗證樣本的仿真值(圖4)。對試預報結果進行統計分析,檢驗試預報方程效果為:平均絕對誤差MAE 為10.27,平均絕對百分比誤差MAPE 為8.47%,均方根誤差RMSE 為13.21,預測準確率P 為91.56%。

圖4 深圳地區夏季風影響期間下感疾病就診人數的模擬值與實際值擬合曲線(LSTM 網絡)

2.3.2 冬季風影響期間下感風險預測模型

2.3.2.1 BP 人工神經網絡預測模型

輸入層神經元個數為13,輸出層神經元個數為1,傳遞函數選擇Tansig。隱含層為1 層,通過經驗公式和試湊法等確定隱含層神經元數目為6,傳遞函數為Logsig。深圳下感疾病就診人數的神經網絡預測模型結構為13-6-1,訓練精度為時0.001。此時網絡達到最好,試預報和擬合效果也較好。經BP 神經網絡算法進行網絡學習訓練,建立下感人數與環境要素的關系。把總樣本歸一化后剩余的20%樣本作為驗證樣本輸入到已經訓練好的網絡輸入層中,對驗證樣本進行仿真驗證。對仿真結果進行反歸一化,得到下感就診人數驗證樣本的仿真值(圖5)。對試預報結果進行統計分析,檢驗試預報方程效果為:平均絕對誤差MAE 為20.55,平均絕對百分比誤差MAPE 為16.36%,均方根誤差RMSE 為29.84,預測準確率P 為82.33%。

圖5 深圳地區冬季風影響期間下感疾病就診人數的模擬值與實際值擬合曲線(BP 神經網絡)

2.3.2.2 LSTM 網絡(長短時記憶神經網絡)

將總樣本歸一化處理后的80%作為輸入、對應的就診人數作為輸出建立LSTM 神經網絡預測模型,輸入層神經元個數為13,輸出層神經元個數為1,隱含層為1 層,運用1 層LSTM 模型,試驗并確定從4~14 個節點所對應的誤差率及誤差平方和,并以此來判斷模型的偏離程度,進而確定隱藏層節點個數為6 個。經LSTM 神經網絡算法進行網絡學習訓練,建立下感疾病就診人數與環境要素的關系。把總樣本歸一化后剩余的20%樣本作為驗證樣本輸入到已經訓練好的網絡輸入層中,對驗證樣本進行仿真驗證。對仿真結果進行反歸一化,得到下感就診人數驗證樣本的仿真值(圖6)。對試預報結果進行統計分析,檢驗試預報方程效果為:平均絕對誤差MAE 為17.87,平均絕對百分比誤差M APE 為16.22%,均方根誤差RMSE 為24.31,預測準確率P為84.64%。

圖6 冬季風影響期間下感疾病就診人數的模擬值與實際值擬合曲線(LSTM 網絡)

深圳地區受夏季風控制期間2 種預報模型的預報結果均好于受冬季風控制時段,這與冬季風控制時氣象因子和就診人數變化幅度較大有關。

2.3.3 兩種模型的對比與評價

為客觀評價2 種模型對深圳地區下感疾病就診人數的預測能力,將兩種模型的預報效果進行比較(表3),與BP 神經網絡對比,LSTM 網絡的平均絕對誤差和平均絕對百分比誤差更小,預測準確度更高,預測模型精度略勝一籌,總體上LSTM 網絡預測模型表現更優。

表3 2 種預測模型對比

3 結論

(1)2015—2016 年深圳總呼吸系統疾病日均就診人數3 月最多(288 人/d),8 月最少(187 人/d),3月下感就診人數最多,6 月上感就診人數最多。深圳地區春、夏季為呼吸系統疾病發病高峰期;春季(特別是冬季風向夏季風轉換之前的3 月)發病人數最多,初秋時段發病人數最少。上感和下感疾病發病第一高峰期在春季,上感疾病因夏季天氣炎熱導致高發也不可忽視。

(2)每年9 月開始的冬季風對當地居民的冷脅迫效應使相關人群總呼吸系統疾病發病人數波動式增加,直至次年冬季風向夏季風轉換之前的3 月發病人數到達峰值;整個夏季風控制期間對當地居民的熱脅迫效應使相關人群總呼吸系統疾病發病人數呈波動式減少態勢,直至轉換為冬季風主導前的8月發病人數達到谷值,比峰值減少35%。深圳地區夏季風主導期間總呼吸系統疾病日均就診人數比冬季風主導期間多7.26%,但是上感與下感有差異,其中夏季風主導期間上感日均就診人數比冬季風主導期間多22.93%,下感日均就診人數在夏季風主導期間比冬季風主導時段少5.58%。已有研究表明,3 月我國北方地區城市如北京、遼寧北票氣溫回暖快,發病人數減少得快;本研究表明,深圳3 月氣溫升溫慢且在冬季風向夏季風轉換之期,當地發病人數達到峰值,之后開始下降,此現象與北方城市明顯不一樣,值得對更多南方城市呼吸系統疾病發病情況的年變化進行研究。

(3)下感與氣溫及水汽壓呈負相關關系,與氣壓呈正相關關系,與氣溫相關性最好,與氣壓、水汽壓相關性次之,還與污染要素呈顯著正相關。與BP 神經網絡模型對比,LSTM 網絡模型表現更為出色,具有更高的預測精度和泛化能力,對呼吸系統疾病就診人數預測的準確性更好,可以作為一種新的實用方法為呼吸道疾病發病風險預測提供技術支持。

猜你喜歡
深圳氣象神經網絡
氣象樹
《內蒙古氣象》征稿簡則
深圳歡樂海岸喜茶LAB店
神經網絡抑制無線通信干擾探究
大國氣象
美麗的氣象奇觀
深圳
深圳醫改破與立
基于神經網絡的拉矯機控制模型建立
復數神經網絡在基于WiFi的室內LBS應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合