?

基于深度學習的睡眠呼吸事件檢測

2023-03-03 11:30楊倩茹李金蓮付洺宇侯鳳貞
南京曉莊學院學報 2023年6期
關鍵詞:集上氣流受試者

楊倩茹,李金蓮,付洺宇,侯鳳貞*

(1.中國藥科大學 理學院,江蘇 南京 211198;2.南京曉莊學院 環境科學學院, 江蘇 南京 211171)

睡眠是人類一種重要的生理現象。健康的睡眠有益于人體生理及心理健康[1]。睡眠呼吸暫停(Sleep Apnea, SA)是一種十分常見的睡眠呼吸疾病?;颊咚咂陂g反復發生的呼吸暫停、低通氣等事件不僅影響人們的睡眠質量,還與人體其他臟器系統的損害密切相關[2]。準確高效地檢測此類睡眠呼吸事件,對于保障人類生命健康具有重要意義。

在連續7小時的睡眠中發生30次以上呼吸暫停,或平均每小時發生低通氣超過5次,定義為SA[3]。呼吸暫停指口鼻氣流停止至少10秒[4]。低通氣指呼吸氣流降低至正常水平的30%~50%,并伴有不低于3%的血氧飽和度(SpO2)下降[5]。根據病因及多種臨床特征,SA分為中樞性(Central Sleep Apnea, CSA)、阻塞性(Obstructive Sleep Apnea, OSA)和混合性(Mixed Sleep Apnea, MSA)。OSA最為常見。臨床上對于這些異常睡眠呼吸事件的檢測是評估睡眠質量、診斷睡眠相關疾病的重要途徑。夜間多導睡眠圖(Polysomnography, PSG)是診斷睡眠障礙疾病的金標準,基于PSG的多種生理信號被廣泛用于SA的診斷[6-12]。傳統的方法主要由醫師根據不同睡眠呼吸事件對應的PSG信號特征來進行人工識別,診斷效率較低[13,14]。隨著機器學習的廣泛應用,研究人員嘗試將PSG中提取的信號特征與不同的機器學習算法相結合來構建檢測模型[15],極大提高了診斷效率。然而,這些模型均需手動選擇特征集合,涉及大量計算,耗時且泛化能力弱。

深度學習是一種基于數據的方法,它可以通過對大量數據的學習,自動提取出數據的特征,從而無需事先手動設計和選擇特征。因此,一些研究嘗試將原始的PSG信號直接輸入深度神經網絡進行訓練,通過反復訓練迭代的過程,網絡自動學習并提取最相關的特征,從而完成睡眠呼吸事件的自動檢測。Erdenebayar等[16]構建了一個3層深度置信網絡(Deep Belief Network, DBN),使用SpO2信號作為模型的輸入,來進行睡眠呼吸事件的檢測。Yeh等[17]基于一維卷積神經網絡(Convolutional Neural Network, CNN),使用PSG中的單導心電圖(Electrocardiogram, ECG)信號作為輸入,構建了SA自動檢測模型。Zhang等[18]在CNN模型的基礎上加入長短時記憶網絡(Long Short-Term Memory, LSTM)來構建OSA事件檢測模型。Hu等[19]也使用單導ECG信號作為輸入,提出了一種基于自注意力機制的混合Transformer模型,來完成對OSA事件的檢測。Liu等[20]結合CNN和Transformer構建OSA事件檢測模型,使用單導ECG信號作為輸入,對OSA事件的檢測性能提升明顯。但是,現有的這些研究大多僅使用單種睡眠信號來構建深度學習模型,很少對多種信號的組合使用進行深入探究。多項研究結果表明,相比于單信號輸入模型,基于組合信號的睡眠呼吸事件模型具有更好的檢測性能[21,22]。

且在PSG信號的選擇上,現有研究多傾向于ECG信號,然而ECG信號的采集過程較為麻煩,通常需要將電極粘貼到患者的胸部,復雜的導線與電極會對患者的舒適度和自由度產生限制,進而影響患者的正常睡眠與信號采集的質量,也不利于睡眠呼吸事件自動檢測工具的落地應用。而口鼻氣流信號通常采用口鼻氣流傳感器來監測,口鼻氣流傳感器只需放在鼻孔附近,便可檢測呼吸時的氣流量和速度變化。對于胸腹活動信號,一般使用胸腹活動傳感器來采集,只需要將傳感器固定于患者的胸腹部,便可利用電阻或壓力傳感器來測量呼吸時的胸腹運動變化。相比于ECG信號的采集,口鼻氣流及胸腹活動的采集過程更加舒適、便捷,有助于可便攜式的睡眠呼吸事件自動檢測工具的開發與應用。且有研究表示口鼻氣流、胸腹活動等生理信號更能直接表征睡眠呼吸事件[23],而目前使用這3種生理信號來檢測睡眠呼吸事件的研究還相對較少。

因此,本文較為創新地組合使用了這3種睡眠生理信號(口鼻氣流、胸部活動和腹部活動),構建了一個基于雙向長短時記憶網絡(Bidirectional Long Short-Term Memory, BiLSTM)的多輸入睡眠呼吸事件二分類模型,以提高睡眠呼吸事件的監測與診斷效果,為進一步開發SA自動篩查工具提供參考。

1 數據和方法

1.1 實驗數據

本研究使用了兩個開源數據集。其中一個是都柏林大學學院(University College Dublin,UCD)睡眠呼吸暫停數據集[24]。該數據集包含25名受試者的夜間PSG記錄,包括21名男性,4名女性。受試者沒有心血管相關疾病,無自主神經功能障礙,且沒有服用過干擾心率等生理信號的藥物。受試者年齡范圍為28~68歲,呼吸暫停低通氣指數(Apnea Hypopnea Index, AHI)范圍為1.7~90.9(24.1±20.3)。

另一個數據集是來自美國國家睡眠研究資源(National Sleep Research Resource,NSSR)的Heart Biomarker Evaluation in Apnea Treatment(HeartBEAT)數據集[25]。該數據集包含317名受試者的兩個階段的夜間PSG記錄,分別為初始階段和進行3個月相關治療之后的隨訪階段。受試者主要是患有SA并存在心血管疾病風險的人群。在該數據集中,有6名受試者信號不完整(受試者編號:700112、700131、700205、700250、700266、700288),因此本文共收集到311名受試者的信號。受試者年齡范圍為45~75歲,AHI指數范圍為7.3~65.0(26.2±8.8)。

本文對這兩個數據集中的口鼻氣流、胸部活動和腹部活動信號進行研究。UCD數據集和HeartBEAT數據集的信號采樣頻率分別為8 Hz和50 Hz。

1.2 數據預處理

將數據輸入模型前,需要進行預處理,主要是對信號的濾波和分割。睡眠期間,低頻段是檢測睡眠呼吸暫停的主要頻段,因此在提取不同部位生理信號時,使用截止頻率為0.3 Hz的低通有限脈沖響應(Finite Impulse Response, FIR)對信號進行濾波,以減少信號中的高頻噪聲。

圖1 信號裁剪示意圖

對于信號的分割,本文按照30 s一段進行劃分。在每一段中,若睡眠呼吸事件的持續時間不少于10 s,則將該段標記為睡眠呼吸事件段;否則,視為正常事件段。通常情況下,在一個完整的睡眠過程中,睡眠呼吸事件只占很少一部分。因此,睡眠呼吸事件與正常事件的比例往往很不平衡。為減少數據類別不平衡對分類模型的影響,本文對每個受試者的信號進行裁剪。裁剪過程如圖1所示,將受試者整晚睡眠中的第一個睡眠呼吸事件作為開始,最后一個睡眠呼吸事件作為結束,舍棄兩端所有的正常事件,只保留始末之間的信號用于后續分析與實驗。

按上述方法對數據集進行處理后,得到各數據集的標簽種類如表1所示。對于UCD數據集,正常事件和呼吸事件之比約為4∶1;對于HeartBEAT數據集,正常事件和呼吸事件之比約為2.6∶1。

表1 不同數據集標簽之間的數量分布

1.3 實驗方法

由于使用到的3種生理信號本質都是時間序列,本文基于能夠雙向捕捉序列數據長期依賴關系的BiLSTM,構建多輸入睡眠呼吸事件檢測模型。并設計了一個由三層BiLSTM組成的單輸入網絡模型,來探究這三種信號單獨輸入時模型的檢測性能。

1.3.1 雙向長短時記憶網絡

BiLSTM由兩個傳統的單向LSTM組成。LSTM是一種能夠捕捉長時依賴的特殊RNN結構[26]。圖2展示了LSTM的一個單元結構,稱作記憶單元。其中,水平貫穿頂部的路徑C為LSTM的主線,也就是長期記憶線(細胞狀態)。h可以看作是短期記憶(隱藏狀態),x代表事件信息,也就是輸入。LSTM在主線的基礎上添加3個“門”結構即遺忘門、輸入門和輸出門,以控制信息的流動和存儲。

遺忘門,顧名思義,就是要遺忘或丟棄一些信息。遺忘門查看ht-1(前一個單元輸出)和xt(當前輸入),接受上一個長期記憶Ct-1,并決定要保留和遺忘這個長期記憶Ct-1中的哪些信息。輸入門的作用是確定什么樣的新信息要被存放在細胞狀態中。針對遺忘門中丟棄的屬性信息,在本單元模塊找到相應的新的屬性信息,添加進去,以補充丟棄的屬性信息,得到更新的細胞狀態Ct。輸出門主要用來確定該單元需要輸出的信息。首先通過一個Sigmiod函數來去確定細胞狀態的哪部分需要輸出,然后把細胞狀態Ct通過tanh層處理,兩者相乘得到最終我們想要輸出的信息ht。

圖2 LSTM網絡結構

整個LSTM網絡就是通過將多個記憶單元和門控機制連接在時間序列上來構建的。每個時間步都會根據上一個時間步的輸入和隱藏狀態來更新細胞狀態和隱藏狀態,從而實現對時間依賴關系的建模。

BiLSTM與普通LSTM在本質上沒有區別。LSTM可以捕獲輸入數據順序的關聯性,而BiLSTM則是從數據兩個方向建立數據關聯性[27]。BiLSTM通過兩個獨立的單向LSTM分別從時間序列的兩端對數據進行讀取,并對兩個方向的輸出結果進行融合,使其不僅存儲了某一時間節點之前的序列特征信息,而且存儲了某一時間節點之后的序列特征信息。充分利用前后兩端的時間信息能更好地完成時間序列的表征。

BiLSTM的計算過程可以通過下式表示:

(1)

(2)

(3)

1.3.2 睡眠呼吸事件識別模型構建

對于兩種及以上信號的組合使用,本文構建了多輸入BiLSTM網絡,結構如圖3所示。經過FIR低通濾波后的信號先分別由兩層BiLSTM提取序列特征,隨后將這些特征合并,作為整體再輸入三層BiLSTM網絡,且在每層BiLSTM之間,加入Dropout層以降低過擬合的影響。最后,通過全連接層和softmax層輸出預測事件類別的概率。

圖3 多輸入網絡模型的結構

對于信號的單獨使用,本文構建了三層BiLSTM網絡作為檢測模型,結構如圖4所示。輸入的信號分別經過三層BiLSTM,最后由全連接層和softmax層輸出預測事件類別的概率。

圖4 單輸入網絡模型的結構

本文基于受試者對數據進行劃分,按照4∶1的比例,將數據集隨機劃分訓練集和測試集。同時,使用五折交叉驗證的方法來評價模型的泛化能力。通過網格搜索的方法選擇模型最優參數。優化器為自適應矩估計[28],損失函數為分類交叉熵。對于30 s一段的生理信號,不同的采樣頻率對應不同的采樣點數。UCD數據集采樣率為8 Hz,對應30 s一段的生理信號包含240個采樣點;HeartBEAT數據集采樣率為50 Hz,對應30 s一段的生理信號包含1500個采樣點。在輸入BiLSTM模型前,本文將輸入信號劃分成輸入維度與時間步長組成的矩陣,設定輸入步長為5,則UCD信號對應的輸入維度為48,HeartBEAT信號對應的輸入維度為300。多輸入模型提取信號特征的BiLSTM層神經元數量設定為256,合并信號特征后輸入的BiLSTM層神經元數量設定為512,Dropout層丟棄率為0.2。單輸入模型每層BiLSTM的神經元數量設定為256,Dropout層丟棄率為0.2。

本文神經網絡使用Keras(version 2.3.1)、TensorFlow (version 2.2.0)進行搭建。訓練和測試過程在一臺64 GB RAM、8 GB 1080 Ti GPU的Windows Server服務器上進行。

1.3.3 模型評價指標

對于模型性能的評估,本文分別使用了整體指標和類別指標。整體指標包括準確率(Accuracy),宏觀F1得分(F1-score,MF1),卡帕系數(Kappa,κ)以及ROC曲線下面積(Area Under Curve,AUC)。類別指標包括各個睡眠分期的精確率(Precision),靈敏度(Sensitivity)和類別F1得分。對于準確率、F1得分、精確率和靈敏度,本文通過混淆矩陣進行評價。

在混淆矩陣中,準確率是分類模型預測正確的結果占總樣本的百分比(式4)。精確率(Precision)又叫查準率,指所有被預測為正的樣本中,實際為正的樣本的概率(式5)。靈敏度又叫召回率(Recall),指實際為正的樣本中被預測為正樣本的概率(式6),該指標反映了模型預測負類樣本的能力。F1得分是精確率和靈敏度的加權調和平均(式7),能夠綜合考慮這兩個指標。

(4)

(5)

(6)

(7)

式中:TP、TN、FP和FN分別代表“真陽”、“真陰”、“假陽”和“假陰”。

2 結 果

本文組合使用PSG中的口鼻氣流(Flow,F)、胸部活動(Thoracic,T)和腹部活動(Abdominal,A)信號構建睡眠呼吸事件檢測模型,并以這三種信號單獨使用或兩兩組合使用時訓練的模型作為對比。各模型在兩個數據集上的整體性能如表2所示。各模型的評價指標為五折交叉驗證后的均值。由表中結果可知,對于不同的信號組合,同時使用三種信號構建的檢測模型具有最優性能。在UCD數據集上的準確率、卡帕系數、宏觀F1值分別達到了87.98%,0.596和79.70%;在HeartBEAT數據集上的準確率、卡帕系數、宏觀F1值分別達到了88.49%,0.759和87.94%。顯然,模型在HeartBEAT數據集上的檢測效果優于在UCD的。

表2 不同網絡模型的整體性能

為進一步了解各模型的檢測效果,本文分析了不同模型的分類性能,結果如表3所示??梢园l現,不管是對于正常事件(Normal, N)還是睡眠呼吸事件(Apnea and Hypopnea, AH)的檢測,在兩個數據集上,都是同時使用三種信號構建的模型展現了最優的分類性能。而對于睡眠呼吸事件的檢測,由HeartBEAT數據集訓練的各種模型的分類指標均遠高于UCD數據集的。同時使用三種信號在HeartBEAT數據集上構建的呼吸事件檢測模型的精確率、靈敏度和F1值分別達到了86.12%,84.92%,85.38%。

表3 不同網絡模型的類別性能

圖5是各模型分別在UCD數據集和HeartBEAT數據集上的ROC曲線。對于ROC曲線的構建,本文采用的測試集為5折交叉驗證中結果最優的一折??梢园l現,對于組合信號的使用,各模型在兩個數據集上的分類性能表現出較高的一致性。無論是在UCD數據集還是HeartBEAT數據集上,都是同時使用三個信號構建的模型取得最高AUC值。對于信號的單獨使用,在UCD數據集上,分別使用胸部活動或腹部活動構建的模型取得較高的AUC值;而在HeartBEAT數據集上,僅使用胸部活動構建的模型卻取得了最低AUC值。這可能與HeartBEAT數據集中的受試者均患有心血管疾病有關。由于受試睡眠期間的心跳運動并不規律,從而會對胸部活動信號產生一定的影響。

圖5 各模型在不同數據集預測結果繪制的ROC曲線

此外,本文還探究了不同信號在模型構建中的貢獻程度。圖6展示了在UCD數據集上,不同信號構建模型的準確率維恩圖??梢钥闯?在僅使用單個信號時,用腹部活動信號構建的模型準確率最高,為85.61%;其次是使用胸部活動信號構建的模型,準確率為84.73%;使用口鼻氣流信號構建的模型準確率為83.94%,略低于胸部活動信號構建的模型。在同時使用兩種信號時,與腹部活動組合的信號可以為模型提供較高的準確率。而由胸部活動和口鼻氣流兩個信號訓練的模型,準確率甚至低于僅用腹部活動構建的模型,該情況進一步表明腹部活動對模型的檢測性能具有較高的貢獻度。同時使用三個信號時,構建的模型準確率最高,為87.98%。

圖7展示了在HeartBEAT數據集上,不同信號構建模型的準確率維恩圖。從該圖中可發現與圖6一致的情況,即腹部信號對構建的模型做出了較大貢獻,同時使用三個信號構建的模型具有最高的準確率。單獨使用口鼻氣流信號構建的模型準確率最低,這是因為口鼻氣流信號容易受噪聲影響[29,30],因而該信號產生的貢獻十分有限。

圖6 UCD數據集不同信號構建模型準確率的維恩圖

圖7 HeartBEAT數據集不同信號構建模型準確率的維恩圖

表4統計了同樣使用UCD數據集構建分類預測模型的相關領域文獻[31-39]。這些研究構建的模型也均為二分類檢測模型??梢园l現,對于睡眠呼吸事件的檢測,多數研究傾向于使用ECG或SpO2信號來構建模型;相比基于特征工程的方法,深度學習模型通常能取得更優的檢測性能。本文提出的基于胸部活動、腹部活動以及口鼻氣流組合信號的多輸入分類模型取得了較為出色的準確率。

表4 基于UCD數據集的同類研究比較

3 討 論

睡眠作為一種重要的生理現象,關乎人類生命健康。準確高效地檢測異常睡眠呼吸事件,是評估睡眠質量、保障人體健康的重要途徑。本文基于BiLSTM構建多輸入睡眠呼吸事件檢測模型,組合使用PSG中的口鼻氣流、胸部活動和腹部活動信號作為模型的輸入,在UCD數據集和HeartBEAT數據集上進行訓練與測試。實驗結果顯示,相比于單信號輸入的模型,組合使用三種信號作為輸入的模型具有最優檢測性能,在UCD和HeartBEAT數據集上的準確率、卡帕系數、宏觀F1值分別達87.98%、0.596、79.70%和88.49%、0.759、87.94%,表明了本文構建的多輸入睡眠呼吸事件檢測模型的有效性,可為睡眠呼吸疾病領域的自動化診療提供一定參考。

在SA自動檢測領域,現有的大多數研究均傾向于采用單輸入信號來訓練模型。然而,多項研究結果表明,相比于單信號輸入模型,基于組合信號的睡眠呼吸事件模型具有更好的檢測性能[21,22],本文的實驗結果也進一步證明了這一觀點。且在PSG信號的選擇上,現有研究多傾向于單一的ECG或SpO2信號,對于更能直接表征睡眠呼吸事件的口鼻氣流、胸腹活動等生理信號卻少有研究[23]。美國睡眠醫學會也建議將胸腹活動信號作為檢測呼吸暫停的主要信號[40],本文的實驗結果也證明了此建議的合理性,胸腹活動信號在模型的構建中具有較高貢獻度,表明了將胸腹活動信號納入睡眠呼吸事件檢測中的必要性。

本文構建的多輸入模型在兩個數據集上的準確率相差不大,但是在UCD數據集上的卡帕系數和宏觀F1值卻遠低于在HeartBEAT數據集上的。這可能與UCD數據集數據不均衡有關。UCD數據集中的正常事件與呼吸事件之比為4∶1,這使得模型在UCD數據集上的表現更容易受到正常事件的影響,從而能取得較出色但具有一定誤導性的準確率。且在評估模型的真實分類性能時,在UCD數據集上進行訓練的各模型對于正常事件的檢測效果均遠優于對睡眠呼吸事件的檢測效果,進一步表明數據不均衡對實驗結果的影響。而卡帕系數和宏觀F1值則不會受此干擾,能更為真實準確地反映模型的分類性能。

4 結 論

本文關注睡眠呼吸障礙患者的睡眠狀況,采用深度學習方法構建多輸入睡眠呼吸事件檢測模型,旨在為進一步開發SA自動篩查工具提供參考。實驗結果顯示,組合使用口鼻氣流、胸部活動和腹部活動三種生理信號進行訓練的模型能取得最佳檢測性能,在UCD和HeartBEAT數據集上的準確率分別達到了87.98%和88.49%,表明了本文構建的檢測模型的有效性。此外,本文還探究了不同睡眠信號在構建睡眠呼吸事件檢測模型中的貢獻程度,進一步證實了將胸腹活動信號用于睡眠呼吸事件檢測的必要性。在將來的工作中,本文的模型還可以擴展到分類更為細致的睡眠呼吸信號中去,如分辨OSA、CSA和MSA事件,為睡眠呼吸疾病領域提供一個更加完整的自動化檢測方法。

猜你喜歡
集上氣流受試者
涉及人的生物醫學研究應遵循的倫理原則
涉及人的生物醫學研究應遵循的倫理原則
氣流的威力
涉及人的生物醫學研究應遵循的倫理原則
Cookie-Cutter集上的Gibbs測度
鏈完備偏序集上廣義向量均衡問題解映射的保序性
涉及人的生物醫學研究應遵循的倫理原則
復扇形指標集上的分布混沌
固體運載火箭變軌發動機噴管氣流分離研究
飛片下的空氣形成的“超強高速氣流刀”
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合