?

基于卷積神經網絡-長短期記憶神經網絡模型利用光學體積描記術重建動脈血壓波信號*

2024-02-26 02:26吳佳澤梁昊陳明
生物化學與生物物理進展 2024年2期
關鍵詞:收縮壓波形卷積

吳佳澤 梁昊 陳明**

(1)北京中醫藥大學中醫學院,北京 102488;2)湖南中醫藥大學中醫診斷研究所,長沙 410208)

高血壓是常見的心血管疾病,其不僅會導致動脈粥樣硬化、心肌梗死、腦卒中等嚴重的心血管疾病,而且會累及眼、腦、腎等全身器官,危害極大[1]。由于高血壓形成緩慢,民眾不夠重視,導致中國高血壓知曉率、控制率普遍不高[2],因此造成了社會醫療資源的嚴重消耗,給個人和國家造成了嚴重負擔。黃錦榮等[3]研究得出,控制高血壓最有效的方法是社區防治,所以為了提高高血壓知曉率和治療率,除加強健康教育外,更需要一種方便快捷、可長期連續進行的無創血壓監測方法。

目前臨床上常用的血壓監測方法是直接血壓監測法和間歇血壓監測法[4]。相比直接血壓監測法,間歇血壓監測法無法持續監測血壓,充氣袖帶也不適用于患有“淋巴水腫”等疾病的患者,并且血壓測量值會因肢體活動或袖帶壓迫等原因受到影響;直接血壓監測法雖然可以獲得動脈血壓(arterial blood pressure,ABP)波而得以持續監測血壓,并且其測量值也被定為“金標準”,但侵入式監測方法對技法、設備和醫療專業知識要求較高,且有引發并發癥的可能,因此不適于家庭等環境,也無法大規模推廣應用?;谝陨显?,連續無創血壓監測越來越受到重視,尤其是容積脈搏波法[5],容積脈搏波可以反映測量位置處的血容量變化,這與血壓密切相關。因此,可以利用其來監測血壓,如聯合使用容積脈搏波和心電圖(electrocardiogram,ECG)信號的脈搏波傳遞時間(pulse transit time,PTT)[6]和脈搏波到達時間(pulse arrival time,PAT)[7]方法,以及基于PTT或PAT的脈搏波傳播速度(pulse wave velocity,PWV)[8]方法。雖然得到的結果令人滿意,但是PTT和PAT方法需要容積脈搏波和ECG兩種信號數據,PWV方法還需要測量體表動脈節段間的距離,這不僅增加了操作復雜性和成本,而且難以保證信號間的同步性。因此,若能利用單一容積脈搏波信號進行連續無創血壓監測,那么就會因裝置簡單、操作難度小等優勢而有諸多臨床應用價值。機器學習方法常用于該方向的研究,一些學者分別將自容積脈搏波信號中提取的特征信號[9-10]和容積脈搏波原始信號[11-12]作為模型輸入來進行連續無創血壓監測研究,其中原始信號因比特征信號包含更多信息而使模型效果較優。然而,這些研究都只聚焦于收縮壓和舒張壓,而非ABP波[13],這導致呈現的血壓信息不全面,有價值的心血管信息有所缺失。

血流動力學研究表明,ABP波相比收縮壓和舒張壓包含更多信息[14]。因此,有學者希望利用容積脈搏波重建ABP波,如此就得以方便、快捷地獲取ABP波以實現連續無創血壓監測,并借以提高高血壓診斷的準確性[15]。如Cheng等[16]構建的ABP-Net模型,雖然其重建ABP波的性能較優,但是模型輸入除容積脈搏波原始信號外,還包括其一階導數和二階導數,這顯然增加了計算復雜度;Li等[17]構建的GRNN模型不僅可以重建ABP波,還可以計算其頻域特征,這為相關研究提供了基礎,但需額外構建相應的編碼器和解碼器,且GRNN模型的空間復雜度也較高。因此,本文構建了卷積神經網絡-長短期記憶神經網絡(CNNLSTM)模型以從容積脈搏波重建ABP波,進而實現連續無創血壓監測。該模型的輸入僅為容積脈搏波原始信號,無需ECG等其他信號數據,并且也無需對其進行人工特征提??;該模型的輸出為ABP波,除可從中獲得收縮壓和舒張壓外,還可借以提高高血壓診斷的準確性。

1 光學體積描記術和ABP波

脈搏波是由心臟搏動向動脈血管和血流傳播形成的。圖1所示為光學體積描記術(photoplethysmography,PPG)、ABP波的測量及典型波形,其中PPG波是由光電傳感器檢測血管容積隨時間變化而得到的[18],光電傳感器會測量經血流吸收和反射后的衰減光,將不易測量的光信號轉換成易測量的電信號來檢測血流容積變化,ABP波是將導管直接置入動脈內測量ABP隨時間變化而得到的。

Fig.1 Measurement and typical waveforms of arterial blood pressure wave(a) and PPG(b)

從波形采集來看,PPG波的采集相對簡便,光電傳感器對靈敏度和體位的要求較低,可長時間無創采集[19],ABP波的采集較為復雜,且可能引發并發癥,多于重癥監護室內采集。從波形形態來看,PPG波相比ABP波缺失了潮波,又稱重搏前波,即FGC段。從各波段代表的生理意義來看:AB段為快速射血期,此時主動脈瓣開放,微血管的容積增大,形成上升支,因此主波波峰B為收縮壓,波谷A為舒張壓;BC段為減慢射血期,此時微血管流向周圍的血量大于流向微血管的血量,微血管的容積回縮,形成下降前支;CE段為心室舒張期,此時微血管中的血量進一步減少,形成下降后支,下降后支中出現的小波為重搏波,重搏波是由于心室擴張,主動脈瓣關閉,主動脈內血液向心室方向反流而使主動脈根部容積增大,血流沖擊主動脈瓣形成反射脈搏波并再次傳遞至微血管處形成的[20];FGC段是由主動脈根部的初始波向外周傳播時受外周因素而產生的折返波多次疊加形成的[21]。

2 模擬實驗

2.1 數據集

本文實驗使用的數據集來自無袖血壓估算數據集(cuff-less blood pressure estimation data set)[22],該數據集包含以125 Hz的頻率在不同時間采集的多位患者PPG、ABP同步信號數據。該數據集的原始數據來自重癥監護醫學信息集(medical information mart for intensive care,MIMIC)[23],該數據集作者對原始數據進行了預處理和驗證,從而得到了一個相對干凈有效的數據集,本文從中共選取263 000組PPG和ABP采樣點數據。圖2展示了該數據集正常血壓、高血壓前期、高血壓3部分的PPG與ABP同步數據,并根據Pearson相關系數計算了PPG與ABP波間的形態相關性,結果均為r>0.9,表明PPG與ABP波在形態上具有強相關性。

Fig.2 Morphological correlation between PPG and arterial blood pressure waves

2.1.1 預處理

PPG信號微弱,在采集過程中不可避免會受到工頻干擾[24]、基線漂移[25]、運動偽跡[26]等噪聲的影響,因此,數據集作者使用小波對PPG進行降噪處理[27]。首先以1 000 Hz的固定頻率對原始信號重新采樣,并使用Daubechies8(db8)小波將重采樣后的信號分解到10個分解層;然后通過歸零極低頻率(0~0.25 Hz)的分解系數以消除基線漂移,歸零極高頻率(250~500 Hz)的分解系數以消除工頻干擾和運動偽跡;接著對剩余分解系數采用Rigrsure軟閾值算法進行常規小波降噪;最終重構分解后的信號得到降噪信號。

2.1.2 數據集劃分、歸一化和滑窗

預處理后,該數據集作者剔除了部分錯誤數據并對信號進行了重新拼接,因此為避免訓練集和測試集重疊,且使模型更加泛化,本文將數據集的前80%劃分為訓練集,后20%劃分為測試集,其中選取訓練集的10%作為驗證集進行十折交叉驗證,選擇指標最佳的模型,然后用其評估測試集??紤]到奇異樣本的不良影響和模型的收斂速度,需將訓練集和測試集中PPG和血壓值歸一化至區間[0,1]。然后對其進行數據滑窗(圖3),單位時間內大致可采樣兩個PPG周期,為了充分使用序列數據,本文使用窗口步長為1,窗口長度分別為62、125、187、250、312、375采樣點的窗口對PPG進行滑窗。

Fig.3 Sliding windows with different window lengths

2.2 模型構建

2.2.1 卷積神經網絡

卷積神經網絡(convolutional neural network,CNN)是一種帶有卷積結構且能進行卷積計算的神經網絡,其由卷積層、池化層和全連接層交叉堆疊組成[28]。其特有的卷積計算核心可以根據局部相關性原理對數據進行鄰域間采樣,故經常用來進行特征提?。?9]。

2.2.2 時序神經網絡

時序神經網絡,又名循環神經網絡或遞歸神經網絡(recurrent neural networks,RNN),其能夠提取并分析數據中的序列特征且具有短期或長期記憶,是處理序列數據的首選神經網絡[30]。RNN由輸入層、隱藏層、輸出層3部分組成,隱藏層即循環層,為RNN的核心所在,RNN的輸入層接受序列數據,經隱藏層處理后輸出序列數據。經典RNN模型可以處理短期記憶問題,但無法處理長期記憶問題,因為當輸入序列較長時,會遇到梯度消失問題。長短期記憶(long short-term memory,LSTM)[31]神經網絡引入“細胞狀態”和“門控制”的概念解決了梯度消失問題,因此可以很好地處理長期記憶問題。

2.2.3 CNN-LSTM混合神經網絡

波形數據具有空間和時間兩個方面的特征,單純應用CNN會丟失波形的時間特征,單純應用RNN會丟失波形的空間特征。因此本文提出基于CNN和LSTM的混合神經網絡,其中CNN用以提取波形的空間特征,LSTM用以提取波形的時間特征。

本文實現的CNN-LSTM混合神經網絡以PPG的滑動窗口數據為輸入,以與之窗口長度對應的ABP波為輸出,輸入和輸出的維度均為(n,1)(n為窗口長度)。其模型結構(圖4)主要由2層一維卷積層(Convolution1D)、1層一維最大池化層(MaxPoo1D)、2層LSTM層、2層全連接層(Dense)組成。第一層卷積層的卷積核大小為3,數目為64,采用ReLU激活函數,其維度為(n,64)(n為窗口長度)。第二層卷積層的卷積核大小為3,數目為96,采用ReLU激活函數,其維度為(n,96)(n為窗口長度)。最大池化層的池化核大小為2,其維度為(n/2,96)(n為窗口長度)。卷積計算主要提取PPG波形的空間特征,池化層對卷積層提取的特征進行降維處理以減少神經網絡的計算量,并增強特征的不變性;池化層提取的特征向量經Flatten和RepeatVector操作后得以匹配至窗口長度,其維度為(n,n/2×96)(n為窗口長度),便于后續輸入LSTM層;LSTM層是尋找波形的空間特征在時間序列上的關系,第一層LSTM層擁用100個記憶單元,采用Tanh激活函數,其維度為(n,100)(n為窗口長度),第二層LSTM層擁用200個記憶單元,采用Tanh激活函數,其維度為(n,200)(n為窗口長度),為防止過擬合,Dropout正則化會在訓練過程中隨機“拋棄”20%的神經元;最后兩層全連接層經TimeDistributed處理后,其維度被壓為(n,1)(n為窗口長度),得以使網絡輸出,即ABP波的窗口長度匹配至網絡輸入,即經滑窗操作后的PPG。網絡訓練時,損失函數為均方誤差(mean square error,MSE),優化器為Adam,學習率為0.000 1,迭代次數為10。

Fig.4 CNN-LSTM hybrid neural network model

3 結果

圖5所示為CNN-LSTM神經網絡分別采用不同窗口長度時的ABP波重建情況,其可以直觀地表明重建ABP值的準確性及與實際ABP值的擬合情況??梢钥闯?,除圖5c,f外,其余圖中的重建ABP值和實際ABP值大致擬合,沒有出現較明顯偏差。其中,圖5b,e擬合精度較高,重建波形中的收縮壓和舒張壓基本準確,并且不同程度地放大了重搏波這一特征,表明神經網絡中的卷積計算很好地學習到了該特征。圖5e比圖5b的擬合精度要更好,體現了LSTM長期記憶的優勢。重建波形中的收縮壓與實際值略有差異,并且出現多次明顯重搏波(圖5a,d);重建波形中的重搏波擬合較為準確,但是收縮壓明顯高于實際值(圖5c);重建波形中的收縮壓明顯高于實際值,并且重搏波不明顯(圖5f),表明采用窗口長度為375的神經網絡并未很好地學習到該特征。

表1通過平均絕對誤差(mean absolute error,MAE)(公式1)和均方根誤差(root mean square error,RMSE)(公式2)評價指標展示了該神經網絡使用不同窗口長度時,重建ABP波形與實際ABP波形間的誤差情況??梢钥闯?,使用窗口長度312的神經網絡時誤差最小,MAE和RMSE分別為2.79 mmHg和4.24 mmHg,符合美國醫療器械促進協會(Association for the Advancement of Medical Instrumentation,AAMI)標準。

余弦相似度(cosine similarity),又稱余弦距離(公式3,其中A,B為n維向量),其使用n維空間中兩個n維向量之間角度的余弦值作為指標來衡量數據間的差異大小,取值范圍為[-1,1],余弦值越接近1,表明兩組數據越接近,反之則越不接近。表2所示為使用不同窗口長度時,重建動脈血壓值與實際動脈血壓值的余弦相似度,可以看出,當使用窗口長度312的神經網絡時,重建ABP值和實際ABP值間的余弦相似度最大,為0.999 61,表明兩者最接近。

Table 1 Reconstruction errors of arterial blood pressure waves in models with different window lengths

Table 2 Cosine similarity between reconstructed arterial blood pressure values and actual arterial blood pressure values when using different window lengths

Fig.5 Reconstruction of arterial blood pressure waves in models with different window lengths

Fig.6 Histogram of error distribution between reconstructed arterial blood pressure values and actual arterial blood pressure values

圖6所示為使用窗口長度312的神經網絡時,將重建ABP值與實際ABP值間的誤差值四舍五入到其最接近的整數生成的離散化誤差分布直方圖,用以直觀地顯示重建ABP值與實際ABP值間的誤差分布情況??梢钥闯?,誤差分布直方圖整體表現為“窄”而“高”,呈正態分布趨勢,其中誤差0 mmHg占比最多,誤差絕對值大于10 mmHg占比非常低,表明重建ABP值與實際ABP值整體上較為接近,擬合情況較好。

圖7所示為使用窗口長度312的神經網絡時,根據重建ABP值與實際ABP值的平均值及誤差值生成的Bland-Altman圖,其通過計算兩者的一致性界限,并以圖形方式直觀反映,可用于評價重建ABP值和實際ABP值的一致性??梢钥闯?,高密度點集中于平均線附近,大部分點也落于95%一致性區間內(即1.96個標準差范圍內),偏倚程度為-8.08~9.21 mmHg,表明重建ABP值與實際ABP值間的一致性情況良好,該模型的重建精度比較理想。

Fig.7 Bland-Altman diagram of reconstructed arterial blood pressure values and actual arterial blood pressure values

圖8所示為使用窗口長度312的神經網絡時,根據重建ABP值與實際ABP值生成的回歸圖,用以表明兩者間的一致性。其Pearson相關系數r=0.975,較接近于1,可以看出,大部分點集中于回歸線附近,兩者之間具有強線性相關性,表明重建ABP值與實際ABP值間一致性較好,整體上相關度高。

4 討論

目前基于PPG波的連續無創血壓測量研究主要分為人工特征參數分析和機器學習兩個方面,焦學軍等[32]分析了PPG波傳導時間、K值、面積、降中狹高度、重搏波高度、脈率等特征參數,并根據受試者自身特點建立特征方程來計算受試者的收縮壓與平均壓,結果表明PPG波法較其他連續無創血壓監測法有更高的測量精度。吳丹[33]研究得出,通過神經網絡建立的血壓估算模型的精度要高于線性和非線性回歸方法,并且神經網絡模型可以在無人工提取特征的情況下自動學習特征并分析關聯特征,這些特征分布得更加客觀,涵蓋的血壓信息也更加豐富,這是人工特征參數分析無法相比的。因此,基于PPG波及機器學習的連續無創血壓監測法相比其他基于動脈導管、袖帶等的血壓監測法具有諸多優勢,如非侵入式操作、測壓簡便快捷、可長期連續監測等。然而,既往研究只專注于通過PPG波獲取單一收縮壓和舒張壓,而非ABP波。李嘉瑋等[34]使用多波長光電傳感器采集PPG波以擬合Rossmax電子血壓計測量的血壓,進而分析二者相關性以預測血壓;彭莉等[35]同步采集了II導ECG和食指PPG波,使用醫用臂式電子血壓計測量的血壓作為參考值,通過建立血壓的偏最小二乘回歸模型以預測血壓;譚志堅等[36]使用的血壓數據集也只包含收縮壓和舒張壓,而非ABP波。因此,如果可以通過PPG波重建ABP波,則在獲得收縮壓和舒張壓的同時還能獲得更為豐富的循環生理信息。

綜上,本文基于CNN-LSTM混合神經網絡,利用MIMIC數據庫中的同步記錄信號數據,通過PPG波重建ABP波,進而實現連續無創血壓監測。實驗結果表明,當窗口長度為312時,該神經網絡的重建ABP波與實際ABP波擬合最佳,其MAE和RMSE最小,分別為2.79 mmHg和4.24 mmHg,余弦相似度值最大,為0.999 61。誤差分布直方圖、Bland-Altman圖和回歸圖顯示重建ABP值和實際ABP值間誤差較小,一致性和相關性情況良好。表3為本文研究與既往研究的對比。Kachuee等[27]人工提取了ECG和PPG信號波的特征參數,并通過機器學習模型AdaBoost進行血壓預測,結果收縮壓MAE為8.21 mmHg,舒張壓MAE為4.31 mmHg,均高于本文結果2.79 mmHg,表明神經網絡對波形的特征提取及擬合能力相比人工特征提取及傳統機器學習方法有較大優勢;成剛等[37]基于BP神經網絡使用PPG波特征參數預測血壓,結果為收縮壓BP神經網絡的RMSE為5.92 mmHg,舒張壓BP神經網絡的RMSE為6.11 mmHg,而本文CNNLSTM神經網絡的RMSE為4.24 mmHg,重建結果明顯優于BP神經網絡,表明CNN對波形特征的提取能力和LSTM對序列特征的提取能力均優于BP神經網絡;胡軍鋒等[38]基于CNN使用ECG與PPG同步采集數據預測血壓,結果平均脈壓MAE和RMSE分別為3.25 mmHg和4.68 mmHg,高于本文結果,表明將CNN提取的波形特征輸入LSTM會進一步提取序列特征,減小誤差值,提高準確率;李帆等[39]分別使用RNN和LSTM神經網絡對同一數據集進行訓練,結果RNN的MAE和RMSE分別為11.58 mmHg和17.03 mmHg,LSTM神經網絡的MAE和RMSE為4.05 mmHg和8.78 mmHg,表明在處理長序列數據時,LSTM神經網絡要優于RNN,同時表明本文CNN-LSTM神經網絡中的CNN較好地提取了波形特征,效果要優于單一LSTM神經網絡。關于既往使用CNN-LSTM神經網絡預測血壓的研究,Baker等[40]基于CNNLSTM神經網絡使用ECG與PPG同步采集數據預測血壓,結果MAE為3.66 mmHg,高于本文結果MAE,且其輸出為收縮壓和舒張壓,而非動脈血壓波,Mou等[11]基于CNN-LSTM神經網絡使用PPG預測血壓,其平均脈壓的MAE和RMSE分別為4.42 mmHg和6.01 mmHg,均高于本文結果,究其原因,可能是其網絡結構較簡單,僅一層32卷積核的卷積層和兩層50記憶單元的LSTM層,導致其網絡擬合能力較弱。綜上,既往對連續無創血壓監測的研究多基于PPG和ECG兩種傳感器的同步數據,對數據的采集較繁瑣,要求也較高,且結果為收縮壓和舒張壓的離散值。而本文研究只需PPG一種傳感器數據,采集簡便,且輸出結果為ABP波的連續值,可以方便、快捷地獲得完整心血管信息。Cheng等[16]的研究也明確了連續ABP波相較于單一收縮壓和舒張壓包含更多的生理病理信息,其基于FCNN構建了ABP-Net模型以從PPG信號波重建ABP波信號波,其結果MAE和RMSE分別為3.20 mmHg和4.38 mmHg,略高于本文結果,且其模型輸入除PPG外,還包括PPG的一階導數和二階導數,這無疑增加了計算成本;Li等[17]采用GRNN模型自PPG信號波重建ABP波信號,結果平均脈壓的MAE和RMSE分別為3.18 mmHg和4.50 mmHg,略高于本文結果,可能是GRNN的結構和參數較LSTM簡化所致的擬合不足,但其訓練成本也大大降低,為本文模型的優化提供了參考。

Table 3 Comparison of this study with previous studies

MIMIC數據庫的采集頻率只有125 Hz,要想獲得更加豐富的波形特征,就必須提高采集頻率。同時,為獲得更高準確率的重建結果和更加泛化的模型能力,使模型應用于生產環境,還需要更大的樣本量,以及參數量和結構更復雜的神經網絡。此外,MIMIC數據庫主要采集自重癥患者,其血壓數據較常人有所差異,因此為獲得更高準確率,樣本覆蓋范圍也需擴大。

5 結論

本文基于CNN-LSTM混合神經網絡和MIMIC Ⅱ數據集,通過PPG波重建了ABP波,重建ABP波與實際ABP波間一致性較好,在相位和振幅方面擬合度較高,符合AAMI標準,可用于連續無創血壓監測。同時,相較于收縮壓和舒張壓,ABP波蘊含更多信息,希望有助于提高高血壓診斷的準確性。

數據可用性聲明本論文的關聯數據(DOI:10.57760/sciencedb. 06337/CSTR: 31253.11.sciencedb. 06337)可在Science Data Bank數據庫(https://www.scidb.cn/)中訪問獲取。其中*.ims文件的打開軟件為Imaris,*.pzfx文件的打開軟件為Graphpad Prism。

猜你喜歡
收縮壓波形卷積
基于3D-Winograd的快速卷積算法設計及FPGA實現
對《壓力容器波形膨脹節》2018版新標準的理解及分析
從濾波器理解卷積
老年人群收縮壓與射血分數保留的心力衰竭預后的關系
基于LFM波形的靈巧干擾效能分析
基于傅里葉域卷積表示的目標跟蹤算法
健康年輕人收縮壓高會增加動脈硬化風險
強化降低收縮壓不增加卒中風險
基于ARM的任意波形電源設計
改良的心血管健康行為和因素評分與老年人短時收縮壓變異性的關系
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合