?

基于PPG信號的人體熱舒適性研究

2023-11-02 12:34徐漫禁陳月明
計算機應用與軟件 2023年10期
關鍵詞:脈搏受試者準確率

楊 坤 徐漫禁 陳月明

(安徽醫科大學生物醫學工程學院 安徽 合肥 230032)

0 引 言

人體熱舒適是一種“心理狀態,表現為對熱環境的滿意度,是一種主觀評估”[1]。其既可以通過主觀意愿表達,也可以通過生命體征參數反映出來。人體在不同的熱舒適狀態下,心電、腦電、脈搏、血氧、人體表皮的電阻抗和溫度等各項生理指標會發生相應的變化[2-4]。神經系統負責調節人體的體溫,其中下丘腦扮演著“控制者”的角色。下丘腦接收到熱感受器的輸入后便開始溫度調節的進程。在寒冷環境下,人會通過顫動、加強肌肉活動來增加產熱;在炎熱條件下,人會通過血管擴張、排汗等方式降低皮膚溫度。在不同熱舒適狀態下,下丘腦的體溫調節機制是不同的。因此,通過監測生理信號變化的方法來實時預測人的熱舒適狀態是可行的[5-6]。

目前國內針對人體熱舒適性的研究還比較少,把人體熱舒適狀態與環境溫度聯系到一起是一種普遍的做法,即通過監測室內溫度來制定溫度調控策略[7-8]。根據此方法制定的溫度調控策略往往存在一定的弊端,并不能根據人體真正的熱舒適需求來制定溫度調控策略。事實上,人在不同季節,每天的不同時刻以及不同情境對于熱舒適性的需求都是不同的,并且性別、年齡甚至穿衣方式都會對這種主觀感覺產生影響[9-10]。因此這種恒溫的調控策略并不能滿足人們個性化熱舒適需求,并且這種沒有根據人體實時的熱舒適需求變化制定的普適的溫度調控策略極易對人體造成損傷。

國外已經開始研究生命體征參數和人體的熱舒適性之間的聯系,日本青山學院大學研究分析不同溫度條件下心電信號的心率變異性,提取信號的時域、頻域、非線性等多個特征,并使用支持向量機等傳統的機器學習方法分類,能夠識別人體的熱舒適狀態,進而采取不同的溫度調節策略,提高了受試者的熱舒適體驗[11-13]。新加坡南洋理工大學有研究證明可以通過腦電信號預測人體的實時熱舒適狀態[14],通過采集不同室內溫度下受試者的腦電信號形成數據集,并且比較了不同機器學習方法在腦電信號分類的性能,實驗證明了人體不同熱舒適狀態下的腦電信號存在差異,使用熱舒適性設定的時變點來驅動空調設備能顯著降低建筑能源消耗。王夢飛等[15]通過采集高溫高濕和舒適兩種環境下光電容積脈搏波(Photo PlethysmoGraphy,PPG)信號,使用小波降噪結合殘差神經網絡這種端到端的機器學習方法,成功識別到兩種環境下人體PPG信號的差異,獲得了較高的分類準確率,進而對人體是否處于高溫高濕環境預警,證明了人體PPG信號會隨著周邊環境溫度變化而產生差異,并且這種差異是可以被神經網絡識別的。但該研究僅限于極端的環境狀況,并不適用于人們日常的生活環境。

盡管心電、腦電都被應用到人體熱舒適性檢測,并且實驗結果都做到了較高的分類準確率,但是信號的采集方式都較為復雜。心電和腦電的采集過程都會嚴重影響到使用者的日常生活和工作,因此很難在實際中投入使用。除此之外,動態心電監測過程受到干擾較多,濾波計算復雜。腦電信號極易受外界環境干擾,并不適用于日常生活中復雜的使用環境。因此使用PPG信號來分析人體的熱舒適性更加具有現實意義,PPG信號采集原理簡單、裝置緊湊并且適用于日常攜帶。相比較于心電和腦電的多通道數據,PPG信號是一維數據,信號處理的計算量會大大減少。

工作主要如下:首先設計了一套基于可編程嵌入式片上系統(PSOC)可穿戴式PPG信號采集系統;其次通過低通濾波消除PPG信號的高頻干擾,使用經驗模態分解對PPG信號重構,完成脈搏波信號的采集和預處理。然后使用門控循環單元(Gated Recurrent Unit,Inception&GRU)并行模型[16]對不同溫度條件下的PPG信號建模。最后對基于神經網絡的人體熱舒適模型進行評估。

1 PPG信號采集系統設計

為了便于用戶日常佩戴使用,必須保證采集裝置體積小、低功耗。使用SFH7050反射式脈搏血氧傳感器和PSOC5LP單片機恰好能滿足本裝置設計要求,SFH7050裝置體積僅僅為4.7 mm×2.5 mm×0.9 mm,功耗3×3.4 mW。而PSOC5LP片內成了豐富的模擬外設和數字外設,無須添加外設,因此裝置體積能夠極大地得到減小。

1) SFH7050是一款反射式脈搏血氧傳感器,其內部原理圖如圖1(a)所示,SFH7050擁有紅光、近紅外光、綠光三個發光二極管和一個光電二極管,具有靈敏度高、體積小、低功耗、響應速度快的特點,適用于可穿戴設備長時間監測。

(a) SFH7050原理圖

2) 由于血液對紅光的吸收系數范圍變化比較大,因此本系統使用紅光作為光源。光束發射經過手指中血液和肌肉會吸收而衰減,反射的光束被光電二極管接收產生電流。在一個脈搏周期內,由于動脈的脈動造成血液容量的變化,會導致光吸收量發生變化。光電二極管中電流變化的交流成分能夠反映脈搏信號。

3) PSOC5LP是一款可編程嵌入式片上系統,擁有豐富的可配置模擬和數字外設。內部集成了模數轉換器、數字濾波器和運算放大器等常用外設。通過參數配置和簡單的外部電路與引腳相連便可以實現PPG信號采集。硬件模塊設計如圖1(b)所示。電流電壓轉換和信號放大都是由內部可配置的運算放大器實現。通過內部集成的模數轉換器和數字濾波器可以完成模數轉換和低通濾波。

2 PPG信號采集與預處理

2.1 脈搏波采集方法

實驗時間2020年8月17日下午14時至17時,天氣預報溫度為32 ℃,相對濕度52%。實驗在配有空調的兩個密閉房間中進行,編號為A、B房間。兩個房間的初始溫度均設置為24 ℃,房間相對濕度均保證在52±5%??照{出風口距離受試者同等距離,確保相近的空氣流速。受試對象由8名對象(4男4女)組成,年齡段為23至26歲,衣著均為短袖。確保實驗人員在實驗前兩小時無飲酒、飲食、藥物治療等情況,并且生理狀態良好。實驗流程主要如下,實驗開始前,首先將室內環境設置到指定溫度。受試者首先進入A房間,進入房間后靜坐在椅子上3 min后開始采集數據,實驗開始時緩慢提高室內的溫度直至32 ℃,記錄受試者的熱舒適狀態由舒適狀態轉換為熱狀態變化的時間點Ts-h。完成數據采集后到室外休息5 min,確保受試者在進入每個房間的初始的熱舒適狀態是相同的。然后進入B房間,同樣靜坐在椅子上3 min后開始采集數據,實驗開始時緩慢降低室內的溫度直至18 ℃,記錄受試者的熱舒適狀態由舒適狀態轉換為冷狀態變化的時間點Ts-c。實驗時長為60 min。實驗過程如圖2所示。

(a) 數據采集

2.2 數據預處理

通過PSOC5LP模數轉換后得到的PPG信號存在很多噪聲,主要是由于運動、呼吸、背景光和工頻造成的干擾。因為運動呼吸和脈搏波的頻率均屬于低頻成分,因此使用傳統的傅里葉變換無法得到有效去除,高階濾波器才能夠實現較窄的過渡帶,計算量比較大。較寬的過渡帶會導致部分噪聲不能得到很好抑制。為了分離出PPG信號中的不同成分,使用經驗模態分解(Empirical Mode Decomposition,EMD)對脈搏波進行平穩化處理,使得真實存在的不同尺度的波動或者趨勢從高頻到低頻逐級分解開來,產生一系列具有不同特征尺度的分量。通過對每個分量的頻譜分析,選擇合適的分量可以重建降噪后的脈搏波信號。

1) 低通濾波: 脈搏波信號的頻率集中在0.4 Hz到10 Hz之間,使用截止頻率為10 Hz的2階零相位巴特沃斯低通濾波器對PPG信號進行濾波,處理后的信號如圖3(a)所示。

(a) 低通濾波后的PPG信號

2) 去除基線漂移、運動呼吸干擾: 使用EMD對PPG信號進行分解,設置步長為0.01,連續兩次迭代的處理得到結果之間的標準差取0.2到0.3之間為宜,此時可以保證IMF分量的線性和穩定性,使得IMF分量具有物理意義。EMD分解的PPG信號得到的分量如圖3(b)所示,通過對IMF分量的Hilbert譜分析,IMF1-3包含脈搏信號。其他分量為呼吸造成的干擾和運動偽跡,使用含有脈搏波的IMF分量重構脈搏波信號,得到如圖3(c)所示的脈搏波信號。IMF分量重構脈搏波信號方法如式(1)所示。

(1)

式中:s、m分別代表起始和終止分量序號;x表示EMD分量重建的脈搏信號。

3) 數據歸一化:對每一受試者的數據進行單獨歸一化,能夠保留更多的受試者信息。歸一化后PPG信號使得數據均服從高斯分布,能夠加快神經網絡模型收斂,提高模型準確率。使用Z-score方法將脈搏波號歸一化,歸一化方法如式(2)所示,歸一化后的脈搏波信號方差為1,均值為0。歸一化后的信號如圖3(d)所示。

(2)

式中:μ表示均值;σ表示標準差;x*代表歸一化后的脈搏信號。

2.3 數據集劃分

由于傳感器的遲滯和設備初始化的原因,初始采集脈搏波數據和真實數據存在較大差距,因此將每位受試者前3秒脈搏波數據舍棄。Ts-h和Ts-c是熱舒適狀態轉換點,受試者可能對熱舒適狀態模糊不清,因此,故將其前后1 min數據舍棄。每個樣本至少包含兩個以上的完整脈搏波形,而脈搏通常為60~100次/min。因此將500個采樣點作為一個樣本,時間為2.5 s。通過reshape函數將每個樣本從一維拓展為(25,20)的二維矩陣。通過滑動窗口的方法可以增加樣本數量,設置滑動步長為1 s和2 s。除此之外滑動窗口能夠實現數據增強,增加樣本中的噪聲,同時可以提高模型的魯棒性和泛化性能。去除濾波器抽頭和不合的數據后,得到有效樣本的數量為14 904組,將整個數據集打亂后劃分為訓練集和驗證集,其中:訓練集數量為11 178組,驗證集3 726組。樣本標簽使用one-hot編碼、冷環境、舒適環境、熱環境分別編碼為[1,0,0]、[0,1,0]、[0,0,1]。

3 神經網絡搭建以及訓練

3.1 神經網絡模型

為了避免特征選擇的復雜過程,使用一種端到端的監督式機器學習方法,神經網絡模型的設計需要結合數據的內在特征,脈搏波的時序特征和局部特征正是神經網絡學習的重點。Inception &GRU并行模型的主要作用是主動學習不同熱舒適狀態下脈搏波信號的特征,進而預測出受試者的熱舒適狀態。神經網絡部分模型主要包含三個部分,Inception網絡模型主要用于提取脈搏波信號的局部特征,GRU網絡層提取并保留脈搏波信號的時序特征,最后經過全連接層和Softmax得到三個類別的預測概率。通過神經網絡模型可以建立脈搏波信號和人體熱舒適性之間的映射關系,網絡模型如圖4所示。

圖4 神經網絡模型

3.2 Inception網絡

Inception是一種并行的卷積網絡,基本卷積原理如圖5所示,使用不同的卷積核提取信號的局部特征,為了提取脈搏信號不同區域的特征,Inception網絡設置了多個大小不同的卷積核,一個Inception網絡中包括多個并行大小不同卷積核和池化層。如此可以得到多個特征映射,通過拼接方式作為輸出特征的映射。為了提高計算的效率和減少參數的數量,Inception模塊在卷積之前和池化之后均加入卷積核為1的卷積層來減少特征映射的深度,除此之外還可以減少輸入特征映射之間存在的冗余信息。

圖5 卷積示意圖

3.3 GRU網絡

脈搏信號的一種有規律的時序信號,模型中引入的GRU網絡可以有效地提取和保留脈搏信號的時序特征,GRU神經元內部參數更新原理如圖6所示,相比較長短時記憶網絡而言,GRU網絡更加簡單,GRU網絡不引入額外的記憶單元,而是增加了一個更新門來控制當前狀態需要從歷史狀態中保留多少信息以及從候選狀態中接受多少信息。

圖6 GRU神經元

rt=σ(Wrxt+Urht-1+br)

(3)

zt=σ(Wzxt+Uzht-1+bz)

(4)

(5)

(6)

式中:W、U表示可訓練的參數向量;b表示偏置向量。

3.4 神經網絡參數設置

ReLU(x) = max(0,x)

(7)

優化函數:Adam優化函數是一種基于隨機估計的一階矩和二階矩的隨機梯度下降方法,該方法計算效率高,幾乎沒有存儲需求,非常適用于大規模數據訓練。

損失函數:使用交叉熵作為損失函數。在給定P的條件下,q和p越接近,H越小,p和q距離越遠,H越大。損失函數的計算公式如下:

H(p,q)=-∑p(x)logq(x)

(8)

式中:p為預測值,q為真實值。

神經網絡模型的搭建基于TensorFlow 2.4,使用Kaggle提供的免費機器學習服務器訓練模型,為了避免過擬合,Inception網絡和GRU網絡輸出之前先經過BatchNormalization層,并且在拼接網絡層后加入了一個Dropout層,將丟棄概率設置為0.4。神經網絡各模塊具體的參數如表1所示。

表1 神經網絡模型參數

3.5 訓練方法

預先設置神經網絡迭代次數為1 000,批大小設置為128。由于神經網絡的擬合能力很強,很容易出現過擬合的現象,因此使用提前停止的方法進行訓練,即使用一個和訓練集合獨立的樣本集合作為驗證集,用驗證集的期望錯誤來替代期望錯誤,當驗證集的錯誤率不再下降時,就停止迭代,自動保存該模型相關參數為最優模型。

4 模型評估

4.1 神經網絡訓練結果

神經網絡在訓練過程中,迭代次數和訓練集、驗證集的準確率和交叉熵損失值的變化如圖7(a)和圖7(b)所示。其中訓練集準確率達到99.92%,驗證集準確率達到97.26%。并行的Inception&GRU模型在訓練集和驗證集均表現出較好的分類準確性。神經網絡訓練過程中,經過約32次迭代模型開始收斂。在訓練過程,訓練集損失值為0.021 1,驗證集損失值為0.156 7。

(a) 訓練過程中準確率變化

把原始的數據平均分為8個不重復的子集,每次使用其中的7個子集作為訓練集,剩余的一個子集為驗證集。設置迭代次數為100,批大小設置為64,經過 8次訓練后,可以得到8個模型,分別計算每個模型在驗證集、訓練集和全部數據集上面的準確率均值和方差,得到如圖7(c)所示的箱線圖。K折交叉驗證在驗集上平均準確率96.71%,標準差為0.895 3。模型在訓練集、驗證集、全部數據集上均表現出較好的準確率和穩定性。

4.2 混淆矩陣分析

混淆矩陣分析能夠分析每個類別的誤分類樣本數、數量和比重。使用最佳模型對全部樣本進行預測,統計得到3個類別的真正例TP、假負例FN、假正例FP和真負例TN的樣本數。根據統計結果計算出精準率P、召回率R和F值(β=1)。由表2可知,精準率、召回率和F值都接近于1,因為可以認為神經網絡訓練的模型可以準確地識別出人體的熱舒適狀態。P、R、F值的計算方式如式(9)-式(10)所示。計算結果如表2所示。

表2 模型評估參數

(9)

(10)

(11)

4.3 模型對比

由于從數據集中劃分樣本時并未對樣本的起點或者終點有所要求,因此可以使用不同的滑動窗口大小來形成全新的樣本。具體方法如下:從數據集中任意選擇若干個起點,截取數據長度為500作為一個樣本。如此選擇10 000個樣本組成測試集。分別計算不同模型在測試集上的準確率和預測時間。

比較方法包括傳統的機器學習算法和深度學習算法,支持向量機(Support Vector Machine,SVM)和隨機森林(Random Forest,RF)是經典的機器學習算法,提取脈搏波信號的心率變異性的時域、頻域、非線性特征作為分類器的輸入,選擇的特征如表3所示。而在深度學習算法中,選擇了殘差神經網絡和雙向長短時記憶網絡作為對比。將重建后歸一化的脈搏波信號輸入殘差神經網絡(Resnet)和長短時記憶網絡(Long Short-Term Memory,LSTM)進行分類,比較結果如表4所示。

表3 脈搏波信號的特征

表4 不同模型對比

經過手動提取并選擇特征后,隨機森林取得了比較好的分類效果。即使不提取特征,依靠神經網絡主動學習數據特征,Inception&GRU并行模型也取得了最好的分類效果,比單一的LSTM準確率高4.03百分點,比Resnet準確率高5.01百分點。

為了實時預測熱舒適狀態,必須評估該模型的復雜程度,由于可穿戴設備低功耗、性能弱的特性,因此使用模型預測測試集的所需的時間來評估模型的復雜程度。

在提取特征后,RF樣本預測所需的時間最短,但R點提取和特征提取也需要一定的計算時間。在神經網絡模型中,Inception&GRU網絡預測時間和LSTM網絡預測時間相近。GRU網絡參數相對于LSTM更少,而Inception模塊相對于Resnet的卷積核數量更少,網絡更淺,因此基于Inception&GRU模型所需的時間更少?;贗nception&GRU的熱舒適模型既可以避免特征提取的繁瑣工作,在準確率和模型復雜程度上也具有一定性能優勢。

5 結 語

1) 通過經驗模態分解的方法重構有效脈搏波分量能夠有效地去除PPG信號中的基線漂移和呼吸干擾,使用預處理后的脈搏波信號作為神經網絡輸入不僅提高了模型訓練的準確率,還加快了模型收斂速度。

2) Inception&GRU并行模型能夠有效地提取脈搏波信號中局部特征和時域特征,避免了傳統機器學習繁雜的特征提取和特征選擇工作?;谏窠浘W絡的熱舒適模型在訓練集達到了99.92%的準確率,在驗證集達到了97.26%的準確率。

3) 本文的研究成果能夠為集中供熱系統和可穿戴降溫(升溫)設備提供策略支持,實時為人體提供最佳的熱舒適環境。目前對人體熱舒適的研究尚處于初始階段,對熱舒適狀態預測的精度尚不足,模型相對比較復雜,未來我們會進一步提升人體熱舒適狀態模型的結果精度并降低模型的復雜程度。

猜你喜歡
脈搏受試者準確率
涉及人的生物醫學研究應遵循的倫理原則
涉及人的生物醫學研究應遵循的倫理原則
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
2015—2017 年寧夏各天氣預報參考產品質量檢驗分析
涉及人的生物醫學研究應遵循的倫理原則
涉及人的生物醫學研究應遵循的倫理原則
用心感受狗狗的脈搏
《今日評說》評今日浙江 說時代脈搏
高速公路車牌識別標識站準確率驗證法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合