?

一種疲勞駕駛檢測中的腦電信號通道選擇方法

2022-11-24 07:19馬玉良孫明旭張建海佘青山
中國生物醫學工程學報 2022年4期
關鍵詞:電信號識別率受試者

鄭 赟 馬玉良 孫明旭 申 濤 張建海 佘青山

1(杭州電子科技大學自動化學院,杭州 310018)

2(浙江省腦機協同智能重點實驗室,杭州 310018)

3(濟南大學自動化與電氣工程學院,濟南 250022)

4(杭州電子科技大學計算機學院,杭州 310018)

引言

疲勞是在長時間,高強度的工作條件下導致的一種生理現象,具體表現為注意力渙散、反應遲鈍、預測能力下降等,很大程度上影響了人們的日常生活,而駕駛疲勞更是交通安全面臨的重要問題之一[1]。隨著駕駛疲勞引起的交通事故的增多,全球對這一問題的關注日益增加。目前已有許多研究人員針對長時間駕駛任務中駕駛員行為和生理信息的特點提出了一些有效的疲勞駕駛檢測方法。

現有的疲勞駕駛檢測方法可以分為三大類:基于車輛的、基于行為的和基于生理特征,也有一些方法結合了3 種類型中的兩種或兩種以上的?;谛袨榈姆椒ɡ民{駛者的可見指標,如面部特征、頭部位置、注視方向等來檢測駕駛員是否疲勞。此方法主要受限于駕駛員的某些特定狀態,例如司機的頭部發生扭動等情況[2-3]。生理方法取決于人體的生理信息, 如腦電圖(electroencephalogram,EEG),心電圖(electrocardiogram,ECG),眼電圖(electro-oculogram,EOG),呼吸頻率,肌肉電信號肌電圖(electromyogram,EMG)。

在所有生理參數中,EEG 作為人腦活動的直接體現,可以快速反映出人的生理及心理變化過程,因此被廣泛地用于疾病和心理狀態的檢測研究。此外,腦電信號具有良好的時間分辨率,因而是判斷大腦活動的一個有力手段[4]。目前,國內外就基于EEG 的疲勞駕駛檢測已開展了一系列的研究:Gao 等[5]使用基于EEG 的時空卷積神經網絡對疲勞狀態進行識別,通過引入核心塊提取EEG 的時間依賴性,然后采用密集層融合空間特征,最終實現分類;付榮榮等[6]使用動態貝葉斯估計的方法進行疲勞駕駛識別研究,利用信息融合的方法動態估計疲勞駕駛狀態;王斐等[7]基于EEG 的電極-頻率分布圖,搭建深度卷積神經網絡,實現駕駛疲勞檢測方法,并且通過遷移學習方法,將使用其他數據集進行訓練得到的模型用于疲勞駕駛監測。Wang等[8]使用EOG 和EEG 進行特征融合的方法利用相關向量機(relevant vector machine,RVM)進行疲勞狀態預測。Gao 等[9]使用EEG 和相對小波熵復合網絡( relative wavelet entropy complex network,RWECN)實現對疲勞狀態的識別。這些生理學方法具有較高的準確性。

總的來說,現有利用EEG 進行疲勞駕駛檢測的方法已經取得了比較理想的結果。但這些方法仍采用32 通道或64 通道的腦電帽采集EEG 信號,過多的通道將引入較多干擾信息從而降低系統的魯棒性[10-11]。因此,需要減少冗余通道以實現更精確的疲勞檢測。目前減少冗余通道的主流方案是使用少數固定通道(4 個及其以下)的數據用于疲勞監測,這些固定通道在疲勞和正常狀態下特征差異性較大[12]。比如Zhang 等[13]使用了O1 或者O2 通道就能達到87.05 %以上的識別率;Shabani 等[14]只使用了F8 通道就能夠得到90.60 %的識別率。這類方法的優點就是:使用極少的電極簡化實驗設備,減少處理數據,大幅提升算法實時性。但是若固定通道數據采集不佳,則必然導致識別率下降,并且對于不同的設備使用同一種固定通道會造成識別率顯著降低。另外一種減少冗余通道的思路是通道選擇,通過算法篩選出最優通道,再使用最優通道的數據進行訓練與測試[15-17]。這類方法相較于上一種方法的優點是:能夠保證識別率不受不同受試者,不同時間和不同腦電采集設備的影響,在保證識別率的基礎上極大提高了算法的魯棒性。目前只有Chai 等[15]通過基于ICA 的通道選擇方法來減少冗余通道數從而提高疲勞駕駛檢測性能。據筆者所知,在疲勞駕駛檢測領域尚沒有文獻通過通道選擇的策略來固定最優通道以實現硬件的簡化和分類效果的提升。

根據上述問題,本研究提出一種用于疲勞駕駛檢測的腦電信號通道選擇算法。首先提取多種特征,再對所有通道根據不同特征計算各自的標準差等多種統計學參數,并從中獲得理想通道作為固定通道。通過模擬駕駛實驗平臺獲得疲勞駕駛實驗數據,以及疲勞駕駛的公共數據集[18],對于多個特征使用本研究提出的方法進行通道選擇,最后使用多層感知超限學習機(hierarchical extreme learning machine,H-ELM)分類器和使用粒子群算法(particle swarm optimization,PSO)優化的H-ELM 分類器用于疲勞狀態檢測任務,并將結果與使用全通道的檢測結果相比較。實驗結果表明,本研究的方法可以只使用少數通道實現對疲勞駕駛狀態的有效識別,相較于全通道的情況識別率有顯著提高,并且能夠適用于不同的腦電信號采集設備。

1 材料和方法

1.1 疲勞腦電特征提取

本研究將使用多個特征對腦電信號進行分類,分別是:5 個子頻段的功率譜,集合經驗模態分解(ensemble empirical mode decomposition,EEMD)所獲得的有限個本征模函數(intrinsic mode function,IMF)的功率譜(power spectral density,PSD),經驗模態分解(empirical mode decomposition,EMD)所獲得的有限個本征模函數的功率譜和樣本熵(sample entropy,SE)。

1.1.1 獲取EEMD-IMF 分量

EMD 是一種經典的時頻分析方法,也是一種自適應的時頻局部化的分解方法[19-20],主要用于處理非平穩的信號,但是EMD 在分解時常常出現模態混疊的問題,這種混疊的后果會使IMF 分量不再具有原來的單一特征,從而失去了原有的物理意義。因此,Wu 等[21]提出了一種新的基于EMD 分解的改進方法,集合經驗模態分解,可以有效消除模式混疊的現象。此方法的原理如下:利用零均值白噪聲頻譜均勻分布的統計特性,在原信號中加入白噪聲,低頻分量的極點分布發生變化,這樣不同時間尺度的信號可以自動分離,從而避免模態混疊的現象,并且噪聲經過多次的平均計算后會相互抵消,使得最后平均的計算結果消除白噪聲帶來的影響。本研究使用EEMD 來得到IMF 分量,具體的將每個時段的信號進行EEMD 分解,得到前3 個IMF 分量用來提取特征。

EEMD 的主要包括如下的步驟(包含了EMD 算法[21]):

步驟1:在原始信號[x(t),t=0,1,…,N]上每一次添加不同的白噪聲n(t),滿足E[n(t)]=0,,得到新的信號x'(t)=x(t)+n(t),并且記r1,1(t)=x'(t)。

步驟2:計算出信號r1,1(t) 的所有極值點(包括極大值與極小值),使用三次樣條插值形成該信號的包絡線eupper(t) 和elower(t) 。

步驟3:計算上下包絡線的均值m1(t)

步驟4:r2,1(t)=r1,1(t)- m1(t), 然后回到步驟2。

步驟5:重復步驟2~4,直到序列內極值點的個數Ne和零點個數Nz滿足以下關系(假設重復到了第k次)。

步驟6:令IMF1(t)=rk,1(t), 這是第一個IMF分量,再令r1,2(t)=x'(t)-IMF1(t),再回到步驟2。

步驟7:重復步驟2~6 直到標準差SD(l)滿足

式中,ε表示標準差的閾值。到這一步為止,就完成了一次EMD 分解。

步驟8:回到步驟1,重復步驟1 ~7M次。再對相應IMF 分量之和取均值,得到最終的IMF 分量。

在上面的表達式中,ri,j(t) 表示了t時刻,迭代第j個IMF 分量的第i次結果。K是加入的白噪聲序列中的幅值系數,σn(t)是具有噪聲的標準偏差,它的值越小說明分解準確度越高。

1.1.2 功率譜

功率譜密度函數是一種描述信號能量的特征隨頻率變化關系的方法[22],簡稱功率譜,常用來分析腦電信號的特征,理由如下:根據前人的研究,腦電信號可以分為以下幾種子頻段[23]:δ(0.1 ~4 Hz),θ(4~8 Hz),α(8 ~13 Hz),β(13 ~36 Hz)和γ(36~44 Hz)。在疲勞和正常這兩種狀態下,不同頻段的幅值具有明顯的差異,因此已經有許多研究將這5 個子頻段的信息作為特征[13-14,24]。在對腦電信號進行預處理之后,因為PSD 能表明腦電信號的頻率分布,所以本研究選取PSD 作為特征。得到5個子頻段PSD 的方法如下所述:對5 個子頻段的信號分別進行短時離散傅里葉變換后,計算功率譜,將原始信號轉化為PSD 特征向量。

在我們之前的研究中,發現在疲勞和正常這兩種狀態下,通過EEMD 得到的IMF 分量的PSD 也具有明顯的差異,因此本研究也采用了EEMD-IMFPSD 特征。計算EEMD-IMF-PSD 的方法為: 對EEMD 分解后的每個IMF 分量分別進行短時離散傅里葉變換后,計算功率譜,將每個IMF 分量轉化為PSD 特征向量。

1.1.3 樣本熵

樣本熵特征通過度量信號中產生新模式的概率大小來衡量時間序列復雜性,新模式產生的概率越大,序列的復雜性就越大。樣本熵的值越小,序列自我相似性就越高;樣本熵的值越大,樣本序列就越復雜。目前樣本熵在評估生理時間序列(EEG,sEMG 等)的復雜性和診斷病理狀態等方面均有應用[25]。在EEG 信號中,正常和疲勞這兩種狀態的差異性之所以能夠通過樣本熵特征反映的理由如下:當受試者處于正常狀態的時候,序列復雜程度高,因此樣本熵的值大;當受試者處于疲勞狀態的時候,序列的自我相似性高,因此樣本熵的值小。由于這個特性,本研究將選擇樣本熵作為輔助特征,設置m =2,r=0.25std(m和r是計算樣本熵的兩個參數,std 是序列的標準差)。本研究SE 特征的具體計算方法如下:對EEMD 分解后的每個IMF分量分別計算樣本熵,將每個IMF 分量轉化為SE特征向量。

1.2 通道選擇

由于采集到的腦電信號存在大量噪聲和冗余信息,若將數據直接輸入神經網絡進行訓練,那么得到的識別率必然較低,因此需要通道選擇算法篩選有效信息。之前研究所使用的固定通道,難以從生理的角度來解釋這些通道是否為針對疲勞駕駛檢測的最優通道,僅僅在單次實驗中提升識別率并不能說明算法在普遍情況下的有效性。因此本課題旨在研究一種具有普遍性的通道選擇方法。首先直觀闡明了通道數據好壞與否的根本原因,從1.1.2 節得知,PSD 在不同頻段的幅值在疲勞和正常狀態下具有顯著差異。本研究通過EEMD 分解的IMF 分量再計算PSD,發現不同的受試者總是會有一些差異很明顯的通道,如圖1 所示。圖1 中樣本總數為240,每個樣本代表第一個數據集中受試者3 在Fp2 通道每一個時段的EEMD-IMF-PSD 值,樣本1~120 對應正常狀態,樣本121~240 對應疲勞狀態。從圖1 中可以看到,受試者3 在Fp2 通道所反映的疲勞和正常狀態的差異顯著。本研究將這類在兩種狀態差異顯著的通道,稱為理想通道。對于兩分類任務而言,使用理想通道的數據作為輸入將得到很好的分類效果,在第2 節中將驗證該結論。

圖1 典型EEMD-IMF-PSD 的疲勞正常狀態差異圖Fig.1 Typical fatigue normal difference of EEMD-IMF-PSD

經過對兩個數據集,共18 位受試者的測試,發現每位受試者的EEMD-IMF-PSD 特征的理想通道數都比較多,并且通過這些通道足以實現較高的識別率。為了進一步提高算法的普適性,本研究加入了其他特征(本研究采用的是樣本熵特征)作為輔助特征。需要說明的是,經過實驗發現對于同一受試者,兩個特征重合的理想通道幾乎沒有(少于1個),這個現象說明這兩個特征具有互補性。以下從生理的角度闡述了選擇SE 特征的原因:

通過對EEMD-IMF-PSD 特征的分析,可以總結出一條規律:若一個特征在疲勞和正常兩種狀態下具有顯著差異性,那么只要找出這個特征的理想通道,就能夠實現很好的分類效果。

因此本研究使用樣本熵作為輔助特征,其物理意義是度量時間序列的復雜性描述,序列自我相似性越高,那么樣本熵的值越低。對應到疲勞腦電信號,正常狀態下序列的復雜度較高,樣本熵較大,疲勞狀態下序列的復雜度較低,樣本熵較小。圖2 是一個樣本熵的理想通道的例子。圖2 中樣本總數為60,每一個樣本代表了第二個數據集中受試者3 在FT7 通道在每一個時段的SE 值,其中樣本1 ~30 對應正常狀態,樣本31~60 對應疲勞狀態。

圖2 典型SE 的疲勞正常狀態差異圖Fig.2 Typical fatigue normal difference of SE

至此,能觀察到上述兩種特征在疲勞和正常狀態的差異性,但是還需要將差異程度量化,根據量化指標自動篩選通道。以下是兩條量化準則:

準則1:疲勞和正常狀態下序列的標準差的比值Cstd:可以看到在理想通道中,兩種狀態標準差的比值比較小,然而在非理想通道,兩種狀態序列的標準差的差異并不明顯,得到兩種狀態的標準差的比值Cstd,再選定閾值進行判斷,公式如下:

式中,σfati是疲勞狀態的標準差,Nfati是疲勞狀態的樣本數,在本研究中是120(數據集1)或者60(數據集2);σwake是正常狀態的標準差,Nwake是正常狀態的樣本數,在本研究中是120(數據集1)或者60(數據集2)。

準則2:疲勞和正常狀態下特征值面積的比值Carea:對比理想通道和非理想通道,Carea的值具有顯著的差異,并且因此將其作為判斷理想通道的準則,公式如下:

式中,Afati是疲勞狀態的特征值面積;Awake是正常狀態的特征值面積。

1.3 分類器

采用兩種分類器進行分類:

1)H-ELM。Huang 等[26]在2004年提出了超限學習機(extreme learning machine,ELM)方法,它在訓練過程中無需調整的隱含層偏差,這個偏差是隨機賦值的,并且其唯一的最優解也僅需通過簡單設定隱含層神經元個數即可。但是在面臨高噪聲的數據時ELM 表現較差,這是由于ELM 算法簡陋的單隱層網絡結構所造成。因此提出了H-ELM 等方法,使用多層網絡結構的ELM。H-ELM 算法構造一個自編碼函數,以編碼及解碼的形式來學習并表示原始輸入信號,不斷減少重構誤差來達到表征原始信號的目的,提取出更好的特征。該函數的工作原理和深度學習框架中的特征提取器類似[27]。

2)PSO-H-ELM。粒子群優化算法是Eberhart等[28]在Boid 模型的基礎上于1995年提出的一種群體智能算法,源自于對鳥群捕食行為的研究。其思想是:將鳥群簡化為空間中的粒子群,群體中的粒子在每次迭代搜索的過程中,通過跟蹤群體的兩個極值:粒子本身所找到的最優解Pbest 和群體找到的最優解Gbest 來動態調整自己位置和速度。

PSO-H-ELM 算法實際上是由PSO 算法對HELM 算法中的懲罰因子S 和l2 進行優化,從而得到最優分類模型。

1.4 實驗數據及其預處理

采用兩個疲勞駕駛的數據集進行算法驗證,一是在實驗室模擬駕駛采集的數據集,二是公開數據集,以下將對兩個數據集的實驗范式進行說明。

1.4.1 模擬駕駛實驗設計

在實驗室模擬駕駛采集的數據集。通過使用駕駛模擬設備和模擬駕駛軟件組成的模擬駕駛平臺來模擬真實的駕駛過程。所采用的腦電信號采集設備為德國Brain Products 公司Brain Amp DC 放大器和相應軟件組成的EEG 信號采集與分析系統,該系統包括E-Prime 刺激軟件、ActiCAP 電極帽、Brain Amp 放大器、Brain Vision Recorder 記錄軟件和Brain Vision Professional Analyzer 分析軟件。

為了獲得不同生理狀態下的腦電圖數據,在收集腦電信號前一天要求6 名受試者分別睡4 h(疲勞狀態)或8 h(正常狀態)。6 名受試者于第2 d 20:00 進行駕駛模擬,從20:10 開始記錄腦電信號,每位受試者持續記錄60 ~100 min。分2 次采集腦電信號,共40 min。第1 次采集耗時20 min,在實驗開始后5 min 開始記錄,標簽為正常狀態;第2 次采集在受試者開始疲勞后開始采集,也持續20 min,標簽為疲勞狀態。實驗過程中,受試者被要求坐在椅子上并在駕駛模擬平臺模擬駕駛過程,期間根據國際10-20 導聯系統采用32 通道電極帽記錄腦電信號并使用brain vision recorder 記錄腦電信號,采樣率為1 000 Hz。實驗室的溫度保持在22℃,給受試者一個舒適穩定的實驗環境。

1.4.2 公共數據集

所使用的公共數據集[18]是從受控的實驗室環境中使用靜態駕駛模擬器記錄的數據集,記錄包括正常和疲勞的數據。有12 名受試者參與了這次實驗。這12 名受試者都是年輕、健康的男性,年齡在19~24 歲之間。數據記錄采用網站中報道的32 電極神經掃描數據采集裝置,腦電圖采集方案采用國際10-20 系統?;趪H10-20 系統的32 通道電極帽(包括30 個有效通道和2 個參考通道)的所有通道信號采樣率均為1 000 Hz。

1.4.3 數據預處理

首先對數據進行200 Hz 的降采樣,然后再通過0.1~50 Hz 的FIR 帶通濾波器進行濾波,以上預處理過程都通過EEGLAB 完成。對于實驗室的數據集的每名受試者,以10 s 采集的信號作為樣本構建訓練樣本和測試樣本,每名受試者分別采集20 min的正常信號和20 min 的疲勞信號,因此每名受試者各自有120 組正常腦電信號樣本和120 組疲勞腦電信號樣本;對于公共數據集的每個受試者,也以10 s采集的信號作為樣本構建訓練樣本和測試樣本,每名受試者分別采集5 min 的正常信號和5 min 的疲勞信號,因此每名受試者各自有30 組正常腦電信號樣本和30 組疲勞腦電信號樣本。

2 結果

首先將比較多個特征關于全通道和理想通道的差異程度來說明選擇出的理想通道的有效性。特征分別為:5 個子頻段的PSD,EMD 分解后IMF分量的PSD(EMD-IMF-PSD),EEMD 分解后IMF 分量的PSD(EEMD-IMF-PSD)和SE,由于前3 種的理想通道大致相同,而EEMD-IMF-PSD 是這3 種特征中分類效果最好的,因此接下來只需要具體分析其中的兩種典型特征即可(EEMD-IMF-PSD 和SE)。最后將呈現所有特征關于全通道和理想通道識別率的比較結果,來說明此通道選擇方法對于不同特征都是適用的。

2.1 EEMD-IMF-PSD 的理想通道

首先通過閾值篩選,得到了EEMD-IMF-PSD特征理想通道,圖3 分別從2 個數據集中各抽取1名受試者,展示其一組典型的理想通道與非理想通道的示例,S1 ~S6 表示的是模擬駕駛的6 名受試者,S'1 ~S'12 表示的是公共數據集的12 名受試者。

圖3 2 位受試者的理想通道與非理想通道的比較圖。(a)受試者S4 的理想通道;(b)受試者S4 的非理想通道;(c)受試者S'2 的理想通道;(d)受試者S'2 的非理想通道Fig.3 Two participants' ideal channel and non-ideal channel comparison chart. (a)The representative ideal channel of S4;(b)The representative non-ideal channel of S4;(c)The representative ideal channel of S'2;(d)The representative non-ideal channel of S'2

接下來將對其中一位受試者的理想通道和非理想通道進行頻譜分析,從生理角度證明所選通道的優勢。圖4 是理想通道與非理想通道在低頻段的頻譜圖。從已有的研究可以得知,低頻段的幅值在疲勞的狀態下相較于在正常的狀態下會有提升??梢钥吹?,理想通道在低頻段的幅值,在疲勞狀態下相較于正常狀態的確有較大提升,滿足這條規律,并且差異程度相比于非理想通道大得多,從而證明使用2 個準則進行閾值篩選所得到的理想通道,從生理意義上遠好于非理想通道。

圖4 S'2 受試者的理想通道與非理想通道的頻譜分析。(a)受試者S'2 在清醒狀態下的理想通道;(b)受試者S'2 在疲勞狀態下的理想通道;(c)受試者S'2 在清醒狀態下的非理想通道;(d)受試者S'2 在疲勞狀態下的非理想通道Fig.4 S'2 subject' ideal channel and non-ideal channel spectrum analysis chart. (a)The ideal channel spectrum analysis chart under awake state;(b) The ideal channel spectrum analysis chart under fatigue state;(c) The non-ideal channel spectrum analysis chart under awake state;(d) The non-ideal channel spectrum analysis chart under fatigue state

表1 顯示了18 位受試者的EEMD-IMF-PSD 特征的部分理想通道。從表1 可以看出,可通過所提出的通道選擇算法,對于不同受試者選出理想通道(公共數據集的受試者8 除外)。并且不同受試者的理想通道不完全相同,這與受試者佩戴腦電帽的具體情況,以及腦電信號的個體差異性有關。

表1 18 位受試者EEMD-IMF-PSD 特征的部分理想通道Tab.1 18 subjects' ideal channels of EEMD-IMF-PSD

接下來將分別使用18 位受試者全通道和被選擇的理想通道的數據作為輸入,其中訓練集和測試集的比例為8 ∶2,并進行5 折交叉驗證,使用PSOH-ELM 和H-ELM 這2 種分類器測試2 種通道組合的分類結果。結果如表2 所示??梢钥吹?,相比于采用全通道的數據,采用理想通道的數據得到的識別率有顯著提高。

表2 18 位受試者使用全通道和理想通道的識別率(%,均值±標準差)Tab.2 The accuracy(%)of 18 subjects using all channel and the ideal channel(mean±std)

以上的結果說明基于EEMD-IMF-PSD 特征的通道選擇方法在跨實驗、跨被試的前提下有效,普適性強。

2.2 SE 的理想通道

首先通過提出的通道選擇方法得到18 位受試者基于SE 特征的理想通道,發現其通道數相比于EEMD-IMF-PSD 的理想通道數目要少得多:只有4位受試者存在SE 的理想通道。又從表2 得知PSOH-ELM 分類器的分類效果優于H-ELM 分類器,因此接下來將只使用PSO-H-ELM 分類器進行訓練與測試,訓練集和測試集的比例同樣為8 ∶2,并進行5折交叉驗證。表3 記錄了所有受試者中存在SE 理想通道的受試者其對應的理想通道以及分類準確率。通過表3 可以直觀的得出結論,SE 特征的理想通道不同于EEMD-IMF-PSD,是不具有普遍性的。但是又發現,對于同一受試者而言,SE 特征和EEMDIMF-PSD 特征的理想通道重合度較低,所以如果SE特征的理想通道能通過較少的個數得到很高的識別率,那么將SE 特征作為輔助特征就是有意義的。當使用PSO-H-ELM 時,SE 特征只通過1~2個通道,就能得到100 %的識別率,相比于EEMD-IMF-PSD特征,所需要的通道數更少,也因此證明了SE 特征作為輔助特征的有效性。這個結果也說明了:在一位受試者同時出現2 種特征的理想通道的情況下,SE 特征相比于EEMD-IMF-PSD 特征更加能夠反映疲勞和正常狀態的差異性,接下來將對SE 特征理想通道的數據進行具體分析,來直接的對比這種差異性。圖5 是受試者S'1 的一部分SE 理想通道與EEMD-IMF-PSD 理想通道的比較。由圖可見SE 特征在兩種狀態的差異性相比EEMD-IMF-PSD 大了不少,這也從數據的角度驗證了SE 特征相比于EEMD-IMF-PSD 特征更加能夠反映疲勞和正常狀態的差異性這個觀點。

圖5 受試者S'1 的SE 理想通道與EEMD-IMFPSD 理想通道的比較。(a)受試者S'1 的SE 理想通道;(b)受試者S'1 的EEMD-IMF-PSD 理想通道Fig.5 The SE ideal channel compared with EEMD-IMF-PSD ideal channel of the subject S'1.(a)The representative channel data of SE;(b)The representative channel data of EEMD-IMF-PSD

表3 18 位受試者中存在SE 理想通道的受試者其對應的全部理想通道及其對應識別率Tab.3 All the corresponding ideal channels and their corresponding accuracy for subjects with SE ideal channels among 18 subjects

2.3 多個特征關于全通道和理想通道的差異結果

前述已針對兩種典型的特征進行了具體的分析,說明對不同特征而言,理想通道在疲勞和正常兩種狀態下具有很大的差異性。為了說明提出的通道選擇的方法針對不同的特征的適用性,因此將對多個特征(5 頻段的PSD,EMD-IMF-PSD,EEMDIMF-PSD,SE)在全通道和理想通道的情況下進行分類,并比較在兩種情況下的識別率(采用PSO-HELM 分類器)。18 位受試者在兩種情況下的平均準確率如圖6 所示。由圖可見,對于不同的特征而言,使用提出的通道選擇方法得到的理想通道對應的識別率都高于全通道對應的識別率,這證明了所提出的通道選擇方法的有效性和普適性。其中使用SE 特征的達到的識別率最高,達到了100 %。

圖6 4 種特征在全通道與理想通道下的平均識別率。(a)在實驗室模擬駕駛的6 名受試者使用4 種特征在全通道與理想通道時;(b)公共數據集的12 名受試者使用4 種特征在全通道與理想通道時。(c)所有受試者使用4 種特征在全通道與理想通道時Fig.6 The average accuracy of four features in all channels and the ideal channels across 18 subjects. (a) 6 subjects using four features at all channels and the ideal channels in a laboratory driving simulation;(b) 12 subjects using four features at all channels and the ideal channels from public datasets;(c) All subjects using four features at all channels and the ideal channels

3 討論

由于疲勞駕駛檢測領域應用性較強,因此檢測設備簡化對該領域發展至關重要。目前簡化檢測設備的主流方案是采用固定通道的策略,如Zhang等[13]選擇O1 或O2 通道進行疲勞駕駛檢測。但基于固定通道的檢測效果在跨設備和跨實驗的前提下并不理想,因此開發出一套跨設備,跨被試,跨實驗的通道選擇算法至關重要。

本研究根據提出的通道選擇方法篩選了EEMD-IMF-PSD 和SE 特征的理想通道,發現了對于不同受試者的同一特征而言,同一套設備的理想通道分布大致相同,然后使用PSO-H-ELM 進行分類,并使用兩組數據集驗證了所提方法的性能。

圖3 是EEMD-IMF-PSD 特征的理想通道與非理想通道的示例,說明了被選通道在2 種狀態下的顯著差異性遠好于非理想通道;圖6 說明了在跨實驗和跨被試的前提下,使用所提方法得到的通道特征相較于32 通道能得到更高的準確率。以上結果說明提出的通道選擇算法能有效提高疲勞駕駛識別率。表1 顯示18 位受試者的一部分理想通道并說明基于EEMD-IMF-PSD 的理想通道是跨被試、跨實驗且普遍存在的。這說明提出的通道選擇算法的魯棒性。

從表1 可以發現同一設備下受試者的理想通道分布重復度極高。此現象說明通過固定少數的理想通道可以簡化設備,并保證疲勞駕駛檢測效果。但經過通道選擇后,沒有得到公共數據集受試者8的理想通道。因此將分析受試者8 不存在理想通道的原因,以探討基于EEMD-IMF-PSD 的理想通道是否具有普遍性。圖7 是受試者8 的通道數據典型示例及其頻譜分析。

一般受試者的理想通道應如圖3 所示:2 種狀態具有顯著差異。但受試者8 的每一個通道,都如圖7 所示:在第28 時刻的EEMD-IMF-PSD 值遠遠大于其他時刻。因此對第28 時刻(正常時刻)和其余任意一個時刻的數據做了頻譜分析。根據之前描述的生理認知,低頻段的幅值在疲勞的狀態下相較于在正常的狀態下會有提升,但如圖7(b)所示,受試者8 違背了這個規律。綜上所述,認為受試者8 的數據異常,這給出了受試者8 不存在理想通道的根本原因。因此在排除異常數據的前提下,基于EEMD-IMF-PSD 的理想通道具有普遍性。然而受試者8 使用全通道卻能夠得到100 %的識別率,筆者認為這個結果是由于兩種分類器的泛化能力較強所導致的。

圖7 S'8 受試者典型的通道數據及其頻譜分析。(a)受試者S'8 的通道數據;(b)受試者S'8 清醒狀態下在該通道的頻譜分析;(c)受試者S'8 疲勞狀態下在該通道的頻譜分析Fig.7 The representative channel data of S'8 and its spectrum analysis. (a)The representative channel data of S'8;(b)The spectrum analysis of the representative channel data under awake state;(c)The spectrum analysis of the representative channel data under fatigue state

為了進一步增加此通道選擇方法的魯棒性,采用了添加輔助特征的策略,并證明了SE 作為輔助特征的有效性。但此特征的理想通道只存在于少數受試者,是不具有普遍性的,不過此特征在2種狀態的差異性顯著,因此可以作為輔助特征使用。

總的來說,使用本研究提出的通道選擇方法能有效提升疲勞駕駛檢測效果。但是局限性也較為明顯:首先本研究只采用了2 組數據集驗證了算法的性能,這很難在統計學意義上說明算法跨設備和跨實驗的能力;其次,還有許多基于腦電的特征本研究并沒有采用,這是后續研究的一個方向;最后,本研究只是對基于所提方法的2 種特征的理想通道進行簡單的組合,但實際上根據不同特征得到的理想通道,組合的方式會對疲勞駕駛檢測性能帶來巨大的影響。本研究通過所提出的通道選擇方法,可針對不同設備得到的不同的最優固定通道,這樣的策略是具有創新性的。

4 結論

對于疲勞駕駛檢測,傳統的基于全通道EEG 信號的方法存在數據冗余和硬件設施復雜的問題。本研究提出一種基于閾值分割的通道選擇方法,用于腦電信號疲勞檢測的通道選擇。實驗結果發現經過通道選擇后,使用PSO-H-ELM 分類器,EEMDIMF-PSD 和SE 特征分類的效果最好,能夠在大幅減少通道數以及具有極佳魯棒性的同時,識別率分別達到了99.75 %和100 %,相比于全通道的分類效果具有大幅提升。而在實際應用中,只要確定了每個電極的最佳固定位置,那么理論上是一定可以得到理想通道的,所以采用此方法進行通道選擇的實用性較強,對于疲勞駕駛檢測的研究具有一定的參考價值。

猜你喜歡
電信號識別率受試者
涉及人的生物醫學研究應遵循的倫理原則
涉及人的生物醫學研究應遵循的倫理原則
基于聯合聚類分析的單通道腹部心電信號的胎心率提取
涉及人的生物醫學研究應遵循的倫理原則
基于類圖像處理與向量化的大數據腳本攻擊智能檢測
基于真耳分析的助聽器配戴者言語可懂度指數與言語識別率的關系
基于Code Composer Studio3.3完成對心電信號的去噪
涉及人的生物醫學研究應遵循的倫理原則
提升高速公路MTC二次抓拍車牌識別率方案研究
基于隨機森林的航天器電信號多分類識別方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合