?

基于EMD的運動想象腦電特征提取與識別

2015-03-02 12:06楊航
軟件導刊 2015年1期
關鍵詞:經驗模態分解支持向量機特征提取

楊航

摘要:針對運動想象腦電特征的提取與識別,提出了一種采用經驗模態分解(EMD)提取腦電信號能量特征與幅值特征的分類識別方法。首先用時間窗對腦電信號進行細分;然后利用EMD方法對細分后的數據進行分解,取前三階的固有模態函數分量(IMF),提取能量和平均幅值差作為特征向量;最后,使用支持向量機對左右手運動想象進行分類識別。多次仿真試驗數據表明,分類準確度達到88.57%,證明了該方法有效、適用。

關鍵詞:經驗模態分解; 特征提??; 運動想象;支持向量機

DOIDOI:10.11907/rjdk.143770

中圖分類號:TP301

文獻標識碼:A 文章編號文章編號:16727800(2015)001004403

0 引言

腦機接口(BrainComputer Interface,BCI)技術是不依賴于腦的正常輸出通路(外周神經系統和肌肉組織),即可實現大腦與外界直接通信的一種新的人機交互方式[1]。它能為肢體殘疾患者提供與外部通信的手段,在殘疾人康復、正常人輔助控制、娛樂等領域有著廣泛應用。

特征提取是腦機接口系統中最重要的技術之一,特征提取常用的技術有FFT(fast Fourier transform)、AR(AutoRegressive)、ARR(Adaptive AutoRegressive)、ICA(Independent Component Correlation)、小波變換等。經驗模態分解 (Empirical mode decomposition,EMD)方法是Huang等人[23]提出的一種信號處理方法,該方法能根據信號本身的尺度特征對信號進行分解,獲得一系列的固有模態函數(Intrinsic Mode Function, IMF)分量,信號的非線性和非平穩特征能在各階IMF分量中顯示出來。將EMD方法應用于腦電信號的特征提取效果較好。

支持向量機(support vector machine,SVM)是在統計學理論基礎上提出的一種機器學習方法,它可以避免以往機器學習中存在的欠學習和過學習問題,在處理非線性、小樣本以及高維模式識別等方面優勢明顯[4]。因此,SVM在腦電信號特征分類領域有著廣泛的應用。

本文提出了一種采用EMD方法提取運動想象腦電信號中能量特征與幅值特征,然后利用提取的特征對運動腦電信號進行分類識別的方法。該方法對經過時間窗細分后的C3、C4兩通道信號進行EMD分解,從前三階的IMF分量中,提取每階IMF分量的能量,以及IMF分量之間的平均幅度差作為特征向量,采用支持向量機進行分類識別,識別率達到88.57%。該方法主要通過細化C3、C4通道之間的幅值差異對不同運動想象進行區分,為運動想象腦電的特征提取研究提供了新的思路。

1 實驗數據

為了客觀評價方法的有效性,本文采用BCI2003競賽中格拉茨科技大學提供的腦電數據(data set Ⅲ)[5]。實驗過程為受試者(性別:女,年齡:25歲)以放松的姿勢坐在屏幕前,根據屏幕上隨機出現的左右箭頭想象左右手運動。該實驗包含7組數據,每組數據包括40次實驗,共280次實驗均在一天內完成,每次實驗間隔幾分鐘。

整個實驗過程持續9s,前2s受試者保持安靜,在第2s時屏幕出現十字光標,并伴隨著提示音開始實驗,光標持續時間為1s。在第3s時,屏幕出現一個向左或向右的箭頭,同時,受試者根據箭頭的方向想象左右手運動,4s~9s為有效數據區間。

實驗采用AgCl電極,數據從國際標準的10~20導聯系統的C3、Cz和C4三個通道獲得,如圖1所示。其中,C3、C4電極位于大腦的初級感覺皮層運動功能區,能反映受試者在想象左右手運動時大腦狀態變化的有效信息,Cz作為參考電極。EEG信號的采樣頻率為128Hz,通過0.5~30Hz的帶通濾波器濾波。

2 特征向量獲取

2.1 EMD方法簡介

EMD分解方法處理過程非常簡單,其基本思想是:假設任何復雜信號都是由一系列幅度和相位都隨時間變化的基本模式分量構成,這種基本模式分量滿足兩個條件:①它的極點數與零點數必須相等或至多相差1個;②對任一數據點,它的極大值包絡與極小值包絡的均值為0,即由極大值構成的上包絡和極小值構成的下包絡關于時間軸局部對稱。Huang把這種基本模式分量定義為固有模態函數,即IMF。EMD分解方法就是將多分量信號內部的各階IMF分量一一篩選出來。設原始信號為s(t),具體步驟如下[67]:

圖1 電極位置及實驗時序

(1)獲取信號s(t)的極大值點集合和極小值點集合。

(2)通過3次樣條插值函數分別擬合極大值和極小值點集,得到信號的上下包絡,分別為u(t)和v(t),求得包絡線的平均曲線:

m11(t)=12[u(t)+v(t)](1)

(3)原始信號去除包絡平均值,得到h11(t),即h11(t)=s(t)-m11(t) 。

(4)用h11(t)代替原始信號s(t),重復以上3步k次,直到所得的包絡趨近于零為止,此時即可認為h1k(t)是一個IMF分量,記c1=h1k(t),r1(t)=s(t)-c1,s(t)=r1(t)。

(5) 重復以上4步,直到rn小于一個足夠小的設定值或者變成一個單調函數,EMD分解過程終止,得到s(t)的分解式如下:

s(t)=∑ni=1ci+r(2)

分解的每階IMF分量能突出原始信號中不同時間尺度的局部特征,并且是窄帶信號,從而使得瞬時頻率具有確切的物理意義。對采集的EEG信號進行EMD分解得到各階IMF分量,然后從中提取相應頻段的特征向量。

2.2 EEG特征向量提取

首先選用基于Burg算法的AR模型對去噪后的EEG信號進行功率譜密度估計,通過功率譜密度來判斷信號的能量分布范圍,以此來決定EMD分解的層數。圖2為C3通道、C4通道的EEG信號功率譜密度。從圖中可以看出,腦電信號的能量主要分布在8~11Hz和19~22Hz頻段,分別對應腦電信號中的mu節律和beta節律。

圖2 想象左右手運動的功率譜密度

為了明確各階IMF對應的頻段范圍,利用傅里葉變換計算各階IMF分量的頻譜。圖3為進行右手運動想象時,C3、C4通道前4階IMF分量的頻譜圖。

圖3 想象右手C3、C4前4階IMF分量的幅值譜

從圖3可以看出,mu節律(8~11Hz)和beta節律(19~22Hz)段信號主要分布在前3個分量中,IMF4分量中mu節律和beta節律段的信號幅度可忽略不計。此外,前3階的IMF分量包含了原始信號90%的能量,前3階的IMF分量能基本代表原始信號中的特征,故選取前3階IMF分量進行特征提取。

(1)能量特征。通過對比圖2,分別試驗左右手運動想象時C3、C4通道功率譜密度,可以明顯看出,二者在mu/beta節律頻段的能量差別較大。因此,利用C3、C4兩個通道的能量作為特征值是可行的。

實驗過程中,受試者是從第3s開始執行想象任務的,采集的數據有效時間段為4~9s。經過多次實驗測試,選取4~8s時間段內的數據進行分類準確度最高。為了進一步提高分類的準確度,利用1s的時間窗將每組數據中的4~8s段信號分成4段,對每一段進行EMD分解,并分別計算前3階IMF的能量值,計算公式如下:

El=∑ni=1[c(i)]2(3)

其中El是第l個IMF分量的能量,c(i)是該IMF分量中的第i個值,n為該IMF分量的長度。

(2)平均幅度差。對比圖3中各階IMF分量頻譜,可以看出,當進行右手運動想象時,相比于其它的IMF分量,C4中的IMF2分量幅值波動十分明顯,而對應的C3中的IMF2分量波動不大。因此,可以定義平均幅度差作為一個特征值,計算公式如下:

Fi,j=1n∑nk=1ci(k)-cj(k)(4)

其中ci表示第i個IMF分量,cj表示第j個IMF分量,n為信號的長度。本文選取IMF1、IMF2的平均幅度差和IMF2、IMF3的平均幅度差作為特征向量。

3 支持向量機

本文選取CSVC對特征向量進行分類識別。其原理如下:

(1)設已知訓練集T={(x1,y1),…,(xl,yl)}∈(X×Y)l,其中xi是樣本輸入向量,yi是樣本輸出向量,xi∈X=Rn ,yi∈Y={-1,1} ,i=1,…,l。

(2)選取合適的核函數K(x,x)和適當的參數C,構造并求解最優化問題:

minα12∑li=1∑lj=1yiyjαiαjK(xi,xj)-∑lj=1αj(5)

s.t.∑li=1yiai=0,0≤αi≤C,i=1,…,l(6)

得到最優解α*=(α*1,…,α*l)T。

(3)選取α* 的一個正分量0<α*j

b*=yi-∑li=1yiα*iK(xi,xj)(7)

(4)構造決策函數

f(x)=sgn(∑li=1α*iyiK(x,xi)+b*)(8)

在本文中,選取高斯徑向基核函數(gaussian radial basis function ,RBF)作為核函數,其表達式為:

K(x,xi)=exp(-xi-xj2/σ2)(9)

在選定核函數之后,CSVM還需要確定懲罰參數c和核參數g,其中懲罰參數c能調節分類器的置信范圍和經驗風險的比例,取折衷值能使其泛化能力最好;核參數g能反映訓練樣本數據的分布特性,確定局部領域的寬度,較大的g意味著較小的方差。懲罰參數和局部參數在很大程度上決定了CSVM的學習能力和泛化能力[8]。

本文選取粒子群優化算法(particle swarm optimization, PSO)進行參數尋優,得到最佳的懲罰因子c和核參數g,對測試樣本進行分類。

4 實驗結果分析

本文對BCI2003競賽中的data set Ⅲ數據集進行特征提取與分類。該數據集包含280組數據,取140組數據作為訓練樣本,另外140組數據作為測試樣本。提取每個通道中的4~8s數據,并用1s的時間窗把該數據分成4小段;對每小段數據進行EMD分解,取前3階IMF分量進行特征提取。單個通道中,每小段數據包含3個能量特征和2個平均幅度差特征。每個訓練樣本包括2個通道、4小段數據,共40個特征向量;用訓練樣本確定的SVM最優懲罰參數和核參數,對140個測試樣本進行分類。分類結果如表1所示。

從表1可以看出,基于EMD方法的特征提取能獲得較高的識別率。只使用能量作為特征向量的分辨正確率最低,但也達到了85%;單獨使用本文定義的平均幅度差作為特征向量的達到了87.85%的正確率;而同時將能量和平均幅度差作為特征向量進行分類,能達到88.57%的正確率,不僅接近于競賽優勝者的成績(BCI競賽中對此數據集識別準確率排名:第一名:89.29%,第二名:86.43%),而且相比其它文獻[1,4,9]中的方法正確率都要高。

5 結語

EMD方法與小波變換類似,能對非線性非平穩信號進行分解,突出原始信號中的局部特征。但與小波變換相比,EMD方法是基于自身的時間尺度進行信號分解的,具有自適應性,不需要設置基函數。EMD分解所得的IMF隨著尺度的增大頻率逐漸降低,有助于突出各腦電分量中的特征。

本文針對不同的運動想象,C3、C4兩通道的腦電信號存在一定幅值差異的特征,提出了一種利用EMD提取腦電信號能量特征與幅值特征作為特征向量進行分類的方法。該方法能對C3、C4兩通道中腦電信號進行細分比較,通過支持向量機進行分類,獲得滿意的效果,為研究運動想象腦電的特征提取提供了新的思路。

猜你喜歡
經驗模態分解支持向量機特征提取
基于Daubechies(dbN)的飛行器音頻特征提取
Bagging RCSP腦電特征提取算法
網絡被入侵后的信號檢測系統設計與優化
網絡不穩定節點的動態特征挖掘模型
HHT和HMM在血細胞信號識別中的應用
基于支持向量機的金融數據分析研究
基于MED和循環域解調的多故障特征提取
Walsh變換在滾動軸承早期故障特征提取中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合