?

運動想象腦電空間濾波器選擇方法研究*

2024-01-10 08:36王棋輝莫禾勝張本鑫張紹榮
桂林航天工業學院學報 2023年4期
關鍵詞:特征選擇分類器濾波器

王棋輝 莫禾勝 張本鑫 張紹榮*

(1 桂林電子科技大學 電子工程與自動化學院,廣西 桂林 541004;2 桂林航天工業學院 電子信息與自動化學院,廣西 桂林 541004)

基于運動想象腦電信號的腦機接口(brain computer interface, BCI)系統近年來在機器人控制和醫療康復等方面得到了廣泛的應用[1]。然而,腦電信號存在信噪比低、隨機性強和非平穩性突出等特性,導致提取穩定且具有判別性的有效特征變得非常困難[2]。

共空域模式(common spatial pattern, CSP)方法是較為常用的腦電特征提取方法。CSP方法的有效性依賴于被試特異的時間窗、頻帶等因素[3],因此關于這些方面的研究工作比較多。然而,空間濾波器的選擇也對CSP方法的性能具有較大影響[4]。傳統的CSP方法可以轉化為廣義特征值問題進行求解,得到特征向量和特征值后,按照特征值的大小對特征向量進行排序,最后選擇最大和最小特征值所對應的特征向量來組成空間濾波器組。傳統CSP方法選擇空間濾波器的依據在于有效信息都是集中在極端特征值所對應的特征向量中。但是有研究工作表明,通過該方式構造的最優空間濾波器并未將最為顯著有效的特征全部提取出來[5],即存在被試個體差異,無法滿足所有被試顯著特征的提取需求。另外,空間濾波器對數的選擇也會對CSP方法的性能有所影響[6],選擇過多會造成信息冗余,選擇過少則會導致重要信息缺失,因此空間濾波器對數的選擇也較為重要。

針對空間濾波器對數的選擇問題已有一些研究工作,比如文獻[6-7]。但是針對判別空間濾波器(重要空間濾波器)的選擇問題,研究工作很少。目前,據我們了解只有文獻[5]做了相關的工作。文獻[5]提出一種基于Fisher分數(Fisher score, F-score)算法的空間濾波器選擇方法,這種數據驅動的自適應空間濾波器選擇方法,能夠有效地避免因空間濾波器次優影響顯著特征的提取。該方法的優勢主要體現在自適應選擇的特性上,即根據每個被試的不同情況選擇出特異的最優空間濾波器,而不是人工選擇統一的固定空間濾波器,有效地避免因被試差異而造成的最優空間濾波器次優問題。然而文獻[5]只做了簡單的嘗試,后續并未做進一步的研究工作。本文基于文獻[5]的數據驅動原理,分別使用三種稀疏正則化嵌入式方法和三種過濾式方法來自適應選擇最優空間濾波器,系統性地研究判別空間濾波器的選擇問題。

1 數據集介紹和預處理

1.1 數據說明

數據集1:文獻[8]公開的運動想象腦電數據集。該數據集共有15個電極通道,14個健康被試分別執行右手和腳(R和F)兩種運動想象任務。其中,訓練集和測試集分別有100(前1~5個輪次的腦電數據)和60(后6~8個輪次的腦電數據)個樣本數據。其他詳細信息參考文獻[8]。

數據集2:實驗室自采集數據集。該數據集一共采集了7個健康被試分別執行左手和右手(L和R)兩種運動想象任務的腦電數據。使用NuAmps 40導放大器進行頭皮腦電信號采集,采樣率為250 Hz。去除4個眼電電極通道和2個參考電極通道的數據,只對剩余30個電極通道的腦電數據進行數據處理和分析。數據采集的具體過程參考文獻[9]。

1.2 信號預處理

所有數據使用8~30 Hz、6階的巴特沃茲濾波器進行帶通濾波。選擇0.5~2.5 s的時間窗提取單試次數據。

2 方法

本文的算法框架如圖1所示,將方法介紹部分劃分成傳統CSP方法和本文提出的CSP改進方法,然后對兩種CSP方法的空間濾波器選擇以及顯著判別特征的提取過程分別進行詳細闡述。

圖1 本文算法框架

2.1 傳統CSP方法

CSP的目標函數可轉化為廣義特征值問題[4],如式(1):

(1)

在傳統CSP方法中,一般選擇前m個和后m個空間濾波器構成最優的空間濾波器組W′,使用W′對單試次腦電數據X進行空間投影:

Z=W′TX

(2)

然后對空間濾波信號Z使用對數方差提取特征,具體如式(3):

(3)

其中log(?)為對數運算符,var(?)為方差運算符。

由圖1和式(3)可看出,特征和空間濾波器具有一一對應的關系。本文選取2m個空間濾波器,在特征層面對應有2m個特征。通常m取值為3[10]。

2.2 本文方法

2.2.1 空間濾波器選擇過程

由于在CSP特征提取過程中,最后的特征個數與空間濾波器個數相同且一一對應,因此本文提出基于特征選擇的空間濾波器選擇方法。具體地,首先提取CSP所有空間濾波器得到的特征,然后基于特征選擇方法得到每個特征的權重,接著根據特征權重的大小對特征進行排序,最后進行特征及空間濾波器選擇。傳統CSP方法選擇3對空間濾波器,即6個空間濾波器,本文也選擇特征權重最大的6個特征所對應的空間濾波器構成空間濾波器組。接下來將介紹六種空間濾波器選擇方法。

2.2.2 空間濾波器選擇方法

如前文所述,空間濾波器選擇即是特征選擇。本文提出六種特征選擇方法獲取特征權重,分別為最小絕對值收縮和選擇算子(least absolute shrinkage and selection operator, LASSO)模型、log函數(LOG)正則化模型、帶平滑削邊絕對偏離(smoothly clipped absolute deviation penalty, SCAD)正則模型、方差(variance, VAR)、皮爾遜相關系數(Pearson correlation coefficient, PCC)和Relief。其中,LASSO模型屬于凸稀疏特征選擇方法,LOG和SCAD模型屬于非凸稀疏特征選擇方法,VAR、PCC和Relief屬于過濾式特征選擇方法。

1)LASSO

假設原始特征集合為X∈RN×P,其中N為樣本數,P為特征維數。y=(y1,y2,…,yN)T為樣本標簽,且yi∈{-1,1}。w=(w1,w2,…,wP)T為特征權重。LASSO方法的數學模型[11]如式(4):

(4)

2)LOG

LOG方法可以有效地緩解LASSO模型在特征選擇過程中出現的有偏估計問題[12]。LOG方法的數學模型[11]如式(5):

(5)

其中a為比例系數,設置為0.02,λ>0為正則化參數。詳細求解過程請參考文獻[10]。LOG模型相比LASSO模型具有更強的稀疏性和光滑性,能夠選擇出更加顯著的特征。

3)SCAD

SCAD方法與LOG方法都是一種近似無偏的稀疏特征選擇方法,相比LASSO模型具有更強的誘發稀疏性,同時可以避免出現有偏估計和特征選擇不一致問題[12],有利于選擇出更加顯著有效的特征。SCAD方法的數學模型[12]如式(6):

(6)

其中φλ,γ(?)為SCAD罰,wj表示第j個特征的權重,γ設置為3,λ>0表示正則化參數。

4)VAR

特征的方差大小能夠反映出特征的變化情況以及包含信息的多少。因此方差越大的特征表示其包含的有效信息越多,對樣本的分類預測越重要。假設原始特征集合為X=(x1,x2,…,xN)T∈RN×P,其中N為樣本數,P為特征維數,xi∈RP為原始特征集合中的第i個樣本。特征方差的計算公式如式(7):

(7)

5)PCC

PCC通過衡量特征與樣本標簽之間相關性,從而可判斷出特征的重要程度[13],其取值范圍為[-1,1]。相關系數的絕對值越大,代表該特征與樣本標簽的相關性越大,對樣本分類預測越重要。假設y=(y1,y2,…,yN)T為樣本標簽,且yi∈{-1,1}。特征與樣本標簽的相關系數計算公式如下:

(8)

其中cov(?)表示協方差運算符,xj表示所有特征樣本中的第j個特征,σ表示標準差。

6)Relief

Relief算法根據每個特征和樣本標簽之間的相關性來賦予特征權重的大小,從而衡量特征對于分類預測的重要性。計算特征權重的過程如下:首先,從訓練樣本集合中選取一個樣本xi;隨后選擇與樣本xi相同類別的k最近鄰樣本,并且計算出兩者之間的距離d1;接下來,再選取與樣本xi不同類別的k最近鄰樣本,并且計算出兩者之間的距離d2。如果d1

以上方法特征權重計算如下:對于LASSO、LOG、SCAD方法,通過10折交叉驗證得到最優模型后,對模型的權重向量w取絕對值,然后按大小進行降序排序;對于VAR方法,按特征的方差大小進行降序排序;對于PCC方法,對相關系數取絕對值后按大小進行降序排序;對于Relief方法,直接按大小進行降序排序。LASSO、LOG和SCAD方法的正則化參數備選集合為:λ∈[2-5,2-4.8,…24.8,25],LASSO方法可由SLEP工具箱實現[15]。

2.2.3 特征提取和分類

根據特征權重最大的6個特征選出6個空間濾波器構成空間濾波器組W″,之后所有單試次腦電數據使用空間濾波器組W″進行空間投影濾波,最后使用對數方差方法提取特征。

使用六種分類器驗證六種空間濾波器選擇方法的有效性,分別為支持向量機(support vector machine, SVM)、Fisher線性判別分析(Fisher linear discriminant analysis, FLDA)、貝葉斯線性判別分析(Bayesian linear discriminant analysis, BLDA)、K最近鄰(K-nearest neighbor, KNN)、樸素貝葉斯(naive Bayes, NB)和邏輯回歸(logistic regression, LR)。SVM使用LIBSVM工具箱實現[16],使用線性核函數,并且模型參數采用工具箱的默認設置;FLDA和BLDA參考文獻[10];KNN參考文獻[17];NB參考文獻[18];LR參考文獻[19]。

3 實驗結果

表1給出了數據集1在不同空間濾波器選擇方法下,使用SVM分類器的分類結果,最高分類準確率加粗顯示。從表1可以看出,LOG、SCAD和Relief方法的分類效果優于傳統CSP方法,其中LOG方法最佳。

表1 分類準確率(%)(數據集1,SVM分類器)

表2給出了數據集1在不同空間濾波器選擇方法下,使用FLDA分類器的分類結果。從表2可以看出,LOG和SCAD方法的分類效果優于傳統CSP方法,其中LOG方法最優。

表2 分類準確率(%)(數據集1,FLDA分類器)

表3給出了數據集1在不同空間濾波器選擇方法下,使用BLDA分類器的分類結果。從表3可以看出,LOG、SCAD和VAR方法的分類效果優于傳統CSP方法,其中SCAD方法的分類效果最優。

表3 分類準確率(%)(數據集1,BLDA分類器)

表4給出了數據集1在不同空間濾波器選擇方法下,使用KNN分類器的分類結果。從表4可以看出,LOG、SCAD和VAR方法的分類效果優于傳統CSP方法,其中VAR方法的分類效果最優。另外,PCC和Relief方法的平均分類準確率與傳統CSP方法相同。

表4 分類準確率(%)(數據集1,KNN分類器)

表5給出了數據集1在不同空間濾波器選擇方法下,使用NB分類器的分類結果。從表5可以看出,LASSO、LOG、SCAD和VAR方法的分類效果優于傳統CSP方法,其中VAR方法的分類效果最優。

表5 分類準確率(%)(數據集1,NB分類器)

表6給出了數據集1在不同空間濾波器選擇方法下,使用LR分類器的分類結果。從表6可以看出,LOG和SCAD方法的分類效果優于傳統CSP方法,其中LOG方法的分類效果最優。

表6 分類準確率(%)(數據集1,LR分類器)

為了進一步驗證所提空間濾波器選擇方法的有效性,我們繼續分析數據集2的分類結果。由于空間有限,只給出了數據集2在不同空間濾波器選擇方法和分類器組合下的平均分類準確率,具體如圖2(b)所示。從圖2(b)可以看出,在數據集2中,除了在NB分類器中LASSO方法的分類效果最優之外,Relief方法在剩余五種分類器中的分類效果均是最佳。在數據集2的分類結果中,無論使用何種分類器,LASSO和Relief空間濾波器選擇方法的分類效果都優于傳統CSP;在大部分分類器中,LOG和SCAD空間濾波器選擇方法的分類效果優于傳統CSP。其中,LASSO方法在NB分類器中取得了73.03% 的最高平均分類準確率。

另外,圖2(a)也給出了數據集1在不同空間濾波器選擇方法和分類器組合下的平均分類準確率。從圖2(a)可以看出,在數據集1中,LOG、SCAD和VAR三種方法分別在不同分類器中取得了最佳分類效果,其中LOG方法在SVM、FLDA和LR分類器中效果最佳,SCAD方法在BLDA分類器中效果最佳,VAR方法在KNN和NB分類器中效果最佳。在數據集1的分類結果中,無論使用何種分類器,LOG和SCAD空間濾波器選擇方法的分類效果都優于傳統CSP。其中,LOG方法在SVM分類器中取得了77.02% 的最高平均分類準確率。

以數據集1中的被試S01為例,說明本文所提出的空間濾波器選擇方法與傳統CSP方法的區別,圖3給出了六種不同空間濾波器選擇方法得到的特征權重分布情況。如前文所述,特征的重要性對應著空間濾波器的重要性。傳統CSP方法認為前3個和后3個特征的權重比較大,所以一般選擇前3個和后3個特征進行分類。然而,從圖3中可以看出,在六種空間濾波器選擇方法中,前3個特征和后3個特征的權重并非都是最大的(或者說重要的)。比如VAR方法,第10和第11個特征的權重大于第13和第14個特征,而SCAD方法第3個特征的權重為0。在大多數情況下,新提出的空間濾波器選擇方法與傳統CSP方法選擇的空間濾波器一致。但是本文所提的空間濾波器選擇方法依據數據驅動的特征權重自適應地選擇最優空間濾波器。因此,本文能夠自適應地選擇更加有效的、被試特異的和最具判別性的空間濾波器。

圖2 數據集1和數據集2的平均分類準確率(%)

圖3 被試S01的特征權重分布

本文還研究了空間濾波器選擇數量對分類結果的影響。圖4給出了數據集1在取不同空間濾波器對數的情況下,傳統CSP方法和六種空間濾波器選擇方法分別使用六種分類器的平均分類準確率。從圖4可以看出,隨著空間濾波器對數的增加,各種方法的平均分類準確率都是呈現先升高后降低的變化趨勢。這是由于當空間濾波器的對數選擇過少時,會導致重要信息不足或缺失;而空間濾波器的對數選擇過多時,則會造成信息冗余,即包含噪聲信息,故而空間濾波器對數選擇過多或過少都會影響CSP的性能。由此可證明,空間濾波器對數的選擇對CSP的性能也具有較大的影響。在不同空間濾波器對數的情況下,本文所提出的空間濾波器選擇方法大部分優于傳統的CSP方法,特別是空間濾波器對數為1的時候。

我們注意到文獻[5]提出一種基于F-score算法的空間濾波器選擇方法,與本文提出的六種自適應空間濾波器選擇方法具有相同的選擇原理。因此,本文將F-score方法與提出的六種空間濾波器選擇方法進行對比。具體地,使用數據集1進行實驗,在文獻[5]的基礎上,使用本文提出的六種自適應空間濾波器選擇方法直接取代F-score方法。由于數據集1僅包含15個電極通道,因此本文不再進行通道選擇。此外,腦電信號的頻帶和時間窗劃分與文獻[5]的設置保持一致,仍使用稀疏時-頻段共空域模式進行特征提取,空間濾波器對數設置為1,利用加權樸素貝葉斯分類器(weighted na?ve Bayesian classifier, WNBC)進行預測分類。

具體實驗結果如表7所示,本文提出的空間濾波器選擇方法優于F-score方法,其中LASSO和VAR方法的分類效果最佳。實驗中發現PCC和F-score兩種方法所選擇的空間濾波器完全一致,導致兩種方法的所有被試分類準確率都一樣。出現這種情況的具體原因目前還不清楚。

圖4 取不同數量空間濾波器的平均分類準確率(數據集1)

表7 分類準確率(%)(數據集1,WNBC分類器)

表8給出了傳統CSP方法與本文所提方法在數據集1中的平均特征提取時間。通過對比發現,傳統CSP方法的時間最短,其次是VAR、PCC和Relief三種過濾式方法,最后是LASSO、LOG、SCAD三種嵌入式方法,其中LASSO方法用時最長。本文所提方法的特征提取時間均高于傳統CSP方法,其原因在于傳統CSP方法是直接人工選擇空間濾波器進行特征提取,而本文方法則是先提取所有特征,隨即根據特征權重選擇出最為重要的特征,最后基于數據驅動原理選擇出與之對應的判別空間濾波器。由此可以看出,本文方法為了能夠自適應選擇出被試特異的最優空間濾波器,在其中加入了重要特征選擇和數據驅動的過程,因此本文所提方法的特征提取時間略高于傳統CSP方法。此外,由于嵌入式方法使用10折交叉驗證方法來獲取其最優模型,從而導致其用時高于過濾式方法。

表8 各種方法的平均特征提取時間 單位:s

4 討論

以上實驗結果比較了在不同空間濾波器選擇方法和分類器組合下數據集1和數據集2的分類結果。在大多數情況下,所提出的空間濾波器選擇方法的分類效果優于傳統CSP方法。特別是數據集1中的LOG和SCAD方法,以及數據集2中的Relief方法。由此可以證明本文所提出的空間濾波器選擇方法的有效性。另外,本文所提出的空間濾波器選擇方法可以根據數據自適應地選擇重要的空間濾波器。因此本文所提出的方法具有更強的適用性,可以有效提高腦電解碼模型的泛化性能。

根據圖2中兩個數據集的平均分類準確率,我們可以看出,針對不同數據集選擇合適的空間濾波器選擇方法也非常重要。在數據集1中,LOG、SCAD和VAR這三種方法的分類效果較好;在數據集2中,Relief和LASSO兩種方法的分類效果較好。雖然LOG、SCAD方法在數據集2中的分類效果不是最佳,但是在大多數情況下,LOG、SCAD方法優于CSP方法。因此,非凸稀疏特征選擇模型具有較好魯棒性和穩定性。

本文提出的空間濾波器選擇方法可以很容易嵌入到其他方法中,以便取得更好的腦電解碼性能。比如,本文的空間濾波器選擇方法在時-空-頻特征提取應用中取得了較好的分類效果[5]。因此,本文提出的方法不僅提升了運動想象腦電解碼性能,而且具有更好的普適性。

5 總結

本文提出了六種空間濾波器選擇方法,自適應地選擇重要的空間濾波器,從而得到更具判別性的特征,提高運動想象腦電解碼的性能。首先,基于CSP方法得到完整的空間濾波器矩陣(特征向量矩陣),接著計算所有空間濾波器對應的對數方差特征。然后,基于特征選擇方法確定特征權重,由特征權重得到對應的最優空間濾波器。實驗結果表明,所提出的空間濾波器選擇方法優于傳統CSP方法。本文方法根據數據驅動的特征權重自適應地選擇重要的空間濾波器,具有更好的適應性。另外,本文方法可以很方便地嵌入到其他方法中。

猜你喜歡
特征選擇分類器濾波器
從濾波器理解卷積
開關電源EMI濾波器的應用方法探討
BP-GA光照分類器在車道線識別中的應用
Kmeans 應用與特征選擇
加權空-譜與最近鄰分類器相結合的高光譜圖像分類
結合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
基于Canny振蕩抑制準則的改進匹配濾波器
基于TMS320C6678的SAR方位向預濾波器的并行實現
聯合互信息水下目標特征選擇算法
基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識別
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合