?

基于mRMR和CCA的AD分類方法研究

2023-12-29 04:27張國棟董愛美齊志云劉思迪
齊魯工業大學學報 2023年6期
關鍵詞:特征選擇準確率模態

張國棟,董愛美,齊志云,劉思迪

齊魯工業大學(山東省科學院) 計算機科學與技術學部,山東 濟南 250353

阿爾茨海默病(AD)是一種起病隱匿、進行性發展的神經退行性疾病,多見于65歲以上人群,主要影響患者腦功能,臨床表現主要包括記憶力減退、語言障礙、空間定向能力下降、行為和情緒變化以及認知障礙等[1]。目前對AD并無有效的治療手段,只能寄希望于能夠盡早識別出AD患者并及時干預治療。輕度認知障礙(MCI)是AD的早期階段,對MCI患者進行有效治療可以延緩病情進展甚至促進康復,因此,若能盡早識別出MCI患者,將有助于患者接受治療,防止病情惡化。

隨著人工智能的蓬勃發展,各種改進的機器學習方法開始廣泛應用于AD的分類研究中,為使用神經影像數據輔助醫生進行AD診斷做出了巨大貢獻。在進行AD分類的研究中,有些學者關注于單一模態圖像的應用,如核磁共振成像(MRI)[2]、正電子發射斷層掃描成像(PET)[3]和彌散張量成像(DTI)圖像[4]等,這些圖像技術在研究中可以提供豐富的信息,如腦結構、腦代謝和腦連接等方面的特征。Uysal等[5]根據年齡、性別和左右海馬體積值創建了一個數據集,然后通過使用機器學習技術對海馬體積信息進行分類,實驗證明 MRI圖像可用于區分AD、MCI 和正常對照組(NC)。Fan等[6]提出了一個U-net模型,用于使用MRI圖像進行AD分類。Ji等[7]將MRI圖像的灰質和白質圖像切片作為輸入數據,使用卷積神經網絡(CNN)進行AD分類,在AD與NC的分類實驗中取得了88.37%的準確率。Chen等[8]結合MRI圖像和臨床特征構建 Stacking 框架,在AD多分類任務中平均準確率達到了86.96%。Al Shehri[9]提出使用DenseNet-169和ResNet-50 CNN架構對AD進行診斷和分類,實驗結果表明,DenseNet-169 架構表現出色,準確率達到了83.83%,而ResNet-50 的準確率為81.92%。

但是,只使用一種模態數據進行分析勢必會造成信息的不充分,從而影響整體的AD分類準確率。因此,一些研究學者開始整合來自多種模態的神經影像數據,以提高AD分類的分類性能。Huang等[10]使用CNN融合MRI和PET數據以提高AD分類準確率。Lin等[11]構建了用于AD分類的3D可逆生成對抗網絡(GANs)。Cosmo等[12]提出了一種新的端到端的可訓練圖學習框架,用于動態和局部圖修剪。該方法可以在提高AD分類精度的同時降低網絡結構的復雜度,提高模型運行速度。Huang等[13]提出了一個可以自動整合多種神經影像數據和非影像數據的通用框架,不僅在AD分類中取得了很好的分類效果,還可以用于自閉癥譜系障礙和眼病預測。Jiang等[14]在全卷積網絡模型中添加外部注意力模塊,同時引入Softmax和L1范數的雙重歸一化方法,以獲得更好的分類的性能和更豐富的特征信息疾病概率圖,在AD分類任務中,該方法取得了92.36%的分類準確率。

雖然現有的方法在AD分類中取得了令人滿意的結果,但仍存在著一定缺陷:首先,多模態神經影像數據在預處理后仍然存在樣本量小、維數高的問題,限制了模型的分類性能;其次,部分研究只使用了單模態數據,沒有充分利用多模態數據的潛在信息,限制了分類效果。為解決以上兩個問題,本文提出了一種基于mRMR和CCA的AD分類方法(mRMR-CCA)。相較于其他方法,該方法具有兩個優點:(1)對多模態神經影像數據進行特征選擇,去除了冗余信息;(2)挖掘多模態數據間的內在聯系,充分利用多模態互補信息進行AD分類。

1 方法

1.1 最大相關-最小冗余算法

特征選擇可以分為兩個過程:(1)怎樣度量特征相關性。(2)怎樣解決特征之間的冗余?;バ畔⑹且环N能夠度量兩個變量之間相關性的指標,不僅可以考慮線性關系,還能考慮非線性關系,定義兩個變量X和Y之間的互信息如下:

其中,p(x,y)是聯合分布,p(x)和p(y)是邊際分布,互信息I(X;Y)則為聯合分布和邊際分布的相對熵。

為了解決特征選擇中的相關性和冗余問題,研究學者提出了一種基于互信息理論的特征選擇方法,即最大相關-最小冗余算法(mRMR),該算法的實現基于兩個關鍵條件:最大相關性條件和最小冗余條件。

最大相關性條件旨在尋找與樣本類別信息相關性最大的特征子集,通過最大化特征與類別之間的互信息來選出與類別預測最相關的特征,目標函數如式(2)所示:

最小冗余條件旨在尋找最小化特征之間重疊信息的特征子集,通過最小化特征之間的互信息,可以確保所選的特征不會包含任何冗余信息,目標函數如公式(3)所示:

其中,S代表特征子集,c為類別標簽。

結合最大相關和最小冗余這兩個條件,可以得到mRMR的目標函數如下所示:

1.2 典型相關性分析算法

典型相關性分析算法(CCA)通過尋找幾組合適的映射方向來研究少數幾組變量的相關性,從而揭示兩種模態數據間的內在相關性。具體而言,假設有n個樣本,每個樣本有兩種模態數據,每種模態數據都包含d個特征,則第一種模態數據可以表示為矩陣X={x1,x2,…,xn}∈d×n,第二種模態數據可以表示為矩陣Y={y1,y2,…,yn}∈d×n。CCA采用搜索出的兩組典型變量wx∈d和wy∈d,使線性組合和之間的相關系數最大,即求解相關系數的最大值,如式(5)所示:

其中,Cxy=XYT為X和Y之間的互協方差,并且Cxy=CTyx,Cxx=XXT和Cyy=YYT分別為特征矩陣X和Y的方差。為保證解的唯一性,對該問題采取固定分母,將分子的優化作為目標的方式,從而將該問題轉化成一個凸優化的問題,故該目標函數可以轉化為:

對于上述優化問題,通常采用特征值分解的方法進行求解。

首先,利用拉格朗日乘子法,將式(6)轉化為以下目標函數:

其中,λ和θ代表拉格朗日乘子。分別對wx、wy求偏導數,并令偏導數為0可得:

Cxywy-λCxxwx=0, (8)

Cyxwx-θCyywy=0, (9)

分別將式(10)和式(11)互相代入,可得:

在得到新的特征矩陣后,將兩組不同模態的特征融合成一組新的特征矩陣,這組特征矩陣包含了兩組數據的相關性信息,可以更好地反映數據之間的關聯。通常采用以下兩種方式進行多模態特征融合,若采用相加融合的方式,得到的融合特征表示為:

若采用連接融合的方式,得到的融合特征表示為:

1.3 方法介紹

為去除多模態數據的冗余信息并充分利用不同模態間的互補信息,提出基于mRMR和CCA的AD分類方法(mRMR-CCA),該方法主要分為3個步驟:(1)特征選擇;(2)特征融合;(3)AD分類。具體來說,首先使用mRMR算法從每個模態中選擇出更有助于分類的判別性特征,之后采用CCA算法對多模態數據進行特征融合,在融合過程中采取連接的融合方式,形成一個包含更多互補信息的新的特征集合,以提高分類性能,最后,采用SVM分類器進行分類。詳細過程如圖1所示。

圖1 mRMR-CCA方法流程圖

2 數據集及預處理

2.1 數據集

阿爾茨海默病神經成像研究計劃(ADNI)[15]旨在尋找與AD相關的疾病標志物,并為早期AD的診斷和追蹤提供支持的神經影像研究計劃。目前,ADNI研究計劃已經進行了4個階段的研究(ADNI-1、ADNI-GO、ADNI-2、ADNI-3),其中每個階段都招募了大量的參與者,采集了大量的臨床和影像數據。

實驗使用了來自ADNI數據庫的156名受試者的MRI和PET神經成像數據來研究AD分類問題,其中包括3組人群,即AD患者組、MCI患者組和NC受試者組,每組均包括52名受試者。表1提供了這些受試者的詳細信息,包括每個類別的人數、年齡、MMSE評分[16]和CDR評分[17]。根據阿爾茨海默癥和相關疾病協會的標準,NC組受試者的MMSE評分為24~30分,CDR評分為0;MCI組受試者的MMSE評分為24~30分,CDR評分為0.5;AD組受試者的MMSE評分為20~26分,CDR評分為0.5或1。

表1 受試者的統計信息

2.2 預處理

從ADNI數據庫下載了MRI圖像和PET圖像。對于MRI圖像,ADNI執行了梯度不均勻性校正以控制圖像質量,之后,進一步對數據進行預處理。預處理操作可以分為兩部分:一是圖像處理,二是特征提取。圖2展示了使用SPM工具[16]對MRI和PET兩種圖像的預處理過程。

圖2 MRI和PET的預處理工作流程

對MRI圖像的預處理主要包括圖像校準、圖像分割、空間標準化和平滑等操作。具體來說,首先進行前連合-后連合(AC-PC)校正,使得不同個體的數據可以進行比較和分析。其次,利用組織概率模板(TPM)可以將MRI圖像分割成灰質、白質和其他區域,同時可以將灰質和白質圖像映射到MNI空間,保證所有的樣本都處于到同一坐標系統中。然后,在空間標準化時,使用李代數微分同胚配準算法(DARTLE)方法,該方法通過創建群組平均的灰質和白質圖像,制作平均模板圖像,之后利用該圖像實現原始灰質圖像的空間標準化處理。最后,使用8 mm平滑內核進行平滑以去除噪聲。對于PET圖像,首先將96張DICOM格式的圖片合并成一張3D PET圖像,其次利用配準技術使每個受試者的PET圖像與其對應的T1 MRI原始圖像對齊,然后進行頭部運動校正和空間標準化,最后完成平滑操作。

在特征提取中,使用RESTPlus[18]工具。首先將MRI和PET圖像重新采樣到與解剖自動標記(AAL)模板[19]相同的大小,即61×73×61。之后,對于MRI圖像,提取對應于90個感興趣區域的平均體積值,提取PET圖像的90個感興趣區域的平均強度值。

3 實驗及結果分析

3.1 實驗設置

本文進行了3個二元分類任務來驗證mRMR-CCA的有效性,包括(1) AD vs.NC;(2) MCI vs.NC;(3) AD vs.MCI。此外,使用準確率(ACCU)、ROC曲線下面積(AUC)、靈敏度(SENS)和特異性(SPEC)4個指標來評估分類器的性能。其中,ACCU表示所有樣本被正確分類的概率,SENS表示正確分類的正例樣本占所有正例樣本的準確率,SPEC衡量模型在預測反例時的準確率。在AD vs.NC和MCI vs.NC分類任務中,將NC視為正樣本,將AD和MCI視為負樣本。在AD vs.MCI的分類任務中,將MCI視為正樣本,將AD視為負樣本。在每個實驗中,使用LIBSVM工具箱[20]中的SVM分類器作為實驗的分類器。值得注意的是,在SVM分類器中使用了RBF核函數,主要原因是該函數對數據中的噪聲有很好的抗干擾能力。其次,使用非線性核函數可以獲得更好的結果。

3.2 消融實驗

在本實驗中,比較了mRMR-CCA方法和單獨使用mRMR算法或CCA算法這兩種獨立算法的方法,以評估它們對AD分類性能的影響,并且通過表2展示了它們之間的差異。在表2中,用“粗體”對最佳分類結果進行了標注,對使用到的算法使用“√”進行了標記。其中,CCA使用連接融合的方式將多模態數據進行特征融合,mRMR在對兩個模態數據分別進行特征選擇后,同樣使用直接連接的方式將兩個特征集合進行融合。CCA和mRMR算法均有標記的為本文提出的方法,即mRMR-CCA。

從表2可以看出,本文提出的mRMR-CCA方法在3個二分類任務中取得了最好的分類性能,而只使用CCA進行兩種模態數據的特征融合所取得的分類性能最差。這是因為CCA雖然考慮了多模態數據間的內在聯系,可以發揮出互補信息的作用,但是仍然存在冗余特征,這些冗余特征所含有的干擾信息降低了分類性能。而mRMR雖然能夠從多模態數據中各自選出與標簽最相關的特征,但是從本質上講是分別對各模態數據進行的特征選擇,后續再直接將多模態數據特征進行連接融合,存在丟失多模態數據互補信息的問題,從而導致分類效果不理想。

表2 消融實驗 單位:%

提出的方法充分克服了這兩個問題,首先使用mRMR算法去除了各個模態數據中的冗余信息,選擇出了與分類標簽存在最大相關性的特征,然后再通過CCA來充分挖掘多模態間存在的互補信息,形成一個新的特征集合,從而使分類性能得到了提升。

3.3 不同融合方法的對比

為了驗證基于CCA的多模態融合方式在算法框架中的有效性,選擇將mRMR算法選擇出的兩種模態的特征采取串行、并行的融合方式作為比較方法。此外,基于CCA的模態融合方法也有兩種,即連接融合和相加融合的方式,同樣比較了這兩種融合方式的在AD分類問題上的性能差異,來驗證在使用CCA算法基礎上進行連接融合的方法的有效性,實驗結果如表3所示。

從表3可以看出,本文提出的方法在3個分類任務中均取得了最好的結果。同時,直接對多模態數據進行串行或并行的特征融合方式所取得的分類效果并不理想,尤其是在MCI vs.NC的分類任務中,分類準確率低于63%。這主要是因為直接將兩個模態的特征集合進行并行或串行融合,并不能很好地挖掘數據中的互補信息和共性特征,反而會導致出現信息相互干擾的問題,從而導致分類性能下降。而本文提出使用CCA算法進行特征融合,更多的考慮了多模態數據間的內在聯系,使得兩種模態數據集的相關性得到了提升,形成了包含更多互補信息的特征集合,從而提高了分類準確率。

此外,在使用CCA算法進行特征融合時,可以發現連接融合要比相加融合所取得的分類性能要好。這主要是因為相加融合更適合兩個數據特征具有相同分布的情況,而多模態數據所具有的特征并不具有相同分布,所以相加融合會出現信息損失的問題,從而導致模型分類性能降低,甚至失效。相反,連接融合選擇將兩個數據特征進行拼接,雖然這種融合方式會出現維度增加和運行時間稍長等問題,但能夠保證信息完整,使新的特征集合具有多模態數據中的全部互補信息,從而取得更好的分類結果。

表3 不同特征融合方式的對比 單位:%

3.4 不同方法的對比

為檢驗本文提出的算法在AD分類問題上的有效性,將mRMR-CCA與其他方法進行了對比,分類對比結果如表4所示。

其中,局部保持投影(LPP)、主成分分析(PCA)以及低秩表示(LRR)[21]3種算法屬于特征選擇方法,首先使用這3種算法分別對各模態數據進行特征選擇,然后將選擇后的特征進行連接融合。Xu等[22]提出了一種多視圖混合嵌入方法(MvHE ),該方法采用分治法的策略來解決多視圖數據中存在的差異性和非線性問題。You等[23]提出了多視圖公共分量鑒別分析(MvCCDA ),以聯合方式處理視圖差異、可分辨性和非線性等問題。低秩公共子空間(LRCS)[24]尋求一個公共的低秩線性投影來緩解不同視圖之間的語義鴻溝,LRCS能夠跨不同視圖捕獲兼容的內在信息,并且還能夠很好地對齊來自不同視圖的類內樣本。這3種多視圖方法在多視圖公共數據集上都取得了很好的分類效果,所以將這些多視圖的理論方法應用于AD分類問題。針對AD分類問題,Prajapati等[25]設計了一個具有全連接層的深度神經網絡(DNN)來執行二分類任務,隱藏層使用三種不同類型的激活函數,通過組合不同的激活函數來獲得性能最佳的模型。

從表4中可看出,提出的方法在3個分類任務中均取得了不錯的分類性能。與3種特征選擇方法相比,提出的方法有顯著提升,特別是在AD vs.NC分類任務中,提出的方法使得ACCU提高了40%,SENS提高了23%,SPEC提高了24%,AUC提高了27%,這表明本文方法在區分AD患者和正常人方面表現得更加出色。與3種多視圖理論學習方法相比,提出的方法在AD vs.NC分類任務中性能略低于MvHE算法,但在其他兩個分類任務中表現更出色,特別是在MCI vs.NC分類任務中,ACCU達到了70.27%,SENS達到了73.22%,SPEC達到了68.57%,AUC達到了76.63%。這說明提出的方法能夠有效地識別MCI患者,有助于早期治療,防止病情進一步惡化。與DNN算法相比,mRMR-CCA在MCI vs.NC分類任務中,準確率要稍差。但在其他3個指標上,提出的方法性能要更好,另外,DNN算法要求的樣本數量較多,運行速度較慢。所以,綜合來看,mRMR-CCA在AD分類問題上具有更好的性能,具有一定的有效性。

表4 不同方法的對比 單位:%

3.5 不同特征選擇數目的對比

在mRMR-CCA方法中,首先使用mRMR算法進行特征選擇操作,因此特征數目的多少對分類性能會有不同程度的影響。為了探究應該從各個模態中選擇多少維特征進行AD分類,使用不同數量的特征進行分類,并觀察準確率的變化趨勢。圖3呈現了準確率的變化趨勢,其中mRMR維數以5的間隔從5變化到40。

圖3 不同特征選擇數目的對比

從圖3可看出,在AD vs.NC和AD vs.MCI兩個分類任務中,隨著mRMR維數的增加,準確率呈現出先上升后下降的趨勢。在AD vs.NC分類任務中,當特征維數為10時,取得的分類準確率最高;在MCI vs.NC分類任務中,當特征維數為5時,取得的分類準確率最高;在AD vs.MCI分類任務中,最高準確率出現在mRMR維數為10的時候。這表明選擇不同數量的特征對不同的分類任務影響不同,需要根據具體的任務來選擇合適的特征數量。此外,可以看到在所有分類任務中,mRMR維數達到一定程度后,準確率都會開始下降,這可能是由于過多的特征會引入噪聲和冗余信息,從而降低分類性能。

實驗結果表明,在mRMR-CCA方法中,特征數目的選擇對于AD分類具有重要影響。在不同的分類任務中,需要根據具體情況選擇合適的特征數量,以獲得最佳的分類性能。

4 總 結

本文提出了一種基于mRMR和CCA的AD分類方法,旨在利用多模態數據之間的互補信息并消除冗余信息,提高AD的分類準確性。該方法首先使用mRMR算法從各個模態數據中選擇出最有助于分類的特征,然后使用CCA算法將各個模態的判別性特征進行連接融合,形成一個新的融合特征矩陣,最后,將該矩陣輸入到SVM分類器中進行AD分類,最終分類結果通過ACCU、SENS、SPEC、AUC 4個指標進行評價。實驗證明,提出的方法在AD分類問題上具有一定的有效性。在未來的工作中,我們期望開發一種方法,將不完整模態數據用于 AD 分類問題,降低AD數據量不足的影響。

猜你喜歡
特征選擇準確率模態
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
2015—2017 年寧夏各天氣預報參考產品質量檢驗分析
高速公路車牌識別標識站準確率驗證法
Kmeans 應用與特征選擇
聯合互信息水下目標特征選擇算法
國內多模態教學研究回顧與展望
基于HHT和Prony算法的電力系統低頻振蕩模態識別
由單個模態構造對稱簡支梁的抗彎剛度
基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合