基于L1范數主成分分析網絡的肝功能分級方法

2023-12-23 06:01張正言黃煒嘉奚彩萍張惠惠

江蘇科技大學學報(自然科學版) 2023年5期

張正言,黃煒嘉,奚彩萍,楊魏,張惠惠

(1.江蘇科技大學海洋學院, 鎮江 212100) (2.江蘇科技大學自動化學院,鎮江 212100) (3.江蘇省人民醫院介入科, 南京 210029)

在臨床肝臟疾病的診療過程中,肝功能分級對于外科手術指征的精準把握、內科治療方案的個性化選擇以及患者預后的監測與評估都有著重要的意義[1].現階段,臨床實踐中最具代表性的肝功能分級方法主要有Child-Turcotte-Pugh (CTP)分級和終末期肝病模型(model for end-stage liver disease,MELD)分級[2].然而,這些分級方法主要依賴于患者在空腹下靜脈采集的血液學檢查的生物化學指標,具有創傷性,且存在時效性不足等問題.

借助于常規超聲、計算機斷層掃描(computed tomography,CT)和磁共振成像(magnetic resonance imaging,MRI)等醫學影像,結合人工智能技術對肝臟疾病的研究逐步成為了研究熱點[3].CT圖像能較好地反映肝臟的病理形態,已成為了診斷肝臟疾病首選的成像方法之一[4-5].文獻[6]為了突出肝臟CT圖像中鄰域像素點之間的關系,提出了一種多尺度LBP圖像特征提取算法,實現了高階尺度采樣點與其鄰域相關點之間的信息融合,從而提高肝臟病變檢測的準確率.文獻[7]開發了基于肝臟增強CT圖像的深度學習系統,對肝臟纖維化進行分期,并對該系統的分期準確性進行了驗證.文獻[8]設計了一種多尺度深度特征提取的分類網絡模型,實現了對肝臟腫瘤的精確分類.盡管這些方法主要側重分析異常肝組織和正常肝組織之間的差別,通過診斷患者的肝臟是否發生病變來間接對肝功能進行評估分級,然而,其顯示出了CT圖像與肝臟病理組織之間具有一定的關聯性,使得利用肝臟CT圖像特征直接對肝功能進行分級成為可能.文獻[9]對肝臟CT圖像提取多尺度方向數值模式特征,并利用支持向量機對肝功能進行分級.對于不同于肝臟正常、異常組織的分析與識別,用于肝功能分級的肝臟病理組織具有類內差異大,類間差異小等特點,且人眼無法分辨.

目前,主成分分析網絡(principal component analysis network,PCANet)應用在醫學圖像的多個領域,其網絡結構簡單,在訓練樣本有限的情況下取得了較好的分類效果[10-12].然而,該網絡模型存在不足:① 使用基于L2范數的主成分分析(principal component analysis,PCA)方法來學習網絡中各層卷積核的參數,容易受到離群數據以及噪聲的影響;② 網絡提取的特征維度過高,易造成信息的冗余,在一定程度上限制了模型的性能.

因此,文中提出一種基于L1范數主成分分析網絡(L1-norm principal component analysis network,L1-PCANet)的肝功能分級方法,利用L1范數主成分分析(L1-norm principal component analysis,L1-PCA)[13]算法改進網絡中卷積核參數的學習方法,進而提取出CT圖像中肝臟感興趣區域(region of interest,ROI)的深度層級特征,并在網絡的輸出層引入等距特征映射(isometric feature mapping,Isomap)[14]對特征進行非線性降維,去除冗余信息,最后,利用支持向量機(support vector machine,SVM)對模型進行優化訓練,進而實現肝功能分級.

1 實驗數據

1.1 數據獲取

文中實驗數據來自2017-2019年期間38位肝病患者在江蘇省人民醫院就醫時的檢查數據,數據包含每位患者的門診信息、腹部CT影像、診斷的病因信息以及同期采集到的血液學檢查指標,如生化全套檢查數據、凝血五項檢查數據等.

1.2 數據集的構建

首先,將每位患者的檢查數據按照MELD計算評分,即:

R=3.8×ln[膽紅素(mg/dl)]+11.2×ln(INR)+
9.6×ln[肌酐(mg/dl)]+6.4×(病因)

(1)

式中:“病因”選項中,膽汁淤積性或酒精性為0,其他為1;INR為凝血酶原時間國際標準化比值.MELD評分R值越高,提示預后越差,生存率越低.然后,根據評分R值,進一步將肝功能劃分為3個等級:“低?！?R<15)、“中?！?15≤R≤18)和“高?！?R>18),并將這3個等級作為患者CT影像數據樣本的標簽.

圖1給出了部分患者“低?！钡燃壍母共緾T圖像,患者1和患者2的MELD評分R=5,患者3和患者4的MELD評分R=14.從圖中可以看出,對于肝功能等級相同的不同患者,即使MELD評分R相同,但由于患者的個體因素,其腹部CT圖像中的肝臟部位仍呈現出較大的差異性.

圖1 相同肝功能等級的CT圖像

為了減小這種類內差異對肝功能分級的影響,由醫生提取不包含血管和腫瘤等明顯差異的肝臟ROI圖像,其大小為38×38像素,如圖2.

圖2 不同肝功能等級的肝臟ROI圖像

隨后,將ROI圖像作為實驗數據集中的數據樣本,按照其MELD評分R與標簽“低?！?、“中?！焙汀案呶！毕鄬?從而構建肝功能分級數據集.

2 方法

文中提出了一種基于L1-PCANet的肝功能分級方法,其算法流程如圖3.

圖3 L1-PCANet的算法流程

2.1 L1-PCA算法

假設輸入的圖像樣本為X=[x1,x2,…,xN]∈RD×N,其中,N為樣本的數量,D為樣本的特征維數.L1-PCA的目標是最大化特征空間中基于L1范數的方差,求解由W*張成的K(K

s.t.WTW=IK

(2)

式中:‖·‖1為L1范數;W=[w1,w2,…,wK]∈RD×M為投影矩陣,wk(k=1,2,…,K)為K維線性子空間的基;IK為K×K的單位陣,約束條件WTW=IK保證投影矩陣的正交性.

考慮到求解K>1時的全局最優解較為困難,可將其轉換為求解序列K=1的最優化問題,即:

s. t. ‖w‖2=1

(3)

式中:‖·‖2為L2范數.連續使用K次貪婪算法求出式(3)的最優解即可近似表示式(2)的解,具體算法如下:

step1 初始化w(單位向量);

step2 對于所有的i∈[1, 2, …,N],如果wTxi≥0,則Si=1,否則Si=-1;

通過上述算法可得到第一個主成分所對應的投影向量w1,為了計算wk(k>1),可通過更新訓練數據循環迭代計算,即:

(4)

2.2 基于L1-PCANet的肝功能分級方法

2.2.1 輸入層

(5)

通過對所有N個訓練樣本圖像進行上述操作,并級聯在一起,作為網絡的輸入矩陣:

(6)

2.2.2 卷積層

(7)

式中:matk,k(·)表示將投影向量通過映射轉換成一個卷積核.

(8)

式中:*表示卷積運算;i=1, 2, …,N;l1=1, 2,…,L1.

對于第一個卷積層輸出的L1×N個圖像,再次將輸入的圖像進行采樣塊向量化、去均值和級聯操作,得到第二階段的輸入矩陣為:

(9)

(10)

式中:l=1, 2, …,L2.

(11)

式中:*表示卷積運算;i=1,2,…,N;l1=1, 2, …,L1;l2=1, 2, …,L2.

通過重復上述類似操作,可將網絡結構擴展為具有更多卷積層的深度網絡結構.

2.2.3 輸出層

(1) 二進制哈希編碼

在第二層卷積之后,每個樣本圖像Ii有L1組映射矩陣,且每組包含有L2個映射矩陣.對每組的L2個映射矩陣圖像進行二進制哈希編碼,即:

(12)

(2) 直方圖統計

(13)

(3) 特征降維

為了解決提取出的深度層級特征維數過高的問題,采用流形學習中的Isomap算法[14]對特征進行全局非線性降維,降低特征的維度,去除冗余信息.

Isomap算法是一種全局非線性的流形學習方法,其目的就是將高維數據空間RD中的數據樣本映射到低維流形空間Rd(d≤D)中,得到低維嵌入數據集合的非線性降維.具體算法如下:

step 1 根據樣本的歐式距離矩陣D構建鄰域圖G;

step 2 根據鄰域圖,計算任意兩點的最短距離近似作為兩點間的測地距離矩陣DG;

step 3 使用多維尺度(multidimensional scaling,MDS)算法對最短距離矩陣DG構造d維嵌入.

(4) SVM分類

使用SVM分類器對肝功能分級模型進行優化訓練,其優化目標為:

s.t.yi[wTφ(xi)+b]≥1

(14)

式中:w為法向量;φ表示輸入空間到特征空間的非線性映射;yi為樣本標簽;b為位移量.

3 實驗結果與分析

3.1 實驗設置

數據集共有882個數據樣本,其中,“低?！?、“中?！焙汀案呶！?個類別分別有697個,93個和92個,其統計結果如表1.

表1 肝功能分級數據集統計結果

考慮到表1中實驗數據集數據分布的不均衡性以及“中?！钡燃墝腗ELD評分R值的區間范圍(15≤R≤18)過小的問題,結合臨床過程中肝功能分級輔助診斷的實際需求,將“中?！迸c“高?！眱蓚€等級合并,共185個樣本,同時,隨機選取200個“低?！钡燃壍臉颖?進而將分級問題轉化為對“低?！?、“中高?！眱蓚€等級的二分類問題.

3.2 評價指標

采用準確率(Accuracy)、查準率(Precision)、查全率(Recall)以及F1值等性能指標對實驗結果進行定量分析,計算公式為:

(15)

(16)

(17)

(18)

式中:TP、TN、FP、FN分別為真正例、假正例、真反例、假反例對應的樣本數量.

3.3 實驗結果

通過實驗分別討論不同的網絡模型參數對分級準確率的影響.網絡模型參數主要包括卷積層中卷積核的個數L1、L2,輸入層中采樣塊的大小k1、k2,輸出層中直方圖分塊的大小q1、q2.

3.3.1 不同卷積核個數的實驗結果

對每個卷積層中的卷積核個數的選擇進行實驗.相關參數設置為:k1=k2=5,q1=q2=5,降維后的特征維數d=10.首先,考慮只有一個卷積層的L1-PCANet(L1-PCANet-1),并對卷積核個數由2～16依次進行遍歷;然后,考慮具有兩個卷積層的L1-PCANet(L1-PCANet-2),對卷積核個數由4～20進行遍歷;最后,對3個卷積層的L1-PCANet(L1-PCANet-3)中卷積核的個數依次遍歷4～16.

對于L1-PCANet-1,當L1≥4時,其分級準確率高于PCANet-1,如圖4;對于L1-PCANet-2,卷積層數的增加使得分級準確率相對于L1-PCANet-1提高了,同時在卷積核數量相同的情況下,L1-PCANet-2分級準確率均高于PCANet-2,如圖5;對于L1-PCANet-3,由于肝臟ROI圖像樣本數量少,類間差異小,卷積層數的進一步增加使其網絡的拓撲結構更為復雜,導致準確率相對于L1-PCANet-2反而下降了,如圖6.文中最終選擇具有兩個卷積層的網絡模型結構,且卷積核個數為L1=L2=8.

圖4 L1-PCANet-1的實驗結果

圖5 L1-PCANet-2的實驗結果

圖6 L1-PCANet-3的實驗結果

3.3.2 不同采樣塊大小的實驗結果

在網絡模型中,采樣塊的大小直接決定了卷積核的模板大小,分別對3×3、5×5、7×7、9×9和11×11大小的采樣塊進行實驗,相關參數設置為:L1=L2=8,q1=q2=5,降維后的特征維數d=10.實驗結果如圖7.可以看出,文中提出的改進模型L1-PCANet的分級準確率整體上高于原始PCANet模型.當采樣塊大小大于5×5之后,兩者的分級準確率都呈現下降趨勢.通過實驗,最終選擇采樣塊的大小為k1=k2=5.

圖7 不同采樣塊大小的實驗結果

3.3.3 不同直方圖分塊大小的實驗結果

直方圖的分塊大小決定了網絡提取的深度層級特征的維度,對輸出層的直方圖分塊大小從1×1到10×10進行實驗,相關參數設置為:L1=L2=8,k1=k2=5,降維后的特征維數d=10.實驗結果如圖8.直方圖從整體上反映了圖像的統計特性,過大的分塊會導致圖像細節的丟失,過小的分塊會造成特征的冗余,使得特征維度過大.通過實驗,選取直方圖的分塊大小為q1=q2=5.

圖8 不同直方圖分塊大小的實驗結果

3.3.4 不同特征維數下的實驗結果

為了驗證Isomap非線性降維方法的有效性,分別將深度特征降維到1～50維進行實驗,結果如圖9.從圖中可以看出,當特征維數d=10時,分級準確率達到最高,隨著維數的增大,分級準確率有所下降,隨后趨于平緩.

圖9 不同特征維數的實驗結果

3.3.5 不同影像組學特征模型的實驗結果對比

將文中提出的L1-PCANet模型與原始PCANet等不同影像組學特征模型進行對比實驗,結果如表2.加粗字體表示各列最優結果.

表2 不同特征模型交叉驗證下的性能指標均值

從實驗結果可知,文中方法的分級準確率、查準率、查全率和F1值分別達到78.67%、78.1%、87.33%和0.824 6,相對于原始PCANet模型分別提高了5.81%、2.73%、9.33%和5.8%.由此可見,改進的網絡模型利用多層卷積網絡提取出肝臟ROI圖像中更具鑒別力的層級特征,有效地提高了肝功能分級的準確性.

4 結論

為了解決現有肝功能分級存在創傷性,且存在時效性不足等問題,從肝臟CT圖像入手,提出了一種基于L1范數主成分分析網絡的肝功能分級方法,利用L1-PCA算法學習網絡中卷積核參數,從而提取出CT圖像中ROI的深度層級特征,并通過Isomap對特征進行非線性降維,進一步去除冗余信息,最后,利用SVM實現對肝功能分級.通過大量實驗得出以下結論:

(1) 利用了L1-PCA方法改進原始PCANet中卷積核的參數的學習方法,加強對離群數據和噪聲的魯棒性,從而提取出肝臟CT圖像中更具鑒別力、魯棒性更強的深度層級特征.

(2) 使用基于流形學習的Isomap算法對提取到的深度層級特征進行非線性降維,去除冗余信息,進一步增強特征的有效性和區分度.

(3) 相比于現有的方法,文中方法切實提高了肝功能分級的準確率、查準率、查全率以及F1值等性能指標.

(4) 該方法通過CT無創檢查獲取患者的肝臟圖像來實現肝功能分級,避免了血液檢查需要空腹等限制,因此,具有無創性、高效性和可重復性,能夠為臨床醫生對患者的肝功能提供及時、有效地輔助診斷.