?

基于深度信念網絡的乳腺腫瘤輔助診斷研究?

2019-03-26 08:44許凱波羅廣祥孫震輝
計算機與數字工程 2019年3期
關鍵詞:惡性乳腺信念

許凱波 羅廣祥 孫震輝

(1.長安大學地球科學與資源學院 西安 710054)(2.中國科學院遙感與數字地球研究所 北京 100101)

1 引言

近年來,乳腺癌的發病率逐年上升,嚴重威脅著女性患者的身心健康,乳腺癌在發病的初期沒有明顯的臨床癥狀,不容易被察覺。因此,早期發現、早期治療是預防和治療乳腺癌的最有效途徑[1]。

傳統的基于BP神經網絡、LVQ神經網絡、支持向量機(SVM)、隨機森林、決策樹[2~5]的乳腺腫瘤識別判讀方法存在很多缺點,如BP神經網絡算法存在著收斂速度慢、易陷入局部最優等問題;SVM在二分類問題上效率較高,但是在多分類識別問題上存在著構造分類器困難且分類效率較低的缺點,而且核函數的選擇和參數的確定比較困難[6];決策樹算法在處理特征關聯性較強的乳腺腫瘤特征數據時效率較低;同時上述方法均屬于淺層的機器學習方法,學習能力具有一定的局限性,不適應于大量樣本的訓練,可擴展性較差[7]。深度信念網絡(DBN)是深度學習模型的一種,DBN因其強大的特征提取能力已在分類識別問題上得到了廣泛的應用,是當前機器學習領域的研究熱點[8-9]。

基于以上分析,本文構建了一種基于深度信念網絡的乳腺腫瘤識別模型。首先對乳腺腫瘤特征數據進行預處理,然后通過受限波爾茲曼機(RBM)和BP神經網絡訓練乳腺腫瘤識別模型。最后,將該模型與BP神經網絡、決策樹和支持向量機(SVM)三種乳腺腫瘤識別方法進行對比。實驗結果顯示,本文的構建的模型對乳腺腫瘤識別具有更好的識別判讀效果。

2 乳腺腫瘤診斷原理

乳腺腫瘤良惡性診斷原理為:首先利用細針吸取乳腺腫瘤細胞,然后采用穿刺針對細胞進行穿刺獲得理想的細胞學標本,最后由診斷醫師觀察和分析細胞形態和細胞質的變化情況,判定其為惡性或者良性腫瘤[10~11]。醫學研究表明,乳腺腫瘤的細胞核半徑、周長、面積等10個特征因子與乳腺腫瘤有著十分緊密的聯系,可以作為判讀乳腺腫瘤良惡性的特征,因此可以對獲取乳腺腫瘤細胞進行相應特征的提取,建立這10個特征與乳腺腫瘤細胞良惡性之間的關系。設x1,x2,x3,…,x10代表乳腺腫瘤細胞的10個量化特征,y表示乳腺腫瘤細胞的良惡性,則有如下的關系式:

其中,f()表示函數關系,即乳腺腫瘤良惡性識別模型。傳統的多元線性回歸和淺層的機器學習算法難以對式(1)的函數關系進行準確的擬合,深度信念網絡具有非常強的特征提取和非線性擬合能力,因此本文采用深度信念網絡建立乳腺腫瘤細胞10個量化特征和其良惡性之間的關系,從而實現乳腺腫瘤細胞良惡性的計算機輔助判讀識別。

3 基于深度信念網絡的乳腺腫瘤診斷

3.1 深度信念網絡算法

多倫多大學的Geoffreyhinton教授[12]在2006年提出了深度信念網絡(Deep Belief Network,DBN)。深度信念網絡(DBN)是由若干個受限玻爾茲曼機(RBM)和一個BP神經網絡組成的深度學習模型。DBN通過多層受限玻爾茲曼機對輸入的數據進行提取、抽象,盡可能保留重要特征信息,然后將RBM提取的特征信息輸入到BP神經網絡,通過有監督的BP神經網絡將誤差反向傳播,自上向下微調整個DBN模型[13]。

3.1.1 受限玻爾茲曼機模型

受限波爾茲曼機(Restricted Boltzmann Machine,RBM)是由Hinton等提出的一種生成式隨機神經網絡。RBM是一個無監督學習的能量模型,它包括顯層(輸入層)和隱層(輸出層)2層結構,對稱連接且無自反饋的隨機神經網絡模型,層間全連接,層內無連接[14]。RBM網絡結構如圖1所示,其中底部的v層代表可見層,代表數據輸入層,h為隱層,可看作一些特征提取器,W為2層間的連接權重。

圖1RBM結構

其中,vi為V層第i個單元的狀態;hj為H層第 j個單元的狀態;θ={ }wij,ai,bj為 RBM 的參數值,wij為V層第i個單元和H層第 j個單元之間的連接權重值,ai和bj分別為V層第i個單元和H層第j個單元的偏執值?;谀芰亢瘮?,可以得到(v,h)的聯合概率分布為

假定V層有n個顯層節點,H層有m個隱層節點,則可見層節點和隱藏層節點(v,h)之間的能量函數為:

RBM學習的本質就是求出θ值來擬合給定的訓練數據。

3.1.2 深度信念網絡模型

DBN由若干個RBM模型和一層BP神經網絡組成的網絡結構,其模型結構如圖2。DBN通過逐層的訓練RBM來完成,首先將原始特征數據輸入到第一層的RBM中進行訓練,然后將第一層RBM學習得到的數值輸入到第二層RBM,重復以上過程直到訓練完所有的RBM,最后利用有標簽的樣本數據通過誤差反向傳播算法通對該模型的參數進行微調,直至獲得滿足預期精度的DBN訓練模型[15]。

圖2 深度信念網絡模型

DBN訓練過程:

1)從DBN網絡最底層開始,采用無監督的方式訓練每一層RBM網絡,這種逐層訓練網絡的方式可以盡可能多地提取數據的特征,RBM迭代訓練過程如圖3。

圖3 RBM的迭代訓練過程

2)DBN模型最上層是BP神經網絡,將經過RBM訓練后輸出的特征向量輸入到BP神經網絡進行有監督的訓練,利用反向傳播算法對整個DBN網絡進行參數微調,從而使模型達到最優。

3.2 基于深度信念網絡的乳腺腫瘤識別判讀步驟

基于深度信念網絡的乳腺腫瘤診斷的具體步驟如下。

1)選取訓練集和測試集

本文的仿真試驗數據來自于威斯康辛大學的Wisconsin Breast Cancer Database為UCI機器學習數據庫(UCI Machine Learning Repository)捐贈的Wisconsin Breast Cancer Database數據,該數據集包括357組良性乳腺腫瘤數據和212組惡性乳腺腫瘤數據。本文從乳腺腫瘤數據集中隨機選取410組數據作為訓練集數據,剩下的159組數據作為測試集數據。數據集中每個樣本數據包含半徑、質地、周長、面積、光滑度、緊密度、凹陷度、凹陷點數、對稱度、分形維數,每個特征向量包括平均值、標準差和最壞值3個指標共30個特征值。

2)數據預處理

為了避免乳腺腫瘤細胞核顯微圖像特征向量數據之間存在的量綱差異對模型訓練造成的影響,對數據進行歸一化處理。

3)構建深度信念網絡

針對訓練數據集的特點,構建初始網絡結構,對網絡參數進行初始化。

4)對深度信念網絡進行訓練

將500組乳腺腫瘤數據中的半徑、質地、周長等10個量化特征向量作為網絡的輸入,將每組樣本數據對應的乳腺腫瘤良、惡性結果作為網絡輸出訓練深度信念網絡。經過多次實驗和網絡參數的優化,得到最優的深度信念網絡模型。

5)乳腺腫瘤的診斷

采用訓練好的深度信念網絡模型對測試集中69組乳腺腫瘤數據進行診斷識別。

6)診斷識別結果分析

對深度信念網絡的仿真識別的結果進行分析,計算該模型對乳腺腫瘤良、惡性識別的準確率,并對基于深度信念網絡的乳腺腫瘤識別模型進行評價。

基于深度信念網路的乳腺腫瘤診斷識別的算法流程如圖4所示。

圖4 基于深度信念網絡的乳腺腫瘤識別

4 仿真研究

4.1 數據來源

本文的仿真試驗數據來自于威斯康辛大學的Wisconsin Breast Cancer Database為UCI機器學習數據庫(UCI Machine Learning Repository)捐贈的Wisconsin Breast Cancer Database數據,該數據集包括357組良性乳腺腫瘤數據和212組惡性乳腺腫瘤數據,每組腫瘤數據包括半徑、質地、周長等30個特征數據,數據權威而且可靠[16]。試驗所用的部分乳腺腫瘤特征數據如表1所示。

表1 部分乳腺腫瘤特征數據

4.2 試驗環境

表2 實驗環境

4.3 試驗結果與分析

經過多次試驗,本文構建了網絡層數為4層的深度信念乳腺腫瘤識別判讀模型,模型由一個輸入層、3個隱藏層和一個輸出層組成,模型的第一層有30個節點,對應著輸入該模型的30維乳腺腫瘤細胞特征向量,3個隱藏層節點數分別50、50、80,輸出層有2個節點,對應著將乳腺腫瘤細胞識別為2類,該模型預訓練次數為1000次,參數微調的迭代次數為300次。從569組乳腺腫瘤數據集中隨機選取410組數據作為訓練集數據,剩下的159組數據作為測試集數據,基于深度信念網絡的乳腺腫瘤識別結果如表3所示。

表3 基于深度信念網絡的乳腺腫瘤識別結果

由表3可知,在159個測試樣本中,良性腫瘤確診個數為98個,良性腫瘤誤診個數為0個,良性腫瘤確診率為100%;惡性腫瘤確診數為60個,惡性腫瘤誤診個數為1個,惡性腫瘤確診率為98.36%,本文的構建的模型對乳腺腫瘤良惡性識別具有非常好的效果。

為了更加全面地評價本文構建的模型對乳腺腫瘤細胞的識別判讀效果,將本文的方法與BP神經網絡、LVQ神經網絡、決策樹和支持向量機等方法進行對比,每種方法分別進行10次試驗,計算其平均識別正確率,結果如表4所示。

表4 乳腺腫瘤確診率仿真平均結果對比

表4可以看出,經過10次仿真試驗分析,本文構建的乳腺腫瘤識別模型的良性腫瘤平均確診率為99.21%,惡性腫瘤平均確準率為98.32%,平均確診率為98.45%,平均識別精度均高于其他四種方法,表明本文構建的模型對乳腺腫瘤具有很好的識別效果。

5 結語

針對BP神經網絡、LVQ神經網絡、決策樹、支持向量機(SVM)等淺層的機器學習算法對乳腺腫瘤識別精度不高的問題,構建了一種基于深度信念網絡的乳腺腫瘤識別判讀模型。仿真實驗結果表明,該模型對乳腺腫瘤細胞有著很好的識別效果,識別精度優于BP神經網絡、LVQ神經網絡、SVM、決策樹算法,具有一定的醫學應用價值。

猜你喜歡
惡性乳腺信念
NEAT1和miR-146a在結核性與惡性胸腔積液鑒別診斷中的價值
基于高頻超聲引導的乳腺包塊導絲定位在乳腺病變中的診斷價值
有一種信念,叫“中國紅”
為了信念
惡性胸膜間皮瘤、肺鱗癌重復癌一例
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
探討超聲檢查在甲狀腺腫塊良惡性鑒別中的診斷價值
冠軍賽鴿的信念(上)
乳腺貼真的能治乳腺疾病嗎
力挽惡性通脹的美聯儲前主席保羅·沃爾克逝世,享年92歲
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合