?

不同分類器對蘇木精-伊紅染色在早期胃癌組織病理圖像分級研究*

2020-12-30 08:21胡嘉影陳雨萍羅志飛蔡仁桑馬夢晨黃幼生陳夢柚
中國醫學裝備 2020年12期
關鍵詞:組織學像素點紋理

胡嘉影 陳雨萍 羅志飛 蔡仁桑 馬夢晨 黃幼生* 陳夢柚

蘇木精-伊紅染色法(hematoxylin-eosin staining,HE)是石蠟切片技術里常用的染色法之一,在組織學、病理學等研究方面使用非常廣泛[1]。早期胃癌是指癌組織限于胃黏膜層及黏膜下層,不論其范圍大小和是否有淋巴結轉移,多見于中老年人,早期胃癌患者經過有效治療后5年生存率達90%以上[2]。HE染色活檢組織病理學檢查是診斷早期胃癌的主要手段,近年來隨著計算機技術的迅速發展,利用計算機輔助數字病理的過程中,將顯微鏡下觀察到的圖像通過電腦掃描制作成數字病理圖像,能夠極大提高診斷效率和準確性[3]。

醫學圖像分割是醫學圖像處理與分析領域的復雜而關鍵的步驟,其目的是分割和提取醫學圖像中具有特殊含義的相關特征,為臨床診療和病理學研究提供可靠的依據。本研究利用訓練邏輯回歸(logistic regression,LR)、支持向量機(support vector machine,SVM)和樸素貝葉斯(naive Bayes,NB)3個機器學習算法分類器對像素點進行癌巢區域和間質區域進行區分,對比癌巢分割效果,選擇效果最佳的分類算法觀察其圖像組織學分級效果。

1 資料與方法

1.1 臨床資料

選用2018年1月至2019年12月海南醫學院第一附屬醫院病理科的420幅原始HE染色胃癌組織病理圖,其中黏膜內癌[cT1a(M)]185幅,黏膜下癌[cT1b(SM)]235幅。使用Matlab7.0軟件對病理圖像進行灰度化、去噪、增強對比度、特征提取及圖像分割等處理。

1.2 儀器設備

采用數字切片掃描與應用系統(廈門麥克奧迪實業集團有限公司,閩械注準20162220080)。

1.3 采集圖像

將收集的420幅病理切片均運用數字切片掃描與應用系統進行數字化掃描(20倍物鏡)形成數字化病理切片,并制作成TIFF格式圖像集,其分辨率為1024×1360。

1.4 圖像處理方法

1.4.1 癌巢分割

對原始的HE染色胃癌組織病理圖像進行預處理,包括灰度化、去噪和對比度增強。

(1)灰度化。根據重要性及其他指標,將紅、綠、藍(Red,Green,Blue,RGB)3個分量以不同的權值進行加權平均。由于人眼對綠色敏感最高,對藍色敏感最低,因此,對RGB的3個分量進行加權平均得到較合理的灰度圖像,其轉換算法為公式1:

式中L為灰度值;R為紅色分量;G為綠色分量;B為藍色分量。

(2)去噪。為消除圖像中的噪聲并對圖像平滑化,選擇3×3模板掃描圖像中的每一個像素,用模板確定的鄰域內像素的加權平均值替代模板中心像素點的值。

(3)對比度調整。將給定圖像的直方圖分布改變成“均勻”分布直方圖分布。根據圖像灰度計算概率密度函數(probability density function,PDF);計算累積概率分布函數的累積分布函數(cumulative distribution function,CDF);將CDF歸一化到原圖灰度取值范圍,如[0,255](灰度圖像像素值的取值范圍為[0,255])之后CDF四舍五入取整,得到灰度轉換函數,其算法為公式2:

式中sk為目標圖像灰度值;T為輸入灰度級和輸出灰度級之前的映射關系;rk為原始圖像灰度值;將CDF作為轉換函數,將灰度為rkrk的點轉換為sksk灰度。

1.4.2 特征提取

(1)顏色特征提取。將顏色空間RGB模型轉化成六角錐體(Hue,Saturation,Value,HSV)模型,RGB轉換到HSV的算法:

(2)紋理特征提取。應用局部二進制模式(local binary pattern,LBP)算子的過程類似于濾波過程中的模板操作,逐行掃描圖像,對于圖像中的每一個像素點,以該點的灰度作為閾值,對周圍3×3的8鄰域進行二值化,按照一定的順序將二值化的結果組成一個8位二進制數,以此二進制數的值(0~255)作為該點的響應。3×3區域的中心點,以其灰度值68作為閾值,對其8鄰域進行二值化,并且從左上點開始按照順時針方向(具體的順序可以任意,只要統一即可)將二值化的結果組成一個二進制數10 001 011,即十進制的139,作為中心點的響應。局部二進制模式算子見圖1。

圖1 局部二進制模式算子示意圖

1.4.3 細胞核分割

先對HE染色的早期胃癌組織病理圖像進行主成分分析,得到含有蘇木精顏色信息的灰度圖像后進行形態學預處理,得到較好的細胞核輪廓,運用快速徑向對稱變換提取種子點,將種子點標記在原圖中,進行后景標記后完成預分割,得到初始輪廓;進行曲線演化得到最終輪廓。分割算法步驟為:原始圖像→提取蘇木精染色通道的灰度圖→形態學操作→圖像預處理→快速徑向對稱變換→前景、后景標記→分水嶺變換→分水嶺分割線→主動輪廓模型→細胞核區域。

1.4.4 圖像組織學分級

應用SVM進行圖像分類時,整個過程劃分為訓練階段分類階段。在試驗步驟中,對所采集的圖像特征提取,然后分別對圖像分配類標簽1和2以組成樣本。將每個類別圖像總數的4/5作為訓練集,1/5作為測試集。即cT1a(M)級患者148幅圖像用于訓練,37幅圖像用于測試;cT1b(SM)級患者188幅圖像用于訓練,47幅圖像用于測試。每次劃分均采用隨機方法將圖像劃分為5份,共進行10次試驗,記錄每一次試驗被正確分類的各個類別的數量,取其平均數。分別在像素級別特征(pixel level features,PLF)、對象級別特征(object level features,OLF)及兩者組合(PLF+OLF)上進行試驗。試驗結果分別統計被正確分類和錯誤分類的正例與負例的平均數,SVM分類器的核函數為徑向基核函數,參數sigma=5。

1.5 觀察與評價指標

選取一幅典型的圖像并請病理科醫生對此圖像中的癌巢與間質作分割,在病理醫生的指導下隨機地劃分癌巢區域,選取100個典型的像素點,提取其顏色特征和紋理特征,一起組成正例樣本,同樣地在圖像中被劃分為間質區域里選取100個典型的像素點,也提取其顏色特征與紋理特征,一起組成負例樣本,將正例樣本和負例樣本組合在一起組成訓練樣本,并訓練LR、NB和SVM 3種分類器。

評估分類效果,以像素點數作為定量評估標準。將圖像分割成癌巢和間質兩個部分,因此定義真正例(TP)為被正確分割為癌巢區域的像素點數,假正例(FP)為被錯誤分割為癌巢區域的像素點數,真負例(TN)為正確分割為間質區域的像素點數,假負例(FN)為被錯誤分割為間質域的像素點數,查準率P=TP÷(TP+FP),查全率R=TP÷(TP+FN)。對比不同算法下癌巢分割效果。

2 結果

2.1 癌巢分割效果對比

SVM分類器的查準率和查全率分別為85.4%和81.6%,高于LR分離器(83.0%和80.0%)及NB分離器(82.2%和79.4%),3種分類器間比較均無統計學差異,見表1。

表1 三種分類器的分類效果

2.2 圖像組織學分級效果對比

在圖像組織學分級準確率中,cT1 a(M)級患者圖像與cT1 b(S M)級患者圖像二分類時,分類器在PLF 上的圖像組織學分級準確率為(23.6+36.8)÷(37+47)=71.9%,在OLF上的圖像組織學分級準確率為(23.0+36.5)÷(37+47)=70.8%,在兩者組合(PLF+OLF)上的圖像組織學分級準確率為(25.8+38.6)÷(37+47)=76.7%,相比于單獨PLF或OLF,兩者組合的圖像組織學分級準確率較高,與其他兩組比較差異均無統計學意義。cT1a(M)被正確分級的準確率為25.8÷37=69.7%,cT1b(SM)被正確分級的準確率為38.6÷47=82.1%,見表2;患者早期胃癌組織學分級圖像見圖2。

3 討論

HE病理圖像分析中,圖像質量的好壞直接影響識別算法的設計與效果的精度,原始的HE染色胃癌組織病理圖像中存在噪聲,因此在圖像分析(特征提取、分割、匹配和識別)前需要進行預處理[4]。圖像預處理的主要目的是消除圖像中無關的信息,恢復有用的真實信息,增強有關信息的可檢測性,最大限度地簡化數據,從而改進特征提取、圖像分割、匹配和識別的可靠性[5]。圖像預處理主要包括灰度化、去噪及對比度增強。

表2 cT1a(M)與cT1b(SM)患者圖像的分級情況(%)

圖2 早期胃癌組織病理圖

對HE染色圖像進行處理時,往往需要對3個通道依次進行處理,將會消耗很多時間。因此,為了達到提高整個應用系統的處理速度的目的,需要對彩色圖像進行灰度化以減少所需處理的數據量。在RGB模型中,如果R=G=B時,則彩色表示一種灰度顏色,其中R=G=B的值叫灰度值,因此,灰度圖像每個像素只需一個字節存放灰度值(又稱強度值、亮度值),灰度范圍為0~255[5]。根據重要性及其他指標,將3個分量以不同的權值進行加權平均。由于人眼對綠色的敏感最高,對藍色敏感最低,因此,對RGB3個分量進行加權平均能得到較合理的灰度圖像。

對圖像去噪時,濾波器有抑制噪聲和光滑化的作用,常用的濾波器有均值濾波、中值濾波和高斯濾波等[6]。高斯濾波器是一種線性濾波器,能夠有效的抑制噪聲,平滑圖像,其作用原理和均值濾波器類似,都是取濾波器窗口內的像素的均值作為輸出,其窗口模板的系數和均值濾波器不同,均值濾波器的模板系數都是相同的為1;而高斯濾波器的模板系數,則隨著距離模板中心的增大而系數減小[7]。因此,高斯濾波器相比于均值濾波器對圖像模糊程度較小。在比較各種濾波器效果之后選擇3×3模板大小的高斯濾波。

在對比度調整時,基于直方圖的對比度調整方法:直方圖均衡化通過使用累積函數對灰度值進行“調整”以實現對比度的增強。直方圖均衡化處理的“中心思想”是將原始圖像的灰度直方圖從比較集中的某個灰度區間變成在全部灰度范圍內的均勻分布。直方圖均衡化是對圖像進行非線性拉伸,重新分配圖像像素值,使一定灰度范圍內的像素數量大致相同,也是把給定圖像的直方圖分布改變成“均勻”分布直方圖分布。

在顏色特征提取中由于組織或細胞的不同成分,對蘇木精的親和力不同及染色性質不一樣。經蘇木精染色后,細胞核及鈣鹽粘液等呈藍色;再利用胞漿染料伊紅染胞漿,使胞漿的各種不同成分又呈現出深淺不同的粉紅色,這是區分不同組織對象的一個重要信息[8-10]。在圖像處理中,可以將一個具體的像素點所呈現的顏色分多種方法分析,并提取出其顏色特征分量。顏色特征是一種全局特征,描述了圖像或圖像區域所對應的景物的表面性質。一般顏色特征是基于像素點的特征,此時所有屬于圖像或圖像區域的像素都有各自的貢獻[9]。由于顏色對圖像或圖像區域的方向、大小等變化不敏感,所以顏色特征不能很好地捕捉圖像中對象的局部特征。此外,僅使用顏色特征查詢時,如果數據庫很大,常會將許多不需要的圖像也檢索出來。顏色直方圖是最常用的表達顏色特征的方法,不受圖像旋轉和平移變化的影響,進一步借助歸一化還可不受圖像尺度變化的影響。

紋理特征也是一種全局特征,其描述了圖像或圖像區域所對應景物的表面性質[11]。但由于紋理只是一種物體表面的特性,并不能完全反映出物體的本質屬性,所以僅僅利用紋理特征是無法獲得高層次圖像內容的。與顏色特征不同,紋理特征不是基于像素點的特征,需要在包含多個像素點的區域中進行統計計算。圖像的紋理特征有很多種,如灰度共生矩陣、Tamura紋理特征、自回歸紋理模型、小波變換、Gabor以及LBP等。

LBP方法是一種用來描述圖像局部紋理特征的算子,其作用是進行特征提取,提取圖像的局部紋理特征[12-13]。LBP是計算機視覺中用于圖像特征分類的一個方法,用于紋理特征提取。LBP紋理特征向量,一般以圖像分塊LBP直方圖表示。得到了整幅圖像的LBP紋理特征后,便可利用SVM或者其他機器學習算法進行分類。

分水嶺分割方法是一種基于拓撲理論的數學形態學的分割方法,其基本思想是將圖像看作測繪學上的拓撲地貌,圖像中每一點像素的灰度值表示該點的海拔高度,每個局部極小值及其影響區域稱為集水盆,而集水盆的邊界則形成分水嶺[14]。分水嶺算法是一種圖像區域分割法,在分割的過程中會把跟臨近像素間的相似性作為重要的參考依據,對圖像每個像素的灰度級進行從低到高排序,再從低到高實現淹沒過程中,對每一個局部極小值在h階高度的影響域采用先進先出(first in first out,FIFO)結構進行判斷及標注[15]。

本研究中,通過將顯微鏡下觀察的患者組織切片掃描到計算機上并制作成TIFF格式,該圖像集的分辨率為1024×1360。選取一幅典型的圖像并請病理科醫生對此圖像中的癌巢與間質作分割,在病理醫生的指導下隨機劃分癌巢區域,選取100個典型的像素點,提取其顏色特征和紋理特征,一起組成正例樣本,同樣的在圖像中被劃分為間質區域里選取100個典型的像素點,也提取其顏色特征與紋理特征,一起組成負例樣本,將正例樣本和負例樣本組合在一起組成訓練樣本,并訓練LR、NB和SVM的3個分類器。為評估分類效果,本研究以像素點數作為定量評估標準,將圖像分割成癌巢和間質兩個部分,因此定義真正例(TP)為被正確分割為癌巢區域的像素點數,假正例(FP)為被錯誤分割為癌巢區域的像素點數,真負例(TN)為正確分割為間質區域的像素點數,假負例(FN)為被錯誤分割為間質域的像素點數。結果顯示SVM分類器的查準率和查全率高于LR和NB分類器。

細胞核分割中,對HE染色的早期胃癌組織病理圖像進行主成分分析,得到含有蘇木精顏色信息的灰度圖像,然后用形態學操作進行預處理,去除干擾成分,得到較好的細胞核輪廓,再運用快速徑向對稱變換提取種子點,將種子點標記在原圖中,在進行后景標記后運用分水嶺變換完成預分割,將預分割得到的輪廓線作為主動輪廓模型的初始輪廓,進行曲線演化得到最終輪廓。

組織病理學上根據浸潤深度將早期胃癌分為cT1a(M)、cT1b(SM),在圖像組織學分級的試驗中,先提取圖像相關特征,如PLF及OLF等,OLF提取包括前面提到的分割的癌巢特征與細胞核特征,然后使用分類模型將圖像分類為1和2,分別為cT1a(M)和cT1b(SM)。本研究中,在cT1a(M)患者圖像與cT1b(SM)患者圖像二分類時,分類器在PLF上準確率為71.9%,在OLF上準確率為70.8%,在兩者組合(PLF+OLF)上的準確率為76.7%,相比于單獨PLF或OLF,兩者組合的準確率較高。cT1a(M)被正確分類的準確率為69.7%,cT1b(SM)被正確分類的準確率為82.1%。結果表明,從圖像分析的角度對圖像的組織學分級可行,而HE染色的早期胃癌組織病理圖像可以直接反映患者的胃癌狀態。

4 結論

HE染色的早期胃癌組織病理圖像的組織學分級可以在一定程度上代表患者的組織學分級。在HE染色早期胃癌組織病理圖像中癌巢分割中,SVM分類器的查準率和查全率較高,同時其對圖像組織學分級效果較好。

猜你喜歡
組織學像素點紋理
圖像二值化處理硬件加速引擎的設計
不同灸法對免疫抑制兔脾臟、胸腺影響的組織學研究
花刺參幼參攝食和消化器官形態學和組織學研究
基于局部相似性的特征匹配篩選算法
基于BM3D的復雜紋理區域圖像去噪
《呼吸道感染牛分枝桿菌對肝臟和腸道影響的病理組織學觀察》圖版
使用紋理疊加添加藝術畫特效
基于像素點篩選的艦船湍流尾跡檢測算法
基于canvas的前端數據加密
TEXTURE ON TEXTURE質地上的紋理
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合