?

人工智能在醫學CT圖像重建中的研究進展

2023-02-02 08:46李潤睿成煜斌
太原理工大學學報 2023年1期
關鍵詞:偽影正弦投影

李 青,李潤睿,強 彥,成煜斌,王 濤

(太原理工大學 信息與計算機學院,太原 030024)

計算機斷層掃描成像是一種可靠的、非侵入性的檢測技術,它可以檢測人體內部結構異常,如腫瘤、骨折、血管疾病以及細胞癌變等,除了為診斷提供支持,CT還可以指導各種臨床過程,包括介入、手術治療以及放射治療等疾病[1]。臨床上為了獲得具有診斷意義的高質量CT影像,所用的X射線劑量相對較高,而且會多角度重復采集多張影像數據。反復的CT掃描會讓患者暴露在巨大的輻射當中,過度輻射還會誘發癌癥、代謝異常、白血病或其他遺傳性疾病,對人體產生不可逆的影響,降低患者的生活質量[2]。因此,降低CT掃描輻射劑量不可避免地成為了研究者的關注熱點,并具有重要的臨床價值。

在臨床上,為了獲得低劑量的CT圖像,通常使用降低管電流減少X射線輻射;降低管電壓減少X射線穿透能力;減少X射線數目來降低輻射劑量。雖然在一定程度上改善了輻射劑量過高的問題,但是這些措施會極大地降低X射線信號的信噪比(signal-noise ratio,SNR),并導致低對比度CT圖像存在大量噪聲和偽影,成像質量的視覺退化會導致器官紋理和邊緣的模糊,從而降低臨床診斷和任務分析的可靠性[3]。然而,為了克服CT圖像的視覺退化,提高低劑量CT圖像的臨床可用性,重建出符合臨床需求的CT圖像是國內外研究者廣泛關注的、具有挑戰性的難點問題。

目前,人工智能在計算機視覺、自然語言處理以及醫學圖像領域取得突破性進展,尤其體現在醫學圖像處理領域,包括前期的PET/CT圖像重建[4]、MRI圖像病灶分割[5]、CT圖像檢索[6],以及后期的智能診斷[7]。隨著深度學習方法在圖像去噪、超分辨率、圖像識別、圖像檢測等[8-9]計算機視覺領域發展迅速,在圖像重建領域[10]也取得了初步應用。隨著硬件技術的快速發展,以及對高性能處理、數據驅動的執行加速了醫學成像領域深度學習方法的運用。因此,近年來,利用深度學習技術提出更優的CT重建方法成為研究人員的研究重點。

本文重點總結了深度學習算法在CT重建領域的應用,分析不同算法在CT圖像的降噪精度、病變識別能力以及保持精細結構和紋理細節等方面的重建能力。本文的整體框架如圖1所示,我們首先詳細描述了CT圖像重建問題,然后對醫學CT圖像重建方法進行全面介紹,主要分為傳統的CT重建算法,以及近幾年發展迅速的深度學習重建算法。

圖1 人工智能方法在CT圖像重建中的應用Fig.1 Application of artificial intelligence methods in CT image reconstruction

在深度學習重建算法中又包含了四類方法,分別為:對原始數據進行預處理的投影域CT圖像重建、圖像后處理的圖像域CT圖像重建、雙域網絡CT圖像重建以及直接映射CT圖像重建,突出了基于深度學習的CT圖像重建應用在模型性能、結構保存和病變判別方面的具體貢獻。隨后,還回顧了不同CT重建中常用的數據集和損失函數的多樣性,討論了重建過程中存在的問題和未來的研究方向。

1 CT圖像成像概述

圖像重建是將從成像設備收集的原始數據形成可解釋圖像的過程。在已知一組測量值的前提下,目標是確定影響接收器收集信號的原始圖像結構,這一過程被稱為逆問題。設y是一組原始采集的傳感器測量值,在采集過程中收到一些固有噪聲N的影響,目標是恢復空間域的圖像x,將這一過程用公式(1)描述:

y=A(F(x),N) .

(1)

其中,F(·)代表成像物理結構進行建模的正向操作運算,一般包括雷登變換(Radon)或傅里葉變換,它可以是線性操作,也可以是非線性操作,具體取決于成像模式。A表示噪聲和信號之間的相互作用。圖像重建還是一個不確定的問題,因為測量值(M)往往比未知數(N)少得多。

從數學層面上理解,這個問題具有高度不確定性,因為描述模型的方程個數遠遠小于未知數的個數,可能有無限一致的圖像映射到相同的測量值。因此,重建算法的一個挑戰是從一組潛在的解決方案中選擇最佳解決方案[11]。CT圖像的稀疏視圖、有限角采樣、降低輻射劑量通常會減小測量信號y的大小,同時增加其稀疏性和噪聲水平,從而增加重建問題的不適定性和復雜性。這就提出了對具有高特征提取能力的復雜重建算法的需求,重建算法要最大限度地利用收集的信號以及先驗知識,捕捉特定于模態的成像特征。此外,開發高質量的重建算法不僅需要對成像系統的物理和生物醫學結構都有深入的了解,而且還需要專門設計的算法來解釋測量的統計特性并容忍測量數據中存在的誤差。

經過五十多年的努力,醫學CT圖像重建領域取得了長足的進步,大致可以分為兩類:傳統方法和基于深度學習的方法。傳統方法得到了廣泛的研究,重點放在如何改進重建結果[12]以及降低其計算成本[13]。最近,受深度學習在計算機視覺問題中的成功啟發,研究人員研究了用于各種生物醫學圖像重建問題的深度學習方法。在過去幾年中,CT圖像重建領域逐漸成為了一個非?;钴S的研究領域,并發表了一系列專題??痆14-16]。接下來,對傳統方法在CT圖像重建中的應用進行了概述,討論了它們的優點和局限性,以及深度學習范例在該領域的應用,并對傳統方法進行了補充和改進。

2 傳統方法在CT圖像重建中的應用

傳統的CT圖像重建算法考慮了測量和噪聲的統計特性以及成像系統的硬件設備,從分析方法發展到迭代或基于優化的方法,大致可分為三類:即正弦圖域濾波、迭代重建和圖像域恢復[17]。雖然這些方法在重建精度和偽影減少方面有了顯著的改善,但它們仍然存在一些缺點,在實際臨床應用中往往受到限制。

有個理發師,理發時總講些妖魔鬼怪的故事,問他為什么。他說:“我講這些故事的時候,你的頭發就會豎起來,這樣我理起發來就容易得多了?!?/p>

通常,CT圖像重建方法是低劑量CT圖像到正常劑量CT圖像的映射。重建后CT圖像處理技術雖然不需要投影數據,也比以上兩類方法更簡單,但由于復雜噪聲在圖像域的分布不均勻等統計特性,依據噪聲模型估計噪聲分布降低了去噪的性能,導致重建效果不佳。近年來,深度學習通過訓練多層深度卷積網絡,實現對輸入數據信息特征的提取、分析和處理。

2.1 正弦圖域濾波方法

基于正弦圖域濾波的重建方法主要目的是從低劑量X射線束獲得的CT原始數據中濾除噪聲,通過直接對反投影前形成的原始投影數據進行重建,可以準確地計算噪聲統計量并進行有效重建。一些研究人員應用傳統的去噪技術處理數據,典型的方法有:結構自適應濾波[18-19]、雙邊濾波[20],這類方法主要通過改善濾波器進行去噪過程。另外一些經典的方法,比如:懲罰似然法[21]、加權最小二乘算法[22],這些方法的共同點都是對物理特性和光子統計特性結合起來去噪,是目前流行的正弦圖域濾波方法。然而,這些方法通常計算成本不高(毫秒量級),并且可以在無噪聲、全采樣或所有角度投影的假設下生成良好的圖像質量[23]。正弦圖域濾波方法通常只考慮成像系統的幾何形狀和采樣特性,而忽略系統物理特性和測量噪聲的細節[24],當處理有噪聲或不完整的測量數據時,例如降低測量采樣率,重建結果會隨著信號變弱而嚴重退化,并且無法恢復信號中的缺失信息,從而導致診斷性能受損。另外,重建過程預測數據過分依賴CT設備供應商的完備數據以及CT掃描儀無法獲得的原始數據,這些數據大多數不能公開訪問。

2.2 迭代重建方法

迭代重建方法基于成像系統的物理、傳感器和噪聲統計的更復雜的模型,將傳感器域(原始測量數據)中數據的統計特性、圖像域中的先驗信息,有時還將成像系統的參數組合到其損失函數中。與正弦圖域濾波方法相比,迭代重建算法提供了更靈活的重建框架,并且以增加計算量為代價對噪聲和不完整數據表示問題具有更好的魯棒性[25]。

迭代重建依賴于圖像的先驗信息,通過在正弦圖和圖像域之間迭代來進行降噪,它將重建過程看作函數求解最優解的逆問題,首先設計正則項,接著優化目標函數,直到獲得較好的信噪比(SNR)才停止迭代過程?;谌兎?total variation,TV)的先驗[26]被廣泛應用于迭代重建研究中,雖然TV通過更適合于分段恒定圖像的非平滑絕對值對梯度稀疏性提出了很強的假設,但是在最終的重建中,TV往往會造成細節模糊和斑塊紋理等偽影現象。除此之外,研究人員利用豐富的特征信息克服重建過程中出現的偽影問題,例如TV的變體[27],非局部均值[28],小波方法[29]和字典學習[30]??傮w而言,盡管迭代重建方法與正弦圖域濾波方法相比提高了準確率并減少了偽影,但它們仍然面臨三個主要問題:第一,迭代重建技術往往是特定于供應商的,掃描儀幾何形狀和校正步驟的細節對用戶和其他供應商不開放。其次,由于每次迭代所需的投影和反投影操作的負載,迭代重建技術相關的計算開銷很大,這些方法的計算成本通常比正弦圖域濾波方法高出幾個數量級。最后,重建質量高度依賴于正則化函數和相關的超參數設置,需要手動調整才能達到較優的效果。種種因素限制了迭代重建技術在臨床中的應用。

2.3 圖像后處理重建方法

與正弦圖域濾波方法和迭代重建方法不同,基于圖像域的重建被認為是一種后處理方法。圖像后處理重建算法直接應用于CT圖像,而不是原始投影數據,相比于迭代重建方法,它的重建速度非???,而且不需要供應商提供原始數據,它可以很輕松地集成到CT設備的工作流程中。諸如非局部均值過濾方法[31]、基于字典學習的方法[32]、塊匹配算法[33]和基于統計的算法[34]等。盡管圖像域后處理方法非常靈活,但在算法實現過程中由于噪聲的非均勻性而無法計算其統計量,削弱了CT重建的準確性。此外,它還存在模糊CT圖像的結構信息等問題。因此,現有的圖像后處理重建方法及其局限性為提出新的CT重建方法提供了方向。

3 深度學習方法在CT圖像重建中的應用

深度學習是人工智能的一個分支學科,它利用經驗自動學習和改進應用程序,通過構建深度神經網絡處理各種任務。深度學習模型由多層特征表示(除了輸入層和輸出層之外的多個隱藏層)組成,從原始輸入開始通過多層網絡提取不同抽象層次的特征表示,從而使復雜函數的學習成為可能[35];它的關鍵特征是利用所提供的數據樣本自動學習用于特征提取的所有參數,與人工特征方法相比,可以更好地針對特定問題進行自我優化。當輸入是圖像時,低層特征通常表示圖像中的邊緣和輪廓,而高層特征通常是語義特征[36]。

臨床上,醫學圖像一直被用于疾病的診斷和治療。圖像處理技術用于改善圖像質量、圖像分析以幫助臨床醫生解釋圖像。自動和半自動的圖像分析方法不僅節約了大量時間,而且提高了圖像分析的準確性,同時還增加了臨床醫生執行醫療程序所需的解釋任務的可靠性[37]。深度學習目前已成功應用于醫學圖像分析任務,如分類、分割、配準、邊緣檢測等[38],如今,在醫學圖像重建領域也逐漸被廣泛應用。

在CT圖像重建領域,深度模型可以捕獲高級特征顯示了它在整個數據驅動學習過程中學習CT圖像上的不確定噪聲分布能力,此外,數據驅動學習方法可以有效地適應任何噪聲類型。因此,深度學習方法可以顯著提高CT圖像重建的整體性能[39]。CT圖像重建是利用投影數據進行的,但是,當投影數據不夠完整,掃描時間短以及掃描角度范圍有限的情況下會導致投影數據不完整,傳統的重建方法可能并不適用,極大可能導致重建圖像中的階梯效應或塊狀偽影,甚至在重建圖像的邊緣出現偽影。目前,深度學習方法已用于應對這些挑戰,與現有的傳統方法相比,圖像重建準確率更高,并且有效地降低了噪聲,提高了空間分辨率,在圖形處理單元上執行速度更快。根據CT圖像的成像特性,本文將基于深度學習的CT圖像重建方法劃分為四個子類,即投影域CT圖像重建、圖像域CT圖像重建、雙域網絡CT圖像重建和直接映射CT圖像重建。圖2描述了深度學習方法用于CT圖像重建的四個子類。

圖2 深度學習方法用于CT圖像重建的四個子類Fig.2 Deep learning methods are used in four subclasses of CT image reconstruction

3.1 投影域CT圖像重建

投影域CT圖像重建問題表述為投影域圖像利用深度學習方法從不完整的數據表示(低劑量、數據稀疏、有限角)到完整數據表示(正常劑量)的回歸問題。這一階段的主要目標是利用深度學習模型估計在信號采集階段沒有采集到的缺失部分,以便將更完整的信號信息輸入到濾波反投影層進行重建過程。LIANG et al[40]提出一種深度殘差卷積神經網絡,用于在濾波反投影重建圖像的同時,從未測量的視圖進行精確的全視圖估計。這種方法可以使重建速度加快,條紋偽影減少并且重建出更多重要的圖像細節,但是由于噪聲不僅存在于不完整的數據采集中,而且也存在于完整的數據采集中,最小化參考值和預測值之間的誤差導致模型預測采集完整的數據圖像時可能會缺乏紋理細節。LEE et al[41]提出了一種基于深層神經網絡的稀疏CT正弦圖合成方法,利用插值法對稀疏CT正弦圖中缺失數據進行填充,提供了綜合完整的數據。但是,數據集中數據的冗余度較高,訓練網絡時間較長,在扇束CT、錐束CT和螺旋多扇束CT以及不規則角度采樣方面還尚待解決??紤]到有限的訓練數據集和深度學習對數據擾動的敏感性,特別是在噪聲和不完整數據的情況下,基于深度學習的方法可能無法推廣到新的測試實例,HUANG et al[42]通過約束重建圖像與測量的投影數據一致性,同時利用基于學習的方法補充未測量到的投影數據信息,可以提高重建質量。LI et al[43]針對GAN產生缺失信息的特點,提出了U-Net生成器和鑒別器正弦圖修復GAN方法來恢復缺失的正弦圖數據,以抑制正弦圖的奇異性進行有限角重建,使正弦圖修復GAN適用于標準醫學CT圖像。DONG et al[44]提出了一種針對不完全CT數據的深度學習重建框架,從給定的稀疏視角和有限角度的不完全投影正弦圖中重建出高質量CT圖像。FU et al[45]提出了一種不完全數據深度學習重建框架,該框架能夠以更快的速度和更少的參數獲得更好的成像質量。CHOI et al[46]開發了一種自監督的去噪方法,用于提高低劑量投影圖像質量。MA et al[47]提出了一種注意殘余密集卷積神經網絡來對信號圖進行去噪,并且比傳統濾波方法獲得了更好的性能。

深度學習方法應用于投影域CT重建用于恢復不完整數據信息,不完整數據當做先驗信息補全缺失信息,然后利用傳統的重建算法來整合信息,并約束重建圖像與所獲取測量數據的一致性。雖然投影域中的深度學習方法可以減少投影域中信號損失,并顯著提高重建圖像質量。然而,由于重建過程對正弦圖的內在一致性很敏感,任何對正弦圖的不當操作都可能在整個重建圖像上引入額外的偽影;此外,深度學習方法提取的特征僅限于投影域,對于完備的投影數據在圖像域的重建過程仍然存在缺陷。深度學習方法在投影域中CT重建中的應用總結如表1所示。

3.2 圖像域CT圖像重建

圖像域CT圖像重建的任務是學習低質量重建圖像和高質量重建圖像之間的映射。雖然現有的迭代重建方法改善了重建圖像質量,但計算代價太大,并且在有噪聲或不完整信息(數據稀疏采樣等)情況下仍然可能出現重建偽影[48]。重建效果不佳的主要原因來自于噪聲的非平穩特性和由于信息丟失而產生的嚴重條紋偽影。CT圖像中噪聲和偽影很難分離,它們具有很強的幅值,并且不服從圖像域中特定的模型分布[49]。與人工設計的濾波器相比,深度神經網絡提供的復雜模式的自動學習具有明顯優勢。

深度學習方法首次引入CT圖像重建是在2016年由美國醫學物理學家協會(AAPM)組織的低劑量X射線CT挑戰賽上,KANG et al[50]使用了三層卷積神經網絡重建CT圖像,獲得了顯著的性能提升。2017年,CHEN et al[51]基于反卷積網絡和跳躍連接相結合引入了編解碼卷積神經網絡用來對稀疏性CT圖像重建進行研究,該網絡的去噪效果令人滿意,獲得了較高的峰值信噪比。XIE et al[52]基于編解碼網絡提出DEARE框架,從少數視圖數據重建出三維CT圖像,然而,還需要更多的實驗來優化和驗證該網絡結構。隨著生成對抗網絡(GAN)的出現,YANG et al[53]利用Wasserstein距離代替JS散度,并在MSE損失的基礎上引入VGG損失函數,不僅克服了梯度消失而且還保留了LDCT的細節信息。HUANG et al[54]將注意力機制引入CycleGAN的生成器中進行LDCT去噪,并取得了可喜的成績。LI et al[55]通過建立局部輸出與同一卷積層內其他像素之間的相互作用來指導卷積濾波,證明了通過自注意模型解決去噪問題的能力,并提出平面注意力網絡和深度注意力網絡處理CT層內和層間的長期依賴關系,進一步提高去噪性能。YIN et al[56]提出一種基于非配對數據的WGAN模型用于肺部CT圖像去噪,基于VGG-19網絡計算的殘差連接和多感知損失提高了GAN模型的降噪效果和紋理保持性。CHI et al[57]提出的LSGAN生成器網絡中使用inception殘差塊來防止每個卷積層中的噪聲通過快捷連接傳遞到反卷積層,并設計多重損失函數來優化去噪網絡。MA et al[58]利用LSGAN網絡結合混合損失函數進行LDCT的噪聲學習,可以得到較好的去噪效果,但是在像素級相似性評估中表現欠佳。YANG et al[59]利用兩個基于U-Net的生成器對CT圖像進行去噪,第一個生成器的目標是對LDCT的高頻段進行處理,以提高生成器對高頻細節的敏感度;第二個生成器將經過優先處理的LDCT圖像的高頻帶和低頻帶合成重建的CT圖像。此外,與其他基于GAN的應用不同,文中還提出了一種帶有inception模塊的多尺度鑒別器,用于提取LDCT圖像的多尺度特征。與傳統的具有兩個生成器的CGAN模型不同,GU et al[60]提出的條件GAN模型使用了基于U-Net網絡的單一生成器來降低LDCT噪聲,使用自適應實例歸一化層通過切換生成器模型來執行低劑量到高劑量的圖像轉換。SHAN et al[61]將模塊化CNN與來自三家知名供應商的典型迭代重建方法進行了比較,模塊化CNN得到了有競爭性的LDCT重建結果。為了達到CT圖像超分辨率重建目的,YOU et al[62]開發了一個受恒等、殘差和循環學習集成約束的GAN-Circle網絡,結合了深度CNN、殘差學習和網中網技術進行特征提取和恢復,并采用了循環Wasserstein回歸對抗性訓練框架。

表1 深度學習方法在投影域CT重建中的應用Table 1 Application of deep learning method in projection domain CT reconstruction

GOU et al[63]基于ResNet模型提出了基于梯度正則化的目標函數,該算法獲得良好訓練效果和保持LDCT圖像特征清晰度的能力。GHOLIZADEH-ANSARI et al[64]提出基于ResNet和邊緣檢測的膨脹卷積網絡架構,可以學習到更多邊緣特征信息。MING et al[65]提出了一種用于LDCT恢復的DenseNet算法,通過減少連通性模式,在訓練網絡的同時提高每個塊的計算效率。除此之外,SHIRI et al[66]還利用膨脹卷積和ResNet提出了增強新冠肺炎CT圖像數據質量的建議。JIANG et al[67]利用膨脹卷積,提出多尺度并行CNN模型用于肺部CT圖像去噪,該模型既降低了噪聲,又保留了低劑量肺部CT的細節特征和紋理特征。HUANG et al[68]利用ResNet估計每個小波變換子帶的殘差,對小波變換的LDCT圖像和NDCT圖像中的兩級去噪模型進行了訓練,實現了紋理保持和結構增強。與上述ResNet相反,ZHONG et al[69]通過兩階段遷移學習策略對網絡進行了微調,第一階段使用帶有盲高斯噪聲的自然圖像,第二階段使用LDCT圖像。ZHANG et al[70]提出了一種集成了深度學習網絡和成像物理優勢的自監督混合CT超分辨率模型。ATAEI et al[71]級聯兩個相同的神經網絡,通過最小化感知損失重建出低對比度區域的精細結構細節。CHOI et al[72]提出了一種基于深度學習的LDCT圖像復原方法,結合正弦圖域的噪聲統計以及圖像域中的噪聲特性,在不增加偽影的情況下,成功降低了噪聲水平,恢復了圖像細節。LI et al[73]結合小波變換和亞像素卷積,提出了一種自頂向下的自適應自引導小波卷積神經網絡,引入了可調金字塔殘差塊和相鄰尺度信息融合塊,自適應提取多尺度、多樣性以及相鄰尺度之間的信息特征,同時,利用交叉緯度混合注意塊對融合后的有效信息進行增強,無用信息進行抑制。該方法能有效地保留CT圖像的結構和紋理信息,同時去除噪聲和偽影。LI et al[74]利用膨脹殘差卷積神經網絡和注意力模塊,提出了一個多階段的網絡架構,將整個去噪過程分為兩個階段的子網絡,逐步完成去噪任務,通過自編碼器神經網絡,利用自監督學習方案訓練一個專門針對CT圖像的感知損失,細化特征信息的同時還保留圖像結構細節特征以及紋理信息。

在稀疏視圖、有限角測量和噪聲干擾情況下,初始投影域重建后圖像可能包含即使通過深度學習模型也難以去除的復雜偽影和噪聲。與計算機視覺中的許多逆問題(如圖像修復)一樣,初始重建中丟失的信息也很難通過后處理過程進行恢復。因此,圖像域CT重建更適合于處理質量相對較好的圖像重建。圖像域CT重建中網絡模型通常采用濾波反投影等算法作為輸入,僅適用于去除投影域圖像中噪聲偽影的圖像域,不能保證采樣的正弦圖數據得到保留。然而,采樣的正弦圖是圖像源數據,重建前后應盡可能保持相同,以確保重建內容的高保真度。如果只利用圖像域中包含的信息,而忽略了另一個域中的補充信息,方法的魯棒性會受到質疑。盡管已有許多學者研究圖像域CT重建方法,但是CT成像過程各個環節的中間域數據復雜,如何有效利用這些數據恢復圖像的結構和邊緣信息仍然是一個挑戰。深度學習方法在圖像域CT圖像重建中的應用總結如表2所示。

3.3 雙域網絡CT圖像重建

在強大的表示能力和海量數據的輔助下,基于深度學習的方法已經在醫學圖像重建任務中取得了成功。然而,上述方法都是基于單一域進行重建,雖然這些方法可以方便地應用于原始正弦圖或相應的FBP重建圖像,計算量相對較小,模型復雜度較低,但它們要么僅適用于去除已重建圖像中噪聲偽影的圖像域,要么僅適用于從稀疏正弦圖合成完整正弦圖的投影域,投影域數據和圖像域數據之間缺乏信息交互,影響重建效果進一步提升。因此,研究人員已經開展了在雙域網絡中進行CT圖像重建研究。

CHEN et al[75]引入專家場系統(Experts Assessment)作為正則化項,通過梯度下降法形成迭代數值,在固定迭代次數下,迭代過程展開成網絡,網絡參數和正則化項可以通過數據集進行訓練。GUPTA et al[76]利用卷積神經網絡取代投影梯度下降過程。受ADMM-Net[77]的啟發,HE et al[78]提出在數據域和圖像域同時約束重建問題,并將基于乘子交替方向法的優化方法展開為網絡,可以有效地加快重建速度,避免參數調整,但測量結果僅被用作數據一致性約束,沒有很好地挖掘數據域中的先驗信息。WANG et al[79]提出基于U-Net的圖像重建框架,在保留圖像結構的同時去除噪聲和角度偽影,但計算量大,需要較大的訓練數據集。VISHNEVSKIY et al[80]對每個迭代模塊采用指數加權損失,以確定迭代優化的方向。由于這種方法需要對每一迭代塊中的中間圖像進行投影校正,因此重建結果通常具有較高的重建精度,這對醫學診斷具有重要的臨床意義。然而,空間卷積是一種局部算子,只關注相鄰像素,忽略了CT圖像數據包含豐富拓撲結構信息。為了同時提取LDCT數據的像素級和拓撲級特征,XIA et al[81]提出了一種同時在圖像和流形空間中執行的流形和圖形一體化卷積網絡用于LDCT重建。PAN et al[82]提出一種多域集成Swin變換網絡,將數據、殘差數據、圖像和殘差圖像的豐富領域特征結合在一起,能夠捕捉重建圖像的全局和局部特征,具有更好的重建圖像質量、特征恢復和邊緣保護。YIN et al[83]提出一種區域漸進式三維殘差卷積網絡,網絡包括正弦圖域網絡(SD-Net)、濾波反投影(FBP)和圖像域網絡(ID-Net)三個階段重建過程,在提高最終的LDCT質量方面起到互補作用。ZHENG et al[84]構造投影域的卷積神經網絡來估計缺失投影數據,采用線性解析算子將數據從投影域轉換到圖像域,在圖像域中增加卷積網絡進行圖像細化。ZHOU et al[85]提出了一種級聯殘差密集空間通道注意網絡用于有限視角CT重建,由殘差密集空間通道注意網絡和投影數據保真層確保預測投影數據保真度,同時允許梯度反向傳播。ZHANG et al[86]提出的learn++模型集成了兩個并行交互的子網絡,同時在圖像域和投影域進行圖像恢復和正弦圖修復操作,能夠充分挖掘投影數據和重建圖像之間的潛在關系。WANG et al[87]設計了一種用于正弦圖和CT圖像重建的深度網絡,由濾波反投影層連接的兩個級聯塊組成,前者負責去噪和補全正弦圖,后者用于去除CT圖像中的噪聲和偽影。XIE et al[88]提出一種直接從正弦圖重建圖像的雙網絡結構,通過逐點全連通層學習反投影過程,在所需內存降低、參數減少的情況下獲得了具有競爭力的重建結果。LIANG et al[89]比較了稀疏視角CT重建與投影域網絡、圖像域網絡以及投影域和圖像域相結合的綜合網絡的圖像重建性能,通過對真實掃描的CT圖像進行數值模擬投影,投影域和圖像域相結合的綜合網絡可以有效重建出豐富的高頻結構信息。WANG et al[90]開發了2D膨脹殘差網絡對低劑量投影圖進行去噪,同時設計自注意2D殘差編碼器-解碼器網絡,以獲得具有清晰邊緣和紋理的CT圖像。

表2 深度學習方法在圖像域CT重建中的應用Table 2 Application of deep learning method in image domain CT reconstruction

續表2

基于雙域網絡的CT圖像重建方法比基于單域網絡的重建方法需要更大的GPU內存來進行訓練,重建過程也更加復雜,參數相對較多,但是這種方法的有效性和通用性也表明它可能解決圖像重建領域以外的超分辨率、灌注CT反卷積等領域的優化和逆問題,為現有的深度學習技術帶來了更強的穩健性和可靠性。深度學習方法在雙域網絡CT重建中的應用總結如表3所示。

3.4 直接映射CT圖像重建

直接映射CT圖像重建通過學習正弦圖和CT圖像空間之間的映射,同時近似逆問題的基本物理模型,使用深度神經網絡直接從投影域數據解碼為CT圖像。這種直接估計模型受益于深度學習模型的多級抽象和自動特征提取能力,在CT圖像重建領域也開始廣泛應用。

2018年哈佛醫學院的ZHU B教授團隊[91]在《Nature》上發表了關于醫學圖像重建的論文,它將圖像重建重新定義為一個數據驅動的監督學習任務,將其命名為流形近似自動變換(Automap),學習傳感器域和圖像域之間的重建映射關系,利用三個全連接層和兩個卷積層深度神經網絡實現重建過程。在這個新的范例中,CNN學習了復雜的CT圖像重建過程,包括域變換和數據過濾。然而,全連接層使得自動映射網絡難以實現,這種方法中的網絡在重建大尺寸醫學圖像時需要大量的計算資源。FU et al[92]將輸入和輸出數據映射到分層網絡體系結構上解決重建問題,其參數比一般網絡所需的參數要少得多。LI et al[93]開發了一種深度神經網絡,并證明該網絡可以將完整或不完整的線積分數據訓練成高定量精度重建圖像。在CT重建領域取得早期成功后,還將投影域直接映射到圖像域的方法擴展到PET圖像重建[94-95]。

直接將原始數據映射到圖像的一個主要限制是對大數據的嚴重依賴和昂貴的計算成本,特別是巨大的GPU內存需求。此外,專用神經網絡僅限于一種特定的重建幾何,并不廣泛適用于各種掃描儀體系結構和掃描協議。因此,在CT醫學成像領域仍然是一個具有挑戰性的問題。深度學習方法在直接映射CT圖像重建中的應用總結如表4所示。

表3 深度學習方法在雙域網絡CT重建中的應用Table 3 Application of deep learning method in CT reconstruction of dual-domain network

表4 深度學習方法在直接映射CT圖像重建中的應用Table 4 Application of deep learning method in direct mapping CT image reconstruction

4 常用數據集及損失函數

4.1 常用數據集及增加訓練樣本的方法

基于深度學習的重建算法很大程度上依賴于訓練數據集的大小和多樣性來達到較高的訓練精度。表5中總結了在圖像重建領域中常用的標準數據集,然而,與這些數據集相關的數據量還不足以在LDCT重建中獲得高性能。因此,在此基礎上還詳細介紹了增加CT數據可用性的方法,以有效地訓練和驗證深度學習模型。

正常劑量和低劑量的配對CT數據集對于深度學習模型的訓練和驗證至關重要。在臨床操作中,對患者的重復掃描是獲得成對數據的唯一方式。然而,在臨床實踐中,這種操作是不被允許的,當患者長期暴露在X射線的輻射中,會對患者身體造成不可逆的損傷。此外,CT圖像的正弦圖數據是特定于供應商的,不允許從第三方提取。有監督的深度學習模型中,必須有成對的NDCT和LDCT圖像,常用的解決方案是將泊松噪聲和高斯噪聲添加到從NDCT獲得的正弦圖中模擬生成不同劑量的LDCT圖像。根據模擬正弦圖數據變換方法的不同,在LDCT圖像重建中廣泛使用的主要有Siddon射線驅動算法、基于Radon變換的算法和基于正向投影的算法。除此之外,研究人員還提出利用不成對的訓練數據和噪聲先驗來訓練深度學習模型。

表5 CT圖像重建中常用數據集Table 5 Datasets commonly used in CT image reconstruction

為了解決數據量不足的問題,研究人員利用旋轉和翻轉來增加訓練數據集中的樣本數量,與數據增強相比,基于圖像塊的訓練加快了網絡收斂,不僅有助于增強局部區域中感知方差的檢測,同時增加訓練樣本的數量。

4.2 損失函數的多樣性

CT圖像重建方法性能不僅取決于網絡結構和訓練數據,還取決于訓練過程中使用的損失函數。損失函數用來評估數據在特定深度學習模型中的建模效果,通常由一個或多個函數組成,對重建的最終圖像質量有很大的影響。表6中列出了常見的損失函數及其優勢。

均方誤差(mean square error,MSE)是許多深度模型中廣泛使用的損失函數,雖然它很容易優化,但是平均值操作會導致紋理信息丟失、過渡平滑以及生成虛假病變等問題[55],如果訓練數據本身帶有噪聲,這種影響尤為突出。為了優化此類問題,最小絕對誤差(least absolute error,LAE)作為MSE的替代方法成為了優化深度學習模型的一種較理想的方法,雖然也同為基于均值的逐像素比較矩陣,但是實驗結果證明它可以克服MSE損失引起的圖像模糊問題[39]。然而,由于退化圖像中存在大量塊狀偽影,通過基于LAE優化的深度學習模型獲得的重建圖像仍然存在失真現象。當預訓練網絡VGG-16和VGG-19發布后,將感知損失引入深度學習模型優化過程中,來克服MSE和LAE造成的重建圖像退化問題。感知損失被用來計算生成CT圖像和真實CT圖像之間的特征差異,但僅利用感知損失重建出的圖像更易導致網格偽影,因此,感知損失通常與MSE相結合來優化深度學習模型。

表6 基于深度學習重建模型中常用損失函數Table 6 Reconstruction of commonly used loss functions in models based on deep learning

由感知驅動的結構相似性指數(structural similarity index measure,SSIM)通過局部圖像塊的統計特性來確保深度學習模型的結構保持能力,在視覺評估中,SSIM表現優于MSE,提供了更高的峰值信噪比[39]。在CT圖像重建發展進程中,生成對抗網絡(GAN)也受到了極大地關注,盡管GAN能夠生成與目標分布具有相似紋理的圖像,但并不一定得出在解剖學上正確的結果。尤其是在數據量不足的情況下,GAN網絡還會引入新的偽影結構,雖然這種偽影結構在自然圖像中是可取的,但是在醫學成像領域必須避免這種偽影生成。因此,基于像素的內容損失L1和L2常常被添加到GAN損失中引導圖像的內容信息重建過程。研究證明,基于對抗性損失的GAN網絡導致了收斂問題[53],因此,在文獻[96]的啟發下,研究人員通過引入帶梯度懲罰的Wasserstein距離作為損失函數來克服收斂性問題,利用循環GAN網絡和最小二乘GAN的循環一致性損失和最小二乘損失作為損失函數克服GAN網絡訓練過程存在的問題。

5 挑戰與展望

綜上所述,基于人工智能的深度學習CT重建方法與分析、迭代和壓縮感知方法相比,可以獲得更好的圖像質量,大量研究人員提出的先進性方法也印證了深度學習在CT圖像重建領域的成功,然而,深度學習CT重建方法快速發展的背后依舊存在許多問題,嚴重阻礙了它在臨床實踐中的廣泛應用。

1) 模型可解釋性問題。深度學習的過程是一個黑匣子,這意味著沒有直接的物理模型或者提供理論機制來解釋如何將輸入轉化為輸出,因此,深度學習重建模型很難被臨床醫生接受。近年來,通過構建可解釋性的神經網絡或者利用各種可視化技術來提高模型的可解釋性成為基于深度學習的自然圖像分析領域的熱門話題,未來研究人員也將在構建可解釋和高性能的深度學習重建模型方面做出努力。

2) 模型泛化性問題。泛化性意味著模型在從給定的數據中學習并將學習到的模型應用到其他領域的能力。與自然圖像不同,當經過訓練的深度學習模型應用于來自不同供應商的掃描儀數據集時,醫學圖像的分布會有很大不同,模型的泛化能力會成為一個重大問題[97]?,F有深度學習模型應用于終端用戶數據時可能會造成性能大幅下降,構建能夠在臨床應用中保持性能的健壯模型對于推廣模型的應用至關重要。

3) 算法的不穩定性問題。雖然深度學習算法已經表現出準確的重建效果,但目前基于深度學習的重建算法仍然缺乏穩定性,其中,不穩定問題主要包括:(1) 關于某些微小噪聲擾動的不穩定性;(2) 關于微小結構變化的不穩定性;(3) 關于樣本數量變化的不穩定性。在醫學成像中,穩定且準確的圖像重建方法是用于疾病診斷的必要條件,因此,提高算法準確性的同時,保證其穩定性至關重要。

4) 訓練數據集的質量和數量。眾所周知,深度學習方法是一種數據驅動的方法,模型性能很大程度上依賴于訓練數據集的質量和數量,構建一個全面的訓練數據集至關重要。但是,大量的高質量數據來源于臨床,在商業應用中使用臨床成像數據可能會存在法律和倫理問題,通過不同來源收集并構建大型醫學圖像數據集是很困難的。此外,缺乏高質量帶標簽的大型臨床數據集是深度學習應用于醫學圖像重建領域的障礙之一。

6 結束語

本文綜述了國內外CT圖像重建方面的研究現狀,分析了CT圖像退化原理,對基于傳統方法及深度學習方法在CT圖像重建領域的應用進行分類討論,并且分析其優缺點;其次,介紹了目前大部分方法中使用的公開數據集及現階段增加訓練樣本的方法,最后對重建過程采用的損失函數的性能進行了評測和總結分析。目前,臨床上對自動化醫學圖像分析的需求不斷增加,以幫助醫師實現高效和準確的基于成像的診斷和決策,這為基于深度學習的方法在臨床上的廣泛應用提供了大量機會。隨著計算能力的快速發展和深度學習模型的優化,深度學習有望在實現快速、便攜、安全和廉價的醫學成像方面發揮重要作用。

猜你喜歡
偽影正弦投影
正弦、余弦定理的應用
解變分不等式的一種二次投影算法
基于最大相關熵的簇稀疏仿射投影算法
找投影
找投影
核磁共振臨床應用中常見偽影分析及應對措施
基于MR衰減校正出現的PET/MR常見偽影類型
“美”在二倍角正弦公式中的應用
正弦、余弦定理在三角形中的應用
減少頭部運動偽影及磁敏感偽影的propller技術應用價值評價
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合