?

面向CT成像的深度重建算法研究進展

2022-03-13 02:35陸志凱
中國體視學與圖像分析 2022年4期
關鍵詞:先驗投影神經網絡

吳 凡, 劉 進,, 張 意, 陳 陽, 陸志凱

(1. 安徽工程大學 計算機與信息學院, 蕪湖 241000; 2.東南大學 計算機科學與工程學院, 南京 210096; 3.四川大學 網絡空間安全學院, 成都 610207; 4.中國人民解放軍聯勤保障部隊第906醫院骨科, 寧波 315211)

0 引言

臨床中廣泛使用X射線計算機斷層掃描(Computed Tomography,CT)技術來揭示人體組織器官內部結構。由于人體組織或器官是由多種不同密度的物質成分構成,所以不同位置對X射線的吸收系數也是相異的,由此可得到各組織器官的灰階分布圖,便于醫生通過影像中病灶的空間位置、形態和尺寸等變化情況來診斷病情并制定后續相應治療方案[1]。CT系統掃描組件主要包括掃描架、X射線管以及探測器陣列,X射線管主要功能是產生X射線,X射線穿過人體會與骨骼或組織發生作用,從而被吸收和衰減。探測器陣列接收穿過人體的X射線信號,由光電轉換器將其轉變為電信號,再利用模擬/數字轉換器將模擬信號轉化為數字信號,輸入計算機進行處理并重建。本文中的重建具體指從投影數據重建到CT圖像的過程。隨著硬件及數據處理算法的發展,使其時空分辨率不斷增加,其應用面也越來越廣泛。盡管X射線CT成像在形態學診斷方面取得了巨大成就,但仍存在一定的不足,如輻射劑量降低引起的重建質量下降、圖像噪聲與偽影的存在和組織對比度低等問題。其中,以劑量的降低與圖像質量提升最為主要,這也是CT成像領域的核心研究方向[1-2]。

影像重建的質量和診斷準確性之間存在明顯的依賴關系。降低劑量會導致重建圖像中產生條狀偽影和斑點噪聲,從而影響診斷準確性,尤其易造成面積小、形態細微的早期病變出現誤診和漏診的情況。因此,需要優化相應的低劑量重建算法來對圖像質量進行提升。降低輻射劑量可以采取減少投影角度、降低管電流等方式。稀疏角度采樣方法作為減少投影路徑數量的重要方式之一,具有加速數據采集與減少輻射劑量的優點,但該種方式采集的稀疏投影數據具有不完備性,重建圖像通常具有較多偽影。另一方面,管電流值與CT輻射劑量成正比,臨床廣泛應用的自動管電流調制技術也是基于人體解剖衰減特性差異進行的。降低管電流會導致探測器上接收到的光子數量減少,使重建圖像的效果變差,尤其是在低對比度的部位,由于噪聲和偽影的出現,對其圖像密度的分辨率會產生重大影響。如果沒有對噪聲進行足夠的控制,與之關聯的圖像質量會不同程度地受到影響。此外,減少X射線照射量也是降低輻射劑量的主要方式,這類方法(如內部掃描、稀疏角度、有限角度)獲取的投影數據不完備,對數據處理及重建算法性能有更高的要求[3-4]。

除了高性能X射線探測器和高精度數據采集系統之外,作為CT成像系統中的核心技術,數據處理及重建算法對所提供的影像信息的準確性有著密切相關性。在不改變原有硬件條件情況下,提高成像效果的同時降低輻射低劑量主要有三種途徑:①從CT圖像角度出發:研究人員設計出專業的圖像復原及處理算法,以降低噪聲和抑制偽影,可獲得高信噪比和高對比度圖像。但不同掃描設備、掃描模式及重建方法下,CT圖像的噪聲偽影表征差異大,且缺乏投影數據的信號補充,這也導致該類方法效果有限。②從CT投影數據角度出發:對原始數據或對數變換后的投影數據進行降噪、復原等處理,以提高投影數據的一致性,進而可提高重建效果。但由于投影數據敏感性較高,處理過程中,易出現欠校正、過校正及數據一致性下降等情況。③從圖像重建算法角度出發:近二十年來大量的迭代重建算法被提出并表現出了不錯的性能,尤其是基于先驗信息約束的統計迭代重建算法。但是這類算法面臨的主要問題有:超參數多,難以自適應優化;算法復雜度高,需要重復迭代計算;先驗信息不穩定,泛化能力差等,使得這類迭代重建算法在臨床應用場景下難以充分發揮其價值[4-6]。

隨著計算能力的提升與大規模數據的產生,基于數據驅動的學習型算法在眾多領域中表現出優異的性能,這也為醫學圖像重建算法的發展帶來了新的契機。在影像大數據環境下,基于深度重建方法(本文指利用深度神經網絡或者深度學習的方法來提升圖像質量的重建算法)也是CT成像發展的重要方向[5-6]。本文將從有監督學習和無監督學習兩方面介紹國內外應用于改善CT重建圖像質量的相關方法,包括CT重建模型、優化方法、不同重建框架及學習策略的介紹與分析等。

2 傳統CT圖像重建算法

2.1 投影及噪聲

投影是CT圖像重建所需的源數據,它由X射線穿透被測物體經衰減作用后,被探測器接收而獲得。CT投影是根據物體和射線的相互作用原理來進行的,通過物體的射線被物體所吸收并發生衰減,X射線的強度在一定程度上被減弱,且X射線的衰減變化符合Beer指數定律。離散化的形式可以轉換為一個線性系統:p=Au,其中u∈RN表示要求解的衰減系數分布,p∈RM表示投影數據,A∈RM ×N是預先指定的掃描幾何的系統矩陣[7]。從原理上講,只要投影數據滿足方程求解需求,就能夠反解出u的分布情況。再依據各個器官組織具有特異性衰減系數特性,使用衰減系數分布圖判斷病灶的存在及其位置。一般而言,CT掃描中投影數據p的不確定性主要由以下三部分組成[8]:①統計噪聲:也稱為量子噪聲,是掃描過程中的主要噪聲成分,源于X射線光子發射的統計波動。②電子噪聲:當數模信號進行轉換時會產生電子噪聲,主要是由電路本身和電子器件所產生的。③舍入誤差:由于數字信號的精度有限,舍入誤差來源于數據截斷。

2.2 傳統重建算法

重建算法是CT系統中的關鍵技術之一,它的優劣將直接關系到成像質量。傳統重建算法主要包括解析法和迭代法。解析類重建算法以濾波反投影(Filtered Back Projection, FBP)和FDK(Feldkamp)為代表,是建立在中心切片定理和傅立葉變換理論基礎之上的一種空域變換技術,具有算法簡潔、計算速度快等優勢,在商業CT中得到了廣泛的應用。但解析法需要高質量投影數據,投影數據的完備性及信噪比直接影響重建結果。在不完備數據及噪聲高的情況下,解析重建難以取得較好的成像效果,重建圖像往往會受到嚴重的噪聲和偽影干擾,影響后續臨床任務開展[7]。

迭代重建算法是基于成像系統的物理模型和探測數據的統計特性來構造模型,然后利用迭代算法對目標函數進行迭代求解,其結果優于傳統的解析方法。此外,迭代重建還可以通過在目標函數中添加能夠反映待重建圖像先驗信息的約束項,來提升圖像重建效果。統計重建的一般目標函數可以表示為:

(1)

式中,Σ為投影噪聲相關的對角矩陣[9];R(u)為先驗約束項;λ為正則化參數。式(1)中第一部分為保真項,以衡量重建結果與測量數據的一致性,常采用最小二乘函數;第二部分為先驗約束項,以約束重建圖像的特定信息,統計迭代重建中先驗約束項R(u)的設計一直是重建領域的研究熱點。

在過去的20年間,隨著對CT圖像特性理解的提高,各種先驗約束項被提出。如將變換域信號稀疏作為先驗信息,并以此模型構成約束項。代表性工作如Sidky等提出的經典全變差(Total Variation,TV)約束迭代重建,可在一定程度上減少CT圖像中的噪聲偽影,隨后大量改進形式的TV迭代重建算法被相繼提出[10-14]。相比于TV類約束,特征字典學習可以有更冗余的結構信息,能有效地處理圖像局部細節。如Xu等將字典學習約束引入到迭代重建框架中,構建基于全局字典學習及自適應字典學習的兩種重建目標函數,重建效果得到了較大的提升[15]。在此基礎上系列新型的字典學習方法被提出,如Lu等提出的對偶字典[16],Liu等提出的三維特征字典[17],Zheng等提出的快速聚類字典[18]等,都在一定程度上提高了CT圖像重建效果。為避免圖像塊操作的不一致性,Bao等首次將卷積稀疏編碼框架用于CT重建中,并提出了卷積稀疏編碼約束重建方法,實現了稀疏角度CT重建中的噪聲和偽影抑制[19]。Duan等以圖像質量為標準,建立以質量為引導的迭代重建算法,可實現自適應的超參數調節,并提高成像質量[20]。這類迭代重建算法能在一定條件下取得較好的重建效果,但由于超參數難調、算法復雜度高、處理時間長和數據不相容導致的穩定性差等原因,在臨床應用場景中難以充分發揮其價值。

3 深度重建算法

近年來,深度學習(Deep Learning, DL)方法已成為解決醫學成像中逆問題的重要方法,與統計迭代重建相比具有更優異的性能和更快的處理速度。在CT圖像重建領域,DL模型可通過捕獲圖像高層特征來顯示其學習不確定噪聲分布能力。由于它可以有效地適應任何噪聲類型。因此,對于CT重建的整體性能提升有顯著促進作用[21-22]。

3.1 深度學習

DL技術是利用神經網絡學習輸入數據的特征,并通過非線性疊加將低層特征提取組合,實現任意復雜非線性函數的近似最優化逼近,學習所需要的信息。根據訓練是否對配對數據具有依賴性,DL方法可以被劃分為有監督式和無監督式兩種。如圖1所示,面向CT成像的深度重建算法主要分為有監督學習和無監督學習深度重建方法兩個方面,在下文詳細闡述。

圖1 深度重建算法分類

監督學習是通過數據的預測與樣本標簽計算損失值,獲得相應的學習模型。監督學習類方法主要包括:支持向量機模型(Support Vector Machines, SVM)、卷積神經網絡模型(Convolutional Neural Networks, CNN)、循環神經網絡模型(Recurrent Neural Networks, RNN)等[23-24]。由于監督學習方法需要大量的標注樣本,但誤標樣本和低質量樣本會大大降低模型性能,而無監督學習方法的優勢在于無需對樣本標簽進行預先標注,以數據集中樣本間的相似度為依據,自動提取特征并預測。無監督類學習類方法主要包括:變分自編碼器(Variational Autoencoder, VAE)、深度信念網絡(Deep Belief Network, DBN)、聚類(Clustering)、玻爾茲曼機(Boltzmann Machine, BM)、生成對抗網絡(Generative Adversarial Nets, GAN)等[25-26]。

3.2 有監督學習的深度重建

基于有監督學習的圖像重建方法使用配對數據來學習將低質量輸入回歸到高質量輸出的深度神經網絡映射。深度重建中,有監督的學習模式最為常見,按照DL在重建算法中使用方式,可以將此類重建方法分為三類:①域變換類方法:使用深度神經網絡替代FBP運算;②模型類方法:使用深度神經網絡替代統計迭代重建中的先驗約束項;③迭代展開類方法:使用深度神經網絡實現迭代求解。如圖1所示。

3.2.1 域變換類方法

域變換類方法其核心思想是使用深度神經網絡來替代FBP運算,與此同時還可以對投影域和圖像域的數據加以處理,以進一步提升重建圖像質量。域變換類深度重建算法執行過程如圖2所示[6, 27]。這類深度重建網絡的輸入和輸出通常分別是投影數據和圖像數據。按照解析重建的數據處理流程,可在域變換基礎上增加兩個子網絡,分別作用于投影域和圖像域數據,這兩個子網絡通常都使用卷積神經網絡實現。投影數據首先被送入第一個子網絡,在其中可以對其進行去噪校正等預處理。然后,使用域變換將預處理后的投影數據轉換為CT圖像數據。最后,運用第二個子網絡對CT圖像進一步處理以提高重建效果。多數文獻中用于圖像處理的網絡也都能適應于進行兩個域的數據處理。由于投影域和圖像域的CT噪聲統計分布差異較大,兩個域的處理過程可以互補,使重建過程更加有效和穩定。

圖2 域變換類深度重建算法流程

整個深度重建流程中,域變換用于實現兩類數據之間的信息交換,最簡單的域變換就是FBP,如圖2(a)所示。FBP的一個主要優點在于可以將投影數據直接變換成合適的數值范圍,對后續的圖像域處理更加友好。代表性的研究有:FBPConvNet[31]、Domain progressive 3D residual convolution networks(DP-ResNet)[28]、hdNet[29]、Dual-domain Residual-based Optimization NEtwork(DRONE)[33]、ADAPTIVE-NET[34]、Dual Domain Network(DuDoNet)[35]和Dual- Domain Adaptive-Scaling Non-local Network(DAN-Net)[36]等。除此之外,域變換還可以是FBP view-by-view的形式,這種變換將投影數據反投影到圖像空間中的多通道中,每個通道都是來自一個投影視圖的反投影,這樣可將數據從多個視圖中分離出來,獲得更多信息。如Tao等[32]構造了一種可體現不同投影角度上反投影數據信息的張量(VVBP-Tensor),并分析了其特性及構建了一種深度重建網絡模型,實現了VVBP-Tensor與重建圖之間映射??紤]到投影數據與圖像數據的互補性,許多學者嘗試通過交互訓練來建立不同域數據之間的關系,如Wang等[37]提出了一種用來解決CT金屬偽影抑制問題的交互式雙域并行網絡IDOL-Net;Zheng等[38]構造投影域的卷積神經網絡來估計缺失投影數據,采用線性解析算子將數據從投影域轉換到圖像域,在圖像域中增加卷積網絡進行圖像細化。

受DL技術啟發,研究人員構建了不同形式的網絡來取代傳統的域變換,直接通過網絡學習實現Radon逆變換,如圖2(b)所示。代表性的網絡如AUTOMAP[39],它是通過全連接層將投影數據映射到重建圖像。然而,受計算機存儲成本制約,這種架構在大多數醫學圖像重建情況下是難以應用的。隨后許多低計算量和低存儲量的改進型學習域變換網絡被提出,如He等提出沿射線軌跡線性求和的方式構建網絡iRadonMap,可使全連接層的權重稀疏,降低模型參數量[40]。后續人們對幾何形狀和體積進行了下采樣,提出了一種DSigNet網絡,可進一步降低計算成本[41]。使用共享參數也是降低學習型域變換計算成本的一種有效方法,如Li等提出的iCTNet,是使用域變換的共享參數處理不同視圖的測量,可獲得較傳統變換更好的性能[42];Fu等提出一種層級式的網絡架構,其參數比一般網絡所需的參數要少得多,并且可將共享參數逐級的應用于像素層上[43]。與傳統變換相比,學習變換有可能獲得更好的性能。

在CT成像數據流上使用深度神經網絡替代傳統的處理,可有效地提高重建圖像質量。然而域變換類重建的泛化能力有限,尤其是學習型域變換對成像幾何依賴性較大,當掃描幾何和重建圖像大小與訓練數據不一致時,訓練后網絡將不適用。相比之下,傳統的變換更穩定,只需要針對不同的幾何形狀和重建圖像大小進行調整即可應用。未來,提高域變換類深度重建算法的泛化能力尤為重要。

3.2.2 先驗約束模型類方法

先驗約束模型類方法其核心是使用深度神經網絡來替代統計迭代重建中的先驗約束項。DL技術能利用大數據有效解決復雜問題,因此,利用深度神經網絡構造可學習的先驗約束項是可行的。大量研究表明,用神經網絡代替傳統構造的先驗約束項,能取得優于傳統統計迭代重建的結果。

先驗約束模型類深度重建算法是將預訓練好的模型作為先驗信息。這類方法一般采用交替方向乘子法、原始對偶法等將待求解問題分解為若干個子問題,并通過預訓練網絡的方式來解決其中部分子問題,即插即用型的深度重建算法是近年研究的熱點。CT重建模型可表示為:

(2)

式中,D(u)為預訓練神經網絡,以替代先驗約束項。

有兩種方法可以訓練這里的先驗約束模型。

第一種方法是為所有迭代訓練一個通用先驗約束模型[9]。這種策略可以使用噪聲圖像和相應的標簽圖像作為訓練對來獲得先驗約束模型。然而,先驗約束模型很難在每次迭代中達到最佳約束性能。代表性的研究有:Venkatakrishnan等[44]提出即插即用的先驗,以匹配成像系統的前向模型與圖像約束模型;Wu等[45]采用一種K稀疏神經網絡作為先驗項,提高了低劑量CT圖像重建質量;Gupta等[46]將投影梯度下降算法中的投影算子用殘差網絡進行了代替,并設計了一種可學習的松弛投影梯度下降算法,該算法具有較好的收斂性,在稀疏角度CT成像中取得了較傳統稀疏表示迭代重建更好的圖像質量;Zhang等[47]使用了殘差形式的自編碼網絡作為重建中的先驗,在稀疏角度CT重建性能表現更加優越;Zhi等[48]利用卷積神經網絡從全采樣投影數據中學習圖像先驗信息,并用于4D-CBCT圖像重建中。Gao等[49]通過常規劑量圖像數據學習特定的組織紋理先驗,可在高超低劑量掃描下,重建出的CT圖像具有更好的紋理特性。Majee[50]等設計了一種2.5D卷積神經網絡,可很好地利用數據冗余特性獲取先驗,在稀疏角度和有限角度CT重建中取得更好的性能。

第二種方法是通過動態訓練依賴于迭代的先驗約束模型。這種策略是在每次迭代中,先驗約束模型將對具有不同參數的中間圖像進行約束處理,以優化重建性能。當然,每次迭代的訓練模型參數將需要更高的計算成本。代表性的研究有:He等[51]提出了一種參數化即插即用ADMM重建方法,該方法中先驗網絡可在迭代更新的過程中學習獲得;Shen等[52]設計了一種參數微調網絡,并借助強化學習思想,在迭代重建中進行先驗的動態訓練;Chun等[53]提出了一種BCD-Net先驗方法,訓練中可隨著迭代次數進行更新,以實現低劑量CT快速穩定優質重建。Baguer等[54]提出深度可學習先驗的概念,通過逐次迭代學習獲得先驗信息,并在迭代中逐步提高了重建圖像質量;Chun等[55]提出了一種Momentum的迭代神經網絡,實現逆問題快速有收斂的求解;Ye等[56]提出了一種統一的有監督-無監督學習的重建框架,該框架中基于網絡的先驗項可通過交替的方式訓練,實現權重更新。

基于先驗約束模型的方法是在傳統迭代算法的基礎上進行的,其訓練和優化是分開的,可以使用小規模的訓練數據集,重建出較高質量的圖像。如圖3所示為基于先驗約束模型的前向和后向處理過程流程,其中藍色和紅色箭頭分別代表前向和后向?;谙闰灱s束模型的方法采用單獨的訓練策略,存儲計算成本較低,因此,可使用更多次的迭代進行重建,并且訓練后的先驗約束模型可以嵌入到不同的優化方案中,使得基于先驗約束模型的方法更加靈活。盡管如此,基于先驗約束模型的方法仍然需要手動設置參數,這對性能有很大影響。因此,基于先驗約束模型的方法更重要的是適當設置參數并與自適應參數調整方法相結合。

圖3 先驗約束模型類深度重建方法的前向和后向處理過程

3.2.3 迭代展開類方法

迭代展開類方法其核心思想是使用DL實現迭代求解。迭代展開是將迭代優化過程展開為有限數量個階段,并將它們映射到神經網絡中,如使用增廣拉格朗日方法(Augmented Lagrange Method, ALM)進行展開。因此,這類方法主要研究如何采用深度神經網絡模塊通過訓練的方式實現迭代求解過程。迭代展開類方法中,一部分學者研究采用端到端的訓練方式實現迭代求解過程的可學習,另一部學者研究采用卷積神經網絡實現迭代重建中超參數的部分學習。迭代求解過程的可學習的深度重建模型可表示為:

(3)

式中,v、t為輔助變量,ρ為正則化參數。使用交替方向乘子方法(ADMM),目標函數(3)可分解為如下:

(4)

式(4)為迭代重建的展開式,迭代展開類方法就是將上述三個優化問題使用不同的神經網絡來替代,以實現端到端的重建。此類深度重建方法代表性的研究有:Adler等[57]利用卷積神經網絡來學習對偶算子的解,以降低采用原始對偶法求解CT重建問題的復雜度;Chen等[58]研究了基于“Fields of Experts”的正則項與卷積神經網絡的卷積層間關系,并使用網絡來實現重建算法的每次迭代過程。Chen等[59]同時結合了解析重建、統計迭代重建與DL算法三者的優點,利用Proximal Forward Backward Splitting算法將目標函數的求解問題轉化為保真項與先驗約束項的迭代求解過程,其中先驗約束項是通過稠密網絡進行學習的;Zhang等[60]提出了一種具有自學習特性網絡MetaInv-Net,通過神經網絡來學習共軛梯度下降算法的初值。Xia等[61]采用卷積神經網絡學習最速梯度下降法中的正則化項,提出一種能夠同時捕獲圖像像素級特征與拓撲特征的先驗信息;Xiang等[62]將快速迭代收縮閾值算法進行網絡形式的展開,提出了一種解決病態醫學圖像重建問題的FISTA-Net;Ghani等[63]通過整合數據和圖像先驗的一致均衡,建立了統一的深度重建框架DIPIIR,實現了重建圖像質量的提高;Ding等[64]通過展開式的半二次分裂算法實現深度低劑量CT重建,該算法中不僅使用了可學習的先驗約束,而且能針對不同噪聲水平數據實現自適應超參數調節;Su等[65]提出一種泛化的迭代展開式深度重建方法DIR,實驗表明三種不同展開架構均能取得較好的稀疏角度重建效果;Komolafe等[66]使用迭代級聯DenseNet和去卷積網絡實現重建算法的迭代展開,在投影域和圖像域同時使用深度先驗更新策略;Hu等[67]在ACID重建框架的基礎上,提出了一種基于殘差學習的深度迭代優化網絡DIRO,可進一步提高有限角度CT的成像效果;隨后為抑制4D-CBCT重建中的偽影,在網絡設計中引入先驗圖像特征融合模塊,并通過迭代展示的方式形成出了一種先驗正則化迭代優化算法PRIOR,能大幅度提高4D掃描時的重建圖像質量[68]。

基于先驗約束模型的方法是在傳統迭代算法的基礎上進行的,其訓練和優化是分開的?;诘归_的方法是一個端到端的過程,優化被納入訓練中。如圖4所示,迭代展開的方法與先驗約束模型的方法的前向數據流相似,但展開類方法的后向數據流是端到端的,即完整的反向數據流是從輸出到輸入的誤差信號的反向投影,可以以統一的方式進行訓練,其中所有參數,包括正則化參數,都可以從訓練中獲得。然而,不可避免的是模型需要更大的存儲空間,從而限制了展開的迭代次數。盡管迭代展開策略能為CT重建任務提供一種新的網絡結構設計思路,但根據展開優化方案的性能很難直接判斷網絡的性能,如何展開優化方案并對其進行最優訓練仍然是一個重要的課題。

圖4 迭代展開類深度重建方法的前向和后向處理過程

3.3 無監督學習的深度重建

隨著DL的出現及迅猛發展,與神經網絡有關的圖像重建方法逐漸得到廣泛研究?,F有的有監督圖像降噪網絡需要在大量匹配成對/標記數據中進行訓練,然而匹配成對訓練數據一直是醫學圖像重建及處理領域中的難題。一方面,通過模擬的方法獲得的噪聲數據與真實的噪聲存在較大差異,泛化性能往往并不理想;另一方面,真實的匹配數據對采集需要特殊設備或局限于靜態場景,條件限制苛刻。而無監督學習本質上是一個統計方法,在沒有標簽數據的情況下,通過數據自身存在的規律,來發現潛在的一些結構特征。由于對數據集沒有嚴格要求,近年來,無監督學習逐漸成為生物醫學圖像處理等領域的研究熱點,尤其是針對無監督學習中的自監督學習和基于生成模型這兩種類方法,如圖1所示。

3.3.1 自監督學習類方法

自監督學習旨在從數據本身自動生成監督標簽,再以構造的監督信息訓練網絡,由于其具有良好的數據利用效率和泛化能力,因而在許多機器學習實例中得到應用。對于回歸任務,例如圖像去噪、圖像重建等,自監督學習通常通過一種掩模形式來實現,其中部分數據對網絡隱藏并用于定義訓練標簽。對于圖像重建,使用基于物理先驗的自監督學習來解決正則化最小二乘問題,其重建質量可與監督式深度重建相媲美。在這種情況下,掩模是在數據保真步驟中執行的,與先驗約束項相分離,并且有助于使用在不同域數據的損失函數。

自監督學習為圖像重建神經網絡提供了一種不需要配對數據的訓練方法,其中數據欠采樣自監督學習(Self-Supervised learning via Data Undersampling, SSDU)的方法,是醫學圖像重建中一種泛化的掩模訓練過程,基本流程如圖5所示[69]。在重建流程中,掃描數據p通過掩模θ分成pθ和pθC兩部分,HθC(·)為掩模集θC對應的域變換算子,DC表示與深度神經網絡相關的數據一致性單元,用于實現掃描數據一致性操作。理論上掩模θ是隨機選擇的,在基于傅里葉變換的變換域使用基于高斯概率密度的可變密度掩模方法,可實現對傅里葉空間中低頻內容的更密集采樣用于數據一致性單元。然而,用于掩模的高斯密度需要一個控制其方差的超參數。因此,在后續的研究將SSDU擴展到多掩模操作,可使用多個掩模來定義損失,實現掩模真正意義上的隨機選擇,同時,也避免了超參數的設置[70]。此外,當域變換操作不適定時,多個掩模的使用也可以提高重建性能。

圖5 自監督學習的迭代展開式深度重建算法流程

盡管這類自監督學習的方法已用于醫學圖像重建,但相關研究還處在探索階段,如磁共振成像、功能磁共振成像等[71-72]。CT成像領域研究相對較少,大多是在無監督學習的CT圖像處理領域。如Li等[73]提出了一種三維自注意卷積神經網絡,并使用自監督學習的感知損失訓練,提高低劑量CT圖像的去噪效果;Wu等[74]提出一種自監督學習方法,學習相鄰幀圖像的映射,并用于動態CT灌注圖像的去噪;Fang等[75]使用自監督的Noise2Noise先驗,實現迭代式的CT材料分解;Zhang等[76]在集成投影域超分辨率模型和圖像域模糊模型,建立一種自學習的混合模型并用于CT圖像超分辨率重建中;Han等[77]通過低劑量CBCT圖像重投影及伯努利采樣的形式丟棄部分投影數據,并使用自監督學習來補充,以減少重建后低劑量CBCT圖像的噪聲;Choi等[78]利用三維CT圖像數據不同方向上信號差異,并使用Corr2Self自監督學習框架,實現低劑量CT圖像的復原。

在自監督學習的深度CT重建方面,相關研究還處于探索階段,代表性的研究有:Hendriksen等[79]提出的Noise2Inverse重建框架,該方法通過自監督神經網絡學習獲取先驗并用于CT重建,實驗結果表明,能很好地降低CT重建圖像中的噪聲;Lagerwerf等[80]提出的Noise2Filter重建框架,該方法屬于域變換類,以投影數據自監督學習方式建立解析重建的濾波器,實現快速三維CT成像;Yu等[81]通過投影域和圖像域的交叉自監督學習,實現CT圖像金屬偽影的去除;Unal等[82]僅使用投影數據進行自監督學習,獲取解析重建的權重并進行重建,實驗結果表明,在低劑量CT重建中能獲得較好的成像效果;Zang等[83]提出的IntraTomo重建框架,該方法是以退化或不完整的投影數據為輸入,通過自監督學習的形式進行投影數據合成與預測,并結合局部與非局部先驗進行重建;Zhou等[84]提出的Noise2Projection重建框架,該方法是通過相鄰角度投影的自監督學習來去除投影數據中的噪聲,其中學習網絡為U型架構。未來,這類無監督學習方法將是醫學圖像重建中的重要研究方向,必將在低劑量CT重建、稀疏角度CT重建、能譜CT重建等領域大放光彩。

3.3.2 生成模型類方法

無監督學習生成模型的任務是建立一個從隱向量生成預期數據的模型。以生成模型為基礎的特征學習,從網絡結構和目標函數的角度提出了許多重建方法,大體上包括隱式的概率模型(如VAE等)和顯示的概率模型(如GAN等)兩種。VAE主要是使用對數似然函數作為訓練目標,而GAN是使用對抗性訓練來最小化模型和數據分布之間的f散度或積分概率度量。

使用常規無監督學習方法用于圖像重建的流程圖如圖6所示,該流程圖由無監督的先驗學習步驟和迭代重建步驟組成,重建目標函數與基于先驗約束模型類方法相同。在先驗學習階段,旨在通過網絡訓練來學習圖像的數據概率分布,特別是學習先驗的梯度。在迭代重建階段使用訓練好的先驗模型,可以在約束數據保真項的同時約束整體解空間來實現迭代重建算法。交替迭代重建過程可寫成:

圖6 生成模型類深度重建的流程圖左側為先驗學習過程;右側為迭代重建過程

(5)

式中,Ψ(·)為生成模型網絡,α和β為拉格朗日乘子。

GAN大多用于CT圖像或數據的復原處理等,此類研究相對成熟[85-87]?;谏赡P偷纳疃菴T重建方法較少,代表性的研究有:Wu等[45]采用K-稀疏自動編碼器用于無監督的特征學習任務,并在重建過程中最小化重建圖像和流形表示之間的距離以及數據保真度來提高圖像重建質量;Bai等[88]在有限角度CT重建中,使用一種自編碼的卷積神經網絡生成有限角度掃描缺失的投影數據,以提高重建質量;Barutcu等[89]使用自學習的生成模型為約束項,與全變差約束相結合以提高有限角度CT重建圖像質量,實驗結果表明在噪聲抑制和圖像細節恢復上具有很好的效果;Kandarpa等[90]以雙U-net為生成器,建立從投影到圖像的直接深度網絡重建框架;蔡等[91]通過構建和分析普通CNN與GAN兩者的性能差異,提出了一種創新的掃描方式,可有效獲取低噪聲的微米級計算機斷層掃描(Micro-CT)數據,并取得了很好的重建效果;Xing等[92]以自注意力GAN建立深度迭代重建框架,可實現噪聲或不完全投影數據的高質量重建;Zhang等[47]提出一種REDAEP算法,該方法是在去噪自編碼先驗模型的基礎上,采用變量增強技術和正則化約束以挖掘圖像更高維的先驗信息。Song等[93]以基于分數生成模型為基礎,建立全無監督的逆問題求解框架,該方法可以實現醫學圖像的無監督重建;Zhang等[30]為實現低劑量CT 重建過程中的細小結構的增強,設計了一種CLEAR網絡,該網絡包括混合域生成器與圖像域判別器,并使用復合損失函數聯合優化,實現了從投影數據到高質量圖像數據映;Unal等[94]以深度生成正則化為先驗,實現無訓練數據的無監督低劑量CT重建,實驗結果表明該方法較TV重建具有一定優勢;He等[95]以深度梯度先驗為生成模型,并以梯度下降的更新方式實現低劑量CT圖像重建;Zach等[96]以無監督學習策略獲取圖像全局感受野內的參數化正則項,實現高層特征的統計信息,此為先驗框架可實現不同掃描條件下的CT重建。Zhu等[97]提出一種深度能量模型的新型CT重建方法,該方法通過郎之萬動力學迭代更新訓練的先驗,并將數據一致性作為條件項集成到迭代生成模型中,以提高重建圖像質量。盡管生成模型在處理自然圖像方面取得了成功,但在醫學圖像重建領域的研究卻不是很多,尤其是在CT重建方面。

3.4 損失函數

CT圖像重建方法表現與網絡結構、訓練數據以及訓練過程中采用的損失函數有關。損失函數用于評估數據在特定網絡模型中的建模效果,通常由一個或多個損失函數組成,對重建的最終圖像質量有很大的影響。

均方誤差(Mean Square Error, MSE)是許多深度模型中廣泛采用的一種損失函數,MSE處處可導,且收斂速度較快,但異常值處理并不健壯,且其均值操作會導致紋理信息丟失、過度平滑以及生成虛假病變信息等問題[29],當訓練數據中存在噪聲時,這種影響尤為突出。以平均絕對誤差(Mean Absolute Error, MAE)作為MSE的替代方法成為了優化DL模型的一種較理想的方法,實驗結果表明,它可以克服MSE損失引起的圖像模糊問題[28]。但MAE優化的DL模型也有一些缺陷,如重建圖像存在的畸變問題。將壓縮感知去噪思想引入網絡訓練中,可提高網絡的噪聲偽影抑制能力,但同樣會出現過平滑現象,如TV損失[94]。在預訓練網絡VGG發布后,將感知損失引入DL模型優化過程中,可一定程度克服MSE和MAE損失造成的重建圖像退化問題,能夠獲得較好的視覺效果[73, 85]。但僅采用感知損失重建出的圖像容易出現網格偽影,因此,感知損失通常與MSE相結合來優化DL模型。保持結構信息方面,有結構相似性(Structural Similarity, SSIM)損失函數,SSIM表現優于MSE,且去噪能力更好[94]。此外,多尺度SSIM損失可結合不同分辨率的圖像細節,能夠在不同比例上保存結構和上下文信息,也是一種優秀的損失函數。另外,邊緣損失也能在一定程度上保持圖像內容結構信息[98]。

無監督學習中,盡管對抗損失能夠生成與目標分布具有相似紋理的圖像,但在數據量不足的情況下,會引入解剖學不正確的偽影結構。因此,基于像素內容的MAE和MSE損失常常被添加到對抗損失中引導圖像的內容信息重建過程。研究證明,基于對抗損失網絡存在一定程度的難以收斂問題[85],因此,在文獻[85]中,通過引入帶梯度懲罰的Wasserstein距離作為損失函數來克服收斂性問題。此外,在循環GAN網絡和最小二乘GAN網絡中使用的循環一致性損失和最小二乘損失,也可以在一定程度上克服GAN網絡訓練過程存在的各種問題[86]。聯合不同域的數據損失也是重建中的一種可選方法,如投影域數據損失,該損失是將損失函數作用于投影數據中,可有效提高數據的一致性,通常與圖像域的損失聯合使用[94]。深度重建模型中常用損失函數及其優缺點如表1所示。

表1 深度重建模型中常用損失函數

4 討論與展望

深度重建方法可以將CT重建過程協同集成到神經網絡中以獲取優異的成像性能,而受到越來越多的關注。隨著近幾年深度神經網絡的快速發展,研究人員從不同的角度提出了許多深度重建方法。盡管這些方法在實驗數據中表現優異,但針對實際臨床應用仍需進一步改進。DL應用于CT重建領域仍然面臨一些問題:①深度重建模型的泛化性。由于設備、掃描部位、掃描模式等差異,會導致重建圖像在局部區域CT值、對比度、噪聲紋理以及偽影特征等方面存在差異,應用訓練后的深度重建模型時,其泛化能力會成為一個重大問題,如基于域變換類深度重建算法。此外,部分深度重建模型中超參數較多,大多需要手動設置,這也限制了其在不同設備數據間的泛化能力,如基于先驗約束模型類方法。因此,構建能夠在臨床應用中保持性能的健壯深度重建模型尤為重要。②深度重建模型的穩定性。在不同噪聲干擾下、圖像結構信息變化下、訓練數據變化下,絕大多數深度重建算法缺乏穩定性。在臨床成像系統中,穩定準確的圖像重建尤為重要,這是疾病篩查診斷治療的必要條件,因此,在提高重建準確性的同時,保證其良好的穩定性也至關重要。③深度重建模型的可解釋性。DL缺乏直接的物理模型或理論可解釋機制,其深度重建模型難以被臨床醫生接受。近年來,通過構建可解釋性的神經網絡或提高網絡的可解釋性成為DL領域的熱門研究,未來構建可解釋網絡并與重建的融合,做到真正意義上的深度可解釋迭代重建,值得深入研究。

除此之外,在深度重建研究領域,近年來還出現了一些新的學習型的方法,來提高CT重建質量,部分研究已取得一定的進展。①Transformer網絡:將注意力集中在重要特征上,以實現基于圖像內容和特征的自適應處理,在計算機視覺領域中顯示巨大優勢。在Transformer網絡思想基礎上,已有一些新的深度重建策略[99, 102],未來這一方向有望進一步提高醫學圖像重建性能。②任務驅動重建:重建后的CT圖像最終是為篩查診斷和介入治療服務。以特定任務為目標,在深度重建中使用具體任務損失函數相關的共享特征層,可進一步提高成像效果。通過優化成像數據流,增加不同階段的數據處理及圖像理解工作,重建出更適合預期臨床任務的圖像將是未來研究的重要方向[103-104]。③質量評估驅動成像:深度神經網絡可更好的實現醫學圖像的質量評估。然而,基于DL的圖像質量評估不僅可以評估重建質量和診斷性能,還應該以損失函數的形式輔助重建。未來將會出現更多的DL圖像質量評估方法,并應用于醫學成像中[105-107]。④域泛化學習重建:CT數據的差異性尤為明顯,數據差異帶來的泛化性下降是制約深度重建臨床應用的主要因素。域泛化學習思想是通過多個不同域數據(但具有一定的相關性)學習一個統一的模型,引起了廣泛關注。將域泛化學習思想應用于深度重建中,有望提高深度重建模型在不同掃描數據中的泛化性,加速深度重建類方法的臨床落地應用[108-109]。

5 總結

本文介紹了CT成像原理、投影過程、噪聲情況,并對基于傳統和DL的圖像重建算法所涉及模型框架進行系統介紹與分析,并從學習策略及模型優化角度概述了國內外學者在CT深度重建領域的研究成果。其中,重點介紹了DL中的有監督學習方法和無監督學習方法,有監督學習方法主要包括對傳統重建算法中的解析重建過程、迭代重建正則化項、迭代重建迭代求解過程使用DL方案;而無監督學習重建則以自監督學習方法和生成模型作為典型代表,自監督類學習主要是使用掩模策略用于圖像處理和重建,而生成模型重點以編碼器和生成器相互協作作為訓練手段。與此同時,本文還對圖像重建的常用損失函數也進行了總結,介紹了各損失函數的優勢和局限性。最后,討論了基于DL的CT深度重建方法所存在的一些問題及面臨的挑戰。隨著數據的增加和計算能力的快速發展,自動化的影像數據處理和分析的需求不斷增加,而高質量的成像是實現高效精準診斷和決策的前提,基于DL的深度重建算法將是成像領域新的熱點研究方向。借助DL優異的數據表達性能,深度重建方法有望促進快速、高效、經濟和安全的醫學成像技術的發展,更好的服務于患者。

猜你喜歡
先驗投影神經網絡
解變分不等式的一種二次投影算法
基于最大相關熵的簇稀疏仿射投影算法
神經網絡抑制無線通信干擾探究
基于無噪圖像塊先驗的MRI低秩分解去噪算法研究
找投影
找投影
基于自適應塊組割先驗的噪聲圖像超分辨率重建
針對明亮區域的自適應全局暗原色先驗去霧
基于神經網絡的拉矯機控制模型建立
基于平滑先驗法的被動聲信號趨勢項消除
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合