?

探地雷達隧道地質預報智能化解譯方法研究現狀及進展

2024-01-17 01:14楊庭偉冉孟坤李靜和姜洪亮盧超波
工程地球物理學報 2023年6期
關鍵詞:智能化神經網絡隧道

楊庭偉,冉孟坤,李靜和,姜洪亮,4,5,盧超波,4,5

(1.桂林理工大學 地球科學學院,廣西 桂林 541000;2.廣西交科集團有限公司 隧道與巖土工程研究院,廣西 南寧 530007;3.廣西壯族自治區公路隧道安全預警研究中心,廣西 南寧 530007;4.廣西道路結構與材料重點實驗室,廣西 南寧 530007;5.高等級公路建設與養護技術、材料及裝備交通運輸行業研發中心,廣西 南寧 530007)

1 引言

當前,我國隧道及地下工程建設迅猛發展,投入運營的隧道超過35 000座,總長度超過37 000 km,[1]。而根據我國地貌特點及國民對生態環保的要求,公路、鐵路及城市地鐵的隧道建設將是交通網絡功能最優化選擇之一,未來我國隧道建設量依然會保持較高增長水平[2]。國內外統計表明,受外部惡劣環境及內部復雜荷載失衡等因素影響,隧道運維期間常出現襯砌病害(裂縫、水體滲漏、脫空及變形等)[3-5];而隧道施工過程中掌子面前方的地質情況不明,常導致施工挖掘中發生塌方、突泥、突涌等嚴重災害[6-10]。上述隧道病害及災害的發生,輕則影響了整個隧道建設項目施工進度,重則發生隧道事故,危及國民生命、財產安全。因而,對于當前地下工程建設安全施工、保質保量而言,高效的隧道地質預報、最大限度地降低隧道安全事故發生幾率、減少人員傷亡具有重要的現實意義。

隧道地質預報手段通常有傳統的人工檢測、基于掘進設備的鉆探檢(監)測及地球物理領域探測方法等。與傳統檢測技術相比,地球物理方法以其對探測目標破壞小,探測速度快及部署使用方便等優勢,已經成為目前隧道地質超前預報的主要手段[11-13]。實踐表明,檢測成本花費方面,隧道等地下工程潛在病害或災害檢測遵循“五倍定律”,即人工隧道巡察檢測費用是采用設備進行有損檢測(如鉆探)費用的五倍,而有損檢測費用是無損先進檢測(地球物理方法)的五倍[14]。因此,地球物理方法同時亦是降低隧道運維、隧道施工地質預報成本的首選方法之一。

基于介質波阻抗差異特性,隧道地震勘探(Tunnel Seismic Prediction, TSP)通過測量地震波速度,轉換為介質密度、泊松比等力學參數進行預報,探測范圍較大,是地球物理隧道地質預報普遍應用的方法[15-17]。但由于復雜隧道病害和災害目標反射的地震波信號難以準確計算波速度,TSP僅適用于具有規則界面特性的隧道病害及災害目標的檢測。瞬變電磁法對低阻介質反應較為敏感,是隧道地質預報中含水病害及災害探測主要方法[18]。然而,受隧道觀測環境限制,瞬變電磁法的發射和接收線圈無法有效展布,地質預報有效范圍及效果受到嚴重的影響[19]。

探地雷達(Ground Penetrating Radar,GPR)是隧道地質預報領域另外一種普遍應用的方法,其通過發射高頻電磁波和接收前方介質反射的電磁波脈沖,實現隧道地質預報。相比較于地震波探測類方法,采用高采樣率、寬頻短脈沖的GPR方法針對破碎帶、溶洞、隧道襯砌后空洞等病害和災害目標體具有更高的分辨率[20]。而地質預報目標區域含水量是影響介電常數的主要因素,基于對介電常數變化的敏感性,GPR在識別含水病害和災害、完整圍巖介質方面亦具有較好的效果[21]。然而,GPR隧道地質預報解譯推斷存在以下技術瓶頸:一是對觀測數據異常的識別常常定性依賴于解譯人員的工程經驗或簡化方法,其主觀性強,導致錯誤推斷率高,普適性低,方法應用推廣難,且效率較低,造成地質預報成本提高,缺乏對隧道病害及災害目標有效的辨識算法;二是定量解譯處理過程目標模型反演(或偏移成像)問題,由于觀測數據的欠定性,常常具有病態性、非線性和多解性,導致地質預報目標體難以準確成像,甚至無法識別[22]。

因而,如何高精度、高效利用GPR進行隧道地質預報是當前地下建設工程領域極具挑戰的一項任務。發展GPR隧道地質預報智能化框架及算法平臺,是解決上述問題的關鍵。目前,有關GPR隧道地質預報智能化解譯方法研究的文章已經發表了很多,但尚缺乏系統而完整的歸納總結。本文以人工智能為研究對象,在詳細闡述GPR隧道地質預報智能化解譯領域發展現狀的基礎上,從人工智能學習框架、復雜環境人工智能訓練集獲取、跨域泛化能力的提高等方面,闡述了當前GPR隧道地質預報存在的問題及其進展,最后對GPR隧道地質預報下一步發展方向進行了初步展望。

2 GPR隧道地質預報智能化解譯基本原理

傳統隧道地質預報方法主要由專家技術人員分析巖體目標特征,依據目標體與背景或標準數據的差異性信息識別對象。針對傳統方法的局限性,基于計算機大數據分析以及人工智能技術的發展,隧道地質預報識別逐步向智能化方向發展。

基于機器學習的目標識別方法主要包括特征提取和分類器兩部分。其中,提取方面,基于變換域(如傅里葉變換、Hough變換、離散余弦變換、S變換、小波變換、短時傅里葉變換等)、子空間投影(主成分分析法、線性判別分析法)、圖像特性(方向梯度直方圖、邊緣直方圖)等方法手工提取幾何特征(雙曲線特征)或空間域、時域、頻域、時頻域、小波域等特征是特征提取領域主要的發展方向。分類器方面,通常利用模糊聚類、神經網絡、支持向量機(Support Vector Machine,SVM)、隱馬爾可夫模型、金字塔模式識別等方法進行分類識別。在眾多機器學習算法中,基于神經網絡進行GPR隧道地質預報智能化解譯是當前研究的主流方向,下文將主要介紹神經網絡的基本理論。

圖1 卷積神經網絡Fig.1 Convolutional neural network

對于GPR地質預報數據的目標識別及分類,基于圖像特征的卷積神經網絡(Convolutional Neural Networks, CNN)的效果較為突出。如圖1所示,神經網絡通常包括輸入層、隱含層及輸出層。其中,隱含層內的卷積運算是利用參數共享原則降低網絡結構中參數,同時利用卷積核提取出圖像信息中的有效特征;而池化操作是為了降低圖像的維度,減少參數的數量,提高模型的泛化能力。首先將GPR地質預報數據模型分為斷層類、蝕變類、風化地層類、巖溶類、巖脈侵入類和巖層接觸類,經過輸入層對GPR數據做歸一化處理,加大數據收斂速度,再由卷積層通過卷積核與輸入數據的卷積運算得到下一層的特征圖。卷積的操作實際上是卷積核對輸入特征數據的濾波處理,經過池化層與全連接層,將GPR數據的局部特征通過權重矩陣從矩陣形式轉化為向量,并映射輸出。最后在分類層上利用某種映射關系得到輸入數據屬于某種模型類別的可能性,選擇最大的結果作為輸出。

如圖1所示,輸入層為信號傳輸作用,隱藏層1含有傳遞函數,可采用線性或非線性函數,隱藏層2用來記憶隱藏層1單元前一時刻的輸出值,輸出層線性加權。其空間表達式如下:

其中,y表示m維輸出結點向量;x表示n維隱藏層結點單元向量;u表示r維輸入向量;xb表示n維反饋向量;ω1、ω2、ω3分別表示輸入層、隱藏層、輸出層,輸入層為信號傳輸作用,隱藏層1含有傳遞函數,可采用線性或非線性函數,隱藏層2用來記憶隱藏層1單元前一時刻的輸出值,輸出層線性加權。

圖2 卷積神經網絡兩階段結構算法示意圖Fig.2 Schematic diagram of two stage structure algorithm of data neural network

圖3 SSD模型卷積神經網絡計算示意圖Fig.3 Schematic diagram of SSD convolutional neural network model

基于深度學習的目標識別算法可以分為兩類,分別是兩階段(Two-Stage)結構算法和單階段(One-Stage)結構算法。兩階段結構算法包含兩個分支,一個分支是把輸入圖像通過卷積和池化層處理形成特征圖,由區域候選網絡(Region Proposal Networks,RPN)在特征圖上生成稀疏的系列候選區域;另一分支是通過感興趣區域池化(Region of Interest,ROI Pooling)對特征圖和RPN輸出的候選區域信息進行結合,進而提取候選區域特征,輸入到后續全連接層判定目標類別。兩階段結構代表算法有R-CNN(Region-CNN),SPPNet(Spatial Pyramid Pooling Network),Fast R-CNN,Faster R-CNN,R-FCN(Region-based Fully Convolutional Network),FPN(Feature Pyramid Network),Mask R-CNN等。其中,Faster R-CNN的結構示意如圖2所示。而單階段結構算法是基于回歸的端到端(End-to-End)目標檢測算法,主要通過對位置、比例和縱橫比進行定點密集采樣,進而檢測目標。單階段結構算法的候選區域提取和檢測分類均在主線上即可實現,大大減少了網絡的復雜度,使網絡結構變得簡單。因而,單階段結構算法主要的優點是檢測速度快,計算效率高,其代表算法有OverFeat,YOLO(You Only Look One),YOLOv2,YOLOv3,SSD (Single Shot Multibox Detector)等。

深度學習方面,若要實現具備識別某一類別物體的能力,則必須通過樣本的輸入來訓練算法模型。以SSD (Single Shot Multibox Detector)模型卷積神經網絡監督學習訓練為例,如圖3所示,即利用人工添加標簽的數據,在模型中學習從輸入到輸出的特征映射,將這種映射關系應用到未知的數據中,以達到分類或回歸的目的。當把無標簽的圖像數據用于SSD模型的檢測時,圖像被輸入到基礎網絡進行特征的提取,以生產多層特征圖,通常提取六個特征圖層生成默認框和利用Jaccard Overlap策略篩選正例,默認框則用于目標種類的評分與位置回歸。

在圖像識別中,默認框的選取直接影響識別的準確程度。如SSD模型提取的六個特征圖層經卷積和池化處理次數不同,對應的感受野不同,則在不同層上生成的默認框大小亦不同。生成默認框時,通過滑動窗口在特征圖的每個單元格上生成一系列同心的默認框,其規格Sk由以下公式確定,其中m是提取的特征圖層的數量(m=6):

(4)

其中,k∈[1,m]。每一層的默認框有正方形和矩形兩種,根據不同的高度比例ar={1,2,3,1/2,1/3}生成。其中,第k層特征圖的默認框高和寬分別由式(5)和式(6)計算得到:

一般為了選擇優質的默認框內容用于進一步地損失計算和參數更新,需要合理選擇正例和反例。默認框與真實框的交并比匹配策略被應用到正反例選擇中,計算公式如下:

(7)

式中,A代表的是默認框;B代表的是真實框。正反例的判斷閾值設為β=0.5。當J≥β時,默認框為正例;反之為反例。

3 國內外研究現狀及發展動態分析

3.1 GPR解譯智能化進程

早期,隨著計算機技術和數字圖像處理技術的發展,通過機器視覺設備所獲得的圖像識別和分類理論與應用研究不斷涌現。其中,基于神經網絡的圖像識別方法在GPR數據解譯領域得以發展。如Millard等(1997)[23]基于GPR管道探測圖像數據,采用神經網絡方法,依據不同灰度值實現GPR數據解譯推斷。Davis等(2002)[24]提出根據多種不同曲線形狀特征,通過BP(Back Propagation)神經網絡來識別不同類物質輪廓。如圖4所示,孟陸波等(2009)[25]基于GPR時間剖面上雙曲線特征,對應掌子面前方溶洞不良地質體的先驗知識,提出采用神經網絡模式識別方法,自動識別地質雷達圖像中的雙曲線,以此實現智能預測掌子面前方溶洞不良地質體的目的。但早期智能化GPR解譯的效果嚴重依賴于人工給定的訓練樣本及訓練模式。同時,受限于計算設備的計算能力,早期GPR智能化解譯不能滿足實際工程批量數據處理應用需求。

圖4 地質雷達圖像BP神經網絡特征識別流程[25]Fig.4 BP neural network feature recognition flow chart of geological radar images

圖5 探地雷達回波的極點特征分布Fig.5 Pole feature distribution of GPR echo

近年來,得益于人工智能算法、系統及圖像識別技術、平臺的迅猛發展,GPR智能化解譯的進程不斷得以推進。如劉宗輝等(2019)[26]建立了典型不良地質體預測指標體系,基于專家系統工具(C Language Integrated Production System,CLIPS)構建知識庫和推理機,實現GPR地質宏觀預報專家系統功能。周麗軍(2020)[27]提出極點特征聚類的公路隱藏裂縫GPR自動識別算法(圖5),其對雷達回波信號,利用奇點展開法提取晚時響應部分的極點信息,根據已知環境樣本信息,對待識別目標回波的極點特征空間進行聚類。程博文等(2020)[28]提出采用道路沉陷、松散類病害區域的探地雷達圖像模擬方法,獲取模擬圖像對應區分道路深層結構病害類型,以及計算病害區域的影響范圍。然而,上述智能化進程的發展并不涉及真正意義上的學習過程,針對復雜多變目標體的GPR勘探,實際應用效果因泛化能力弱而受到局限。

3.2 基于機器學習的GPR智能化解譯

作為人工智能領域的一個分支,機器學習關注開發智能化系統,通過數據樣本訓練積累經驗,進而提高智能化系統的處理能力[29,30]。如Daniel等(2012)[31]通過迭代霍夫變換,進行機器學習識別GPR時間剖面多重雙曲線特征,并從寬頻帶GPR數據中根據學習的雙曲線特征,提取地下管線對應的空間分布信息。由于假設地下管線分布單一或多根管線之間可識別,以上神經網絡的模型構建相對簡單,并易于實現[32]。

基于神經網絡機器學習,實現GPR快速正演模擬及偏移成像,并在探測地下管線空間位置領域得到了有效試驗[33]。需要注意的是,上述霍夫變換類型機器學習的實現需要提前輸入簡單雙曲線特征對應地下管線的類型樣本信息。而在GPR圖像中由于探測目標的多樣性,目標體對應的信號也并不局限于雙曲線。同時,真實介質的不均性和噪聲的干擾普遍存在,GPR信號復雜而變化多樣。因而,更高層次、更完備特征提取的機器學習算法仍然是當前GPR智能化數據解譯急需解決的問題。

針對復雜GPR數據,基于支持向量機及深度學習理論的智能化GPR數據解譯算法及平臺研究,近年來得到了爆發式的發展。如采用支持向量機對GPR檢測路基下空穴的單道雷達信號進行識別[34]、利用支持向量機對層位信息識別的公路路基病害檢測[35]、基于支持向量機的隧道襯砌GPR空洞機器識別方法[36]等等。盡管支持向量機在識別準確率、模型結構以及訓練簡便性等方面均優于神經網絡方法,但其特征提取較為復雜,分類模型的泛化性能穩定性差。對此,組合支持向量機和Hough變換確定隧道襯砌鋼拱架的位置和間距的學習算法[37]、支持向量機與H-Alpha分解組合GPR檢測不同介質學習算法[38]、支持向量機與字典學習融合的GPR地雷探測[39]等不斷發展,基于支持向量機類機器學習的泛化特性得到提高。

GPR數據解譯深度學習方面,常規神經網絡類機器學習算法理論與應用研究不斷得到發展,如地下掩埋目標體檢測[40]、基礎結構監測[41]、目標物識別[42,43]、隧道地質超前預報[44,45]及隧道襯砌病害檢測[46]等。研究表明,由于卷積神經網絡的應用,其識別的特征已經超越了傳統的雙曲線檢測,在樣本數據足夠的前提下,可以檢測異常體對應的更多、更復雜的特征,使判斷結果更加準確。

但卷積神經網絡需要提前截取異常體位置再進行預測分類,而不能直接在網絡中定位異常體位置并分類?;赩GG (Visual Geometry Group),Faster R-CNN 及 YOLO 系列(已更新至V3)的面向目標檢測的神經網絡算法的發展[47-49],如圖7所示,在一定程度上提高了機器學習算法直接定位異常體位置的能力。

可見,上述有監督深度學習類機器學習算法GPR智能化數據解譯的發展面臨了諸如缺乏足夠精確的標簽特征樣本數據、用于有效訓練的大數據量及數據維度嚴重不足、訓練獲取學習模型泛化能力弱等技術瓶頸。針對隧道地質預報特殊工程應用領域,每次地質預報觀測的數據極其有限(限于觀測環境及檢測成本等)。盡管可綜合利用整條隧道觀測數據進行深度學習訓練模型,但每次重新訓練模型缺乏時效性及可操作性。因而,開展針對小樣本觀測數據條件下隧道地質預報GPR智能化數據解譯算法與框架研究成為目前的一個前沿方向。

(3)人類的賽博格化愈演愈烈,手機、iPod和筆記本電腦已經發展到近乎人類附屬器官的程度,攝影將延伸為一種全日制策略,包括因無意識刺激而拍攝的照片,比如腦電波和血壓。相機也將在我們的體內循環,在我們的家中常駐,積極主動地警告甚至可能試圖糾正任何錯誤(疾病、火災以及事故),甚至是在分子的層面上。[1]149

4 存在的問題及進展

4.1 人工智能學習模型的構建

如前所述,特征提取是高效、高準確率的人工智能算法實現的基礎。例如圖片的特征提取是深度學習中最為基礎,也是最為重要的研究問題。特征提取可視為一個數據降維過程,即將圖片數據轉化為具有一定區分度及維度向量的圖片特征過程。因而,如何構建一個有效的圖片特征識別和進行數據降維的學習模型至關重要。BP神經網絡是早期隧道地質災害GPR超前預報解譯應用比較廣泛的智能方法[25,50,51],但由于訓練模型局部極小化及網絡結構人工選定等問題,其應用效果不佳。

近年來,通過構建包含一個隱層的三層BP神經網絡結構,采用圖像窗口的方式對神經網絡結構進行訓練和判識測試,被證明是一種對雷達圖像雙曲線特征進行智能判識有效的方法[51]。通過卷積進行特征提取時,淺層網絡往往可提取簡單目標檢測中的小目標特征;而深層網絡具備更大的感受野,可有效提取復雜大目標特征;但同時對不同尺度目標進行特征提取時,網絡模型的設計則更為復雜。其中,LENET模型是通過設計卷積層和全連接層進行梯度下降訓練的卷積神經網絡,當應用于隧道地質災害GPR圖像超前預報解譯時,其明顯缺陷是僅包含少數低隱含層,主要應用于小目標特征提取[44]。因而,結合諸如SVM分類器的LENET模型或將是有效途徑之一[52]。深度置信網絡(Deep Belief Network, DBN)是另外一種針對計算機解決復雜和不確定性問題的學習模型,通過結合壓縮感知理論,其在實測GPR隧道地質超前預報自動解釋方面具有較好的應用效果[53],并一定程度上解決了特征提取量與計算量過大、訓練時間過長相矛盾的問題。

基于深層學習模型的目標識別算法其后不斷得到發展,如結合感興趣區域池化信息的Fast-R-CNN成功應用于提取候選區域特征,輸入到后續全連接層判定探地雷達圖形中雙曲線特征,進行目標類別;結合候選區域(RPN)特征圖的Faster-R-CNN,即前者負責區域選取,后者負責目標檢測,應用于探地雷達管線目標智能識別[48]。YOLO系列(V1,V2和V3等)是另外一種應用于隧道地質災害GPR圖像超前預報解譯的端到端回歸目標識別學習模型,這種系統學習模型在主線上進行候選區域提取和檢測分類,極大地降低了網絡的復雜度,同時使得網絡結構變得簡單,是當前GPR智能化解譯領域廣泛采納的策略。如SSD學習模型有效解決了GPR隧道襯砌中鋼筋智能檢測問題。其基本原理是通過結合6個不同規格的卷積特征圖,對目標進行分類和位置回歸,不同規格特征圖的聯動和組合,可提高目標的檢測精度。大規格的特征圖由于經歷的卷積較少,保留了圖像更多的微小特征,對小目標的檢測非常有利;而經過多次卷積池化后的小規格特征圖保存了大目標的特征,能夠更快速地實現對大目標的檢測。SegNent是一種有監督的編解碼結構的對稱網絡模型,其通過處理任意尺寸的輸入圖像,最大池化逐階段縮小輸入圖像的尺寸和降低參數量,記錄圖像中的池化索引位置,成功應用于隧道襯砌病害檢測[46]?;旌蠈W習模型亦得到了不斷的發展,如馮德山等(2020)[49]將Faster R-CNN和YOLOv3應用于隧道襯砌GPR圖像的識別;張東昊等(2020)[54]利用Mask-R-CNN深層學習模型和RESNET卷積神經網絡進行GPR隧道支護初期檢測;李曼如(2022)[55]基于YOLO和RESNET(Residual Neural Network)開發了GPR道路地下病害智能檢測算法。

圖8 GRP的D-S模型融合算法框架Fig.8 D-S model fusion algorithm framework for GRP

盡管如此,目前普遍應用于隧道地質災害GPR圖像超前預報解譯的學習模型,仍然以簡單目標體檢測問題為主,如具備明顯雙曲線特征隧道管線及鋼筋GPR圖像,具有明顯的電磁反射同相軸的空洞或空腔GPR圖像等。圖8為D-S理論模型融合算法框架,由圖8可知,D-S理論分類模型需要明顯特征的異常波形。然而,隧道地質災害GPR圖像超前預報解譯真正面對的環境是復雜多變的地下空間介質,一方面其圍巖介質明顯區別于隧道管線及襯砌鋼筋、空洞或空腔等周圍的混凝土或土層圍巖介質;另一方面隧道地質災害目標體(例如常見的無明顯病害、低含水破碎圍巖、富含水破碎圍巖、泥夾石破碎圍巖、局部圍巖破碎和空腔型溶洞六大類)空間分布形態多變,亦有別于通常為規則形態的管線及襯砌鋼筋、空洞或空腔等。

上述復雜隧道地質災害目標體空間分布非契合性(即受限隧道環境,探測目標并不在雷達觀測主剖面范圍,而是在旁側剖面),常常引起形態多變的GPR圖像特征。如何構建面對實際復雜隧道地質災害目標體,GPR圖像特征提取學習模型的是一個較困難的問題。針對隧道地質災害GPR超前預報問題,足夠數量、適用于訓練的實測訓練集數據獲取、足夠數量正確實測數據標簽的實現,對復雜隧道地質災害GPR超前預報智能化解譯具有重要的研究意義。但在小樣本訓練集、僅有部分正確標簽數據前提條件下,面對實際復雜隧道地質災害目標體GPR圖像特征提取學習模型構建,仍是一個沒有完全解決的問題。

4.2 人工智能訓練集的選取

如前所述,足夠數量且包含高質量標簽的訓練集數據,理論上可以保證人工智能算法實現準確的目標檢測及智能解譯。然而現實情況是,可能由于訓練數據的數量或者質量不符合要求,導致大多數人工智能項目最終夭折。特別是針對某些特定應用場景的人工智能項目,訓練集數據獲取本身是一個難以滿足的條件。例如隧道地質災害GPR超前預報智能解譯領域,通常超前預報與隧道掘進依次順序同步進行,但并不是每一次掘進前都需要地質災害超前預報;且由于隧道內空間有限,GPR測線布置亦有限,因此,一般情況下隧道地質災害GPR超前預報數據較為有限。

某些特殊情況下,隧道地質災害GPR超前預報可達數公里[44,45,53],這種情況下通過數據處理,可獲取數百乃至上千個有效訓練集數據,但相比較深層學習模型的高要求而言,直接通過上述實測數據作為訓練集的效果并不是都滿足智能化解譯的需求[56]?;跀盗枯^少的實測數據,通過對GPR圖像進行裁剪、平移、翻轉、變化色調及局部比例調整等數據擴增過程[48],進而獲取足夠數量的訓練集數據,是當前針對特征形態較為簡單的管線或鋼筋探測對象廣泛應用的方法。

但如前所述,隧道地質災害超前預報的環境及目標較為復雜,針對簡單及規則的雙曲線特征GPR圖像有效的擴增技術,并不能有效地應用于復雜的環境及目標體智能解譯。通過設置不同地電模型參數,采用正演模擬算法,計算各種模型條件下GPR數據,是另外一種保證深度學習網絡訓練集較為廣泛應用的策略[36,46,57]。由于可人為根據探測目標類型需求有針對性地設置模型,在一定意義上保證了足夠數量的數據集及有效的標簽數據質量[58]。但通過數值模擬獲取訓練集的方式存在的缺陷也很明顯,即人為設定的地電模型不能涵蓋復雜地下目標體類型,因而該方法亦主要應用于簡單的特征提取。當前,人工智能領域已發展了多個開源的數據集庫,這些數據集庫囊括了多種不同領域類型的大型(超萬級數量以上)、高質量標簽的訓練數據。通過訓練集訓練學習模型的各種能力理念,先在已有開源數據集上訓練,再結合少量可獲取的實測數據二次訓練,亦是當前比較流行的做法。如COCO(Common Objectsin Context)數據集是一個包含物體檢測、分割和字符的大規模數據集[49,54];VisTex圖像集是一個專門提供紋理圖像的大數據集,可使網絡模型獲取較強的曲線、邊緣、輪廓等特征的提取能力[59]; PASCAL VOC ( Pattern Analysis, Statistical Modelling and Computational Learning, Visual Object Classes)數據集為圖像識別和分類提供了一整套標準化的優秀的數據集[60]。

4.3 跨域泛化能力的提高

為了解決目標特征標簽及用于訓練模型數據量不足的問題,大多數機器學習算法常采用重采樣或人造數據(如數值模擬)的方法,但此類方法不能保證識別結果的準確性。遷移學習是充分利用機器學習在大樣本集(源域數據)上學得的特征(預訓練),去解決與其相似但不同的小樣本集(目標域數據)中的分類任務。如無人機地震泥石流信息檢測領域,在已構建地震泥石流災害樣本庫的基礎上,將卷積神經網絡訓練得到的特征遷移到地震泥石流災害信息檢測中,完成地震泥石流災害信息的自動檢測。醫學腫瘤人工智能診斷方面,通過一定量自然影像訓練后的深層卷積神經網絡模型,采用少量醫學樣本進行參數優化,并將微調后的深度學習模型進行新的病例診斷[61,62]。機械控制領域,小樣本下基于遷移學習的軸承狀態深度學習識別是通過人為預先標簽故障數據進行學習訓練,將遷移學習獲取的新模型應用于新的機械故障診斷數據[63]。研究表明,深度學習的特征遷移可以解決目標域數據少、數據分配不均衡等問題,但有限的源域數據及其與目標域數據的特征提取問題需要謹慎處理。

合成孔徑雷達(Synthetic Aperture Radar,SAR)數據解譯智能化領域,如圖9所示,基于仿真SAR圖像深度遷移學習的自動目標識別[64]、基于MSTAR數據集卷積神經網絡結合遷移學習的SAR目標識別[65]、基于協會標準數據集遷移學習的小樣本機載激光雷達點云分類[66]、基于GoogleNet訓練模型遷移學習的雷達信號類型自動識別方法[67]不斷涌現??梢?在源域與目標域數據滿足同構條件下,基于大數據集預訓練的遷移學習與神經網絡相融合,進而開發智能化算法,獲得了較好的應用效果。但需要注意的是,SAR數據觀測環境相對簡單,同時,預訓練數據集質量控制是當前遷移學習在SAR智能化數據解譯研究領域的關鍵因素。

圖9 基于仿真圖像的遷移學習過程Fig.9 Transfer learning process based on simulated images

針對GPR探測領域而言,上述有效的預訓練大數據集在通常情況下無法得到滿足,深度學習模型缺乏有效的泛化能力,遷移學習在該方向的理論與應用研究甚少,但潛在應用前景較好。如地下管線GPR探測遷移學習智能化研究,利用數值模擬獲得大量預先設置模型的數據集,用于遷移學習預訓練。由于管線目標相對單一,特征提取較為簡單,該研究成果取得了一定的試驗效果[68]。再如隧道地質預報方面,通過引入數據擴增技術,增加標記某段工程的樣本數據量,開展遷移學習的探索試驗。而基于隧道實測數據具有明顯的紋理特征與VisTex圖像集(由麻省理工學院提供)特征相似策略,采用上述VisTex圖像集作為源域數據來預訓練網絡模型[59]亦得到了發展。因而,如何搭建滿足遷移學習所需相似特征分布的同構源域數據集,是GPR遷移學習智能化數據解譯發展的重要研究方向。

綜上所述,深度神經網絡學習對復雜GPR智能化數據解譯能力的提高、遷移學習預訓練特征提取對小樣本數據智能化檢測的效果改進,意味著兩者結合或將是未來極具潛力的智能化技術。

5 結論及發展趨勢

隧道地質災害超前預報智能化解譯是GPR領域的研究熱點,這種智能化解譯的實現與推廣,可有效解決觀測數據異常識別定性依賴于解譯人員的工程經驗或簡化方法問題;可提高檢測效率,并降低地質預報成本;改善定量解譯處理過程目標模型反演(或偏移成像)問題由于觀測數據欠定性出現的病態和多解性現狀,實現地質預報目標體準確成像。因而,隧道地質災害GPR超前預報智能化解譯研究得到了快速發展。隨著隧道地質災害GPR工程勘探對象的日益復雜化和智能化預報要求的日益精細化,為使GPR智能化解譯算法更好地應用于實際問題中,解決復雜隧道環境下高效、高精度的智能解譯問題,筆者認為隧道地質災害GPR超前預報智能化解譯未來的發展趨勢主要集中在以下三個方面:

1)人工智能學習模型研究一直是所有智能化解譯算法的核心部分,目前GPR隧道地質預報智能化解譯應用主要在規則災害的種類識別方面,考慮到現實GPR隧道地質災害目標體是不規則的,智能化預報解譯智能算法特征提取與規則目標體的學習模型具有明顯的不同,同時亦并不意味著學習模型層數越多,其特征提取能力越強;針對GPR隧道地質災害預報特殊數據集及不規則地質災害多目標檢測進行構建特征提取學習模型、適應動態持續特征提取、不斷完善特征提取能力的高效學習模型構建將得到重視。

2)針對隧道地質災害超前預報特殊的工作環境及檢測目標,足夠數量訓練數據集及高質量標簽數據的獲取,仍然是GPR智能化解譯算法實現的必備條件之一。盡管某個隧道或某條隧道個別項目數據極其有限,但如何通過區域內隧道地質災害GPR超前預報數據的收集、分類并動態持續高質量進行標簽工作;如何基于小樣本訓練集構建、數據增強滿足無監督學習、半監督學習及增量學習等或將是今后研究的重點。

3)由于隧道地質災害GPR超前預報數據集的特殊性,觀測的GPR數據難以滿足人工智能算法訓練和測試要求,大部分情況是需要根據不同工區領域的數據訓練得到目標檢測模型,進而提高模型效果;隨著GPR大行業實測數據集的發展和開源,基于現有數據集的遷移學習,亦將是未來GPR隧道地質預報智能化解譯跨領域泛化能力提高的主要發展方向之一。

猜你喜歡
智能化神經網絡隧道
與隧道同行
智能化戰爭多維透視
印刷智能化,下一站……
神經網絡抑制無線通信干擾探究
神奇的泥巴山隧道
基于“物聯網+”的智能化站所初探
黑乎乎的隧道好可怕
基于神經網絡的拉矯機控制模型建立
復數神經網絡在基于WiFi的室內LBS應用
LED隧道照明節能改造探討
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合