?

深度學習算法應用于巖石圖像處理的可行性研究

2016-11-07 22:20程國建劉麗婷
軟件導刊 2016年9期
關鍵詞:卷積神經網絡深度學習

程國建++劉麗婷

摘要:近年來,機器學習領域中的“深度學習”開始受到國內外學者的廣泛關注。借助深度學習,具有多處理層結構的計算機模型可通過多層抽象來學習數據表征。這些方法推動了語音識別、視覺識別、目標檢測以及許多其它領域的技術發展。深度學習被應用到計算機視覺、語音識別、自然語言處理、在線廣告等領域,并取得了良好效果。將計算機技術與地質勘探相結合,在巖石處理方面已取得了不少成果,不斷有新的或者改進方法用于提高處理效率和改善效果,以更好地投入到實際生產中去。針對目前傳統的巖石薄片圖像處理方法,試圖將深度學習中典型的兩類算法模型:深度信念網絡(Deep Belief Networks,DBNs)、卷積神經網絡(Convolutional Neural Networks,CNNs)引入到巖石圖像的處理中,分析算法在操作中的可行性及優勢。

關鍵詞:深度學習;深度信念網絡;卷積神經網絡;巖石圖像處理

DOIDOI:10.11907/rjdk.161408

中圖分類號:TP317.4

文獻標識碼:A文章編號文章編號:16727800(2016)009016304

基金項目基金項目:陜西省自然科學基礎研究計劃項目(2014JQ5193);西安石油大學青年科技創新基金項目(2014BS13)

作者簡介作者簡介:程國建(1964-),男,陜西扶風人,西安石油大學計算機學院教授,研究方向為機器學習、模式識別、圖像處理與數據挖掘;劉麗婷(1991-),女,江蘇靖江人,西安石油大學計算機學院碩士研究生,研究方向為智能計算與可視化技術。

0引言

機器學習已經逐漸滲透到現代生活的方方面面,從網頁搜索到社交網絡內容過濾,再到電商推薦,在相機、智能手機等電子產品中的應用也越來越多。自20世紀80年代以來,機器學習在算法、理論和應用等方面都獲得了巨大成功。從2006年起,國外開始了深度學習方面的深入研究,并取得了一定的階段性成果。深度學習(Deep Learning,DL)[1]的概念來源于人工神經網絡,所謂“深度”是含多隱層的感知器。深度學習可以將低層次特征有效組合起來,逐步進行學習與特征提取,形成能夠表示屬性類別的抽象高層次特征。

傳統的巖石薄片圖像鑒定以肉眼觀察和描述為主,存在一系列問題,如實驗周期偏長、定量困難、效率較低、受主觀影響較大等,在低孔隙度、低滲透率巖心條件下存在問題很多,因此已不能滿足現場測井資料解釋評價的需要。針對目前巖石分析工作中存在的實際問題,應用現代圖像處理以及人工智能技術領域的深度學習算法對巖石薄片圖像進行礦物識別、信息提取、巖石分類、巖心重構、特征標注等處理極具理論和現實意義。人工神經網絡因其多隱層結構而具有良好的特征學習能力,能將數據本質更好地表現出來,對數據的可視化和模式分類十分有利。這對于測井解釋中的巖石物理研究是非常必要的。同時,深度學習模型的層次、參數多,容量大,滿足了巖石圖像分析中海量數據的處理需要。

1深度學習(Deep Learning)

根據加拿大多倫多大學教授Geoffrey Hinton 2006年在《Science》上發表的文章[2],以及Yoshua Bengio、Yann Lecun等人的相關工作,深度學習逐漸被人們關注?!吧疃葘W習”指多層的人工神經網絡和訓練方法。一層神經網絡會把大量矩陣數字作為輸入,通過非線性激活方法取得權重,再產生另一個數據集合作為輸出。其類似生物神經大腦的工作機理,通過合適的矩陣數量,將多層組織鏈接在一起,形成神經網絡“大腦”來進行精準復雜的處理,并通過“逐層初始化”(layerwise pretraining)克服深度神經網絡在訓練上的難度[3]。用較少的參數表示復雜函數是多層優勢的體現。深度學習將具有多隱層的機器學習模型和海量的訓練數據構建起來,用“深度模型”的手段達到“特征學習”的目的,最終提升分類或預測的準確性[4]。

在對巖石圖像的特征信息提取、巖石分類、巖心重構、特征標注、孔隙識別等處理中運用了大量圖像處理與人工智能技術,經過大量反復實驗表明,圖像處理技術在測井實際應用中已經有了良好基礎[57]。將深度學習運用到巖石圖像的處理分析中,具有重要的研究意義與較大的發展空間。

深度學習模型有多種,如深度信念網絡、卷積神經網絡、自動編碼器等,通過與其它方法的結合改進,又出現了一些新方法。深度學習的各類算法模型有著各自的特點與優勢,在語音、圖像、自然語言、在線廣告等領域的應用取得顯著進展[8]。Volvo采用NVIDIA車載深度學習電腦來提供更安全的駕駛服務;中國科學院計算機技術研究所發布了全球首個能“深度學習”的神經網絡處理器芯片,名為“寒武紀”;不久前,谷歌DeepMind開發的人工智能圍棋程序AlphaGo戰勝世界冠軍李世石,在深度學習領域取得了重大突破。但在巖石圖像處理中采用深度學習方法仍不多見,人們大多還是采用傳統方法,如濾波算法、邊緣檢測、決策樹、支持向量機等。通過閱讀學習大量有關深度學習的資料,結合巖石圖像的實際特征,分析各類算法在巖石圖像處理中的可行性是本文的主要目的。

2深度信念網絡及其在巖石圖像處理中的應用

2.1深度信念網絡簡介

深度信念網絡(DBNs-Deep Belief Networks)是無監督的概率生成模型,2006年由Hinton等人提出。從結構上看,DBNs是由多個無監督的受限玻爾茲曼機(RBM-Restricted Boltzmann Machines)堆疊而成,最后還有一層有監督的反向傳播BP網絡。對于圖像而言,可視層與像素層對應,隱層與特征描述因子對應。

DBNs需要經過預訓練(per-training)和微調(fine-tuning)兩個階段:在預訓練階段采用無監督方式訓練第一層的RBM,固定其權值和偏置值,將該層的輸出作為第二層RBM的輸入,再訓練第二個RBM,然后將其堆疊在第一個RBM的上方,重復堆疊多次,構建DBN網絡的初步模型。在微調階段使用Contrastive Wake-Sleep(對比喚醒-休眠)算法修改權重,使每一層的RBM特征向量映射達到最優。

圖3中的y1部分是在最頂層RBM中參與訓練的標簽。微調過程是一個判別模型。

2.2DBN在巖石孔隙識別中的可行性分析

DBN模型是一種逐層貪婪預訓練的深層神經網絡模型,它克服了傳統神經網絡在訓練上的難度,挖掘隱藏在圖像像素特征之中的高維抽象特征。它是深度神經網絡模型的典型代表,受到了學者們的廣泛關注[910]。在現有研究成果中,已有將模糊C均值聚類和BP神經網絡結合起來處理鑄體薄片圖像的方法[11],達到了良好的孔隙度識別效果;還有學者提出巖石圖像分類的自動模式識別方法[12],通過神經網絡建立特征空間與巖石圖像之間的映射關系,能夠快速準確地識別巖石圖像類型。由此可見,利用神經網絡進行巖石圖像的處理已有不少具體應用,而深度信念網絡是在傳統神經網絡基礎上加以優化改進,例如:根據人臉特征提出基于Gabor小波與深度信念網絡的人臉識別方法[13],取得了較高的學習效率和很好的識別效果;將深度信念網絡應用于軸承的故障識別[14];運用DBN模型,將環境和氣象數據編碼,對特定區域進行PM2.5的檢測等[15]。因此,基于現有的巖石圖像處理和深度信念網絡的研究成果,針對巖石圖像的孔隙提取問題,結合傳統的圖像處理技術,嘗試采用DBN模型進行特征提取。該方法不僅在理論層面上具有可行性,在具體應用中也具有現實意義。擬定技術路線如圖4所示。

分析應用步驟如下:①將巖石薄片圖像轉換為CIE lab彩色空間;②采用圖像分割技術將預處理后的圖像分割為目標和背景兩類;③在目標和背景中各選取10組特征向量,提取特征;④隨機選取部分特征向量送入DBN模型中進行訓練;⑤選取500組256×256的圖像,將分割后的圖像整幅送入訓練好的神經網絡中,運用訓練好的網絡進行巖石孔隙的識別。

3卷積神經網絡及其在巖石圖像處理中的應用

卷積神經網絡(CNNConvolutional Neural Networks)[16,17]是第一個真正成功實現多層網絡結構的學習算法。它提高普通前向BP算法訓練性能的方式是利用空間關系減少需要學習的參數數目。其權值共享網絡結構與生物神經網絡類似,網絡模型的復雜度在一定程度上得到了降低,并且權值數量也有所減少。該優勢集中體現在網絡的輸入是多維圖像時,能夠直接將圖像作為網絡輸入,避免了傳統識別算法中復雜的特征提取和數據重建過程。

在卷積神經網絡中,輸入圖像特征圖的產生是由輸入圖像本身與卷積濾波器進行卷積得到的,再提取圖像中的局部特征。圖6中的C1層(采樣層)即為經過濾波和加偏置操作后得到的特征映射圖,之后再進行像素求和、加權等操作產生S2層(亞采樣層)的特征映射圖。依次進行操作,最后將得到的多個特征映射轉化成特征向量,以完全連接的方式輸出。CNN的訓練算法與傳統的BP算法類似,主要有向前傳播和向后傳播兩個階段:第一階段主要是從樣本集中選取樣本輸入網絡中,并計算實際的輸出結果:第二階段相當于調整階段,用極小化誤差法反向傳播來調整矩陣權值,目的是縮小實際輸出與理想輸出的差。

卷積神經網絡的主要優勢為:①輸入圖像和網絡的拓撲結構有較高吻合度;②特征提取和模式分類能夠同時進行并在訓練中產生;③權重共享減少了網絡的訓練參數,使神經網絡結構具有更強的適應性。鑒于卷積神經網絡的特點,已有基于CNN的各類具體應用:有學者提出了一種基于卷積神經網絡的視頻圖像失真檢測及分類方法[18],在目前的大數據背景下,采用卷積神經網絡對高分辨率遙感影像進行分類[19],提高了分類精度;還有將卷積神經網絡應用到植物葉片、商品圖像、奶牛個體等分類中[2022]。巖石圖像數據集較大,內部結構復雜,借鑒現有的研究成果,采用卷積神經網絡根據巖石之間的不同屬性對巖石圖像進行分類。

基于CNN的巖石薄片圖像分類方法如下:①輸入層。當原始圖像不是灰度圖像時,首先進行灰度化;②C1層。C1層是一個特征提取層,獲得二維特征圖,卷積得到的結果先經過激活函數(一般采用Sigmoid函數)y=Sigmoid(wx+b)進行計算,再將計算所得作為特征值賦予C1層的某個神經元。運算中x為圖像子塊,w為卷積核,b為偏置項,y為輸出;③S1層。S1層是子采樣層,子采樣的計算過程為y=Sigmoid[w·sum(xi)+b][]xi∈x;④C2層。C2也是一個特征提取層,感受進一步擴大,其將S1中的特征圖進行組合輸入再作卷積得到,相當于將原始圖像翻倍;⑤剩余卷積層與子采樣層。所提取的特征隨著深度的增加更加抽象;⑥輸出層。輸出層與S3是全連接,每個神經元都與輸出的一個神經元相連。S3到輸出層的映射相當于使用該向量進行分類。

4結語

本文在當下熱門的深度學習的環境背景下,重點介紹了深度學習的基本模型。從巖石圖像處理的角度出發,針對傳統巖石圖像處理存在的問題,將深度學習中的特征和分類器結合在一起,根據數據學習特征,提出了基于DBN的巖石孔隙識別方法和基于CNN的巖石圖像分類方法。分別介紹了兩種模型的基本結構,擬定了巖石圖像處理的技術路線及框架。在參考了諸多應用實例后,通過分析,證明了本文提出的方法在具體應用中的可行性和可操作性。深度學習能夠更好地表示數據特征,并在大規模訓練數據上取得更好的效果,減少了手工設計特征的巨大工作量,使用起來也非常方便。

參考文獻參考文獻:

[1]Mf J. Scientists see promise in deep learning programs[N].The New York Time,20121123.

[2]HINTON G E, SALAKHUTDINOV R.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504507.

[3]MOHAMED,HINTON G E,PENN G.Understanding how deep belief networks perfom acoustic modeling[M].kyoto:ICASSP,2012.

[4]孫志軍,薛磊,許陽明,等.深度學習研究綜述[J].計算機應用研究,2012(8):28062810.

[5]SWARUP CHAUHAN, WOLFRAM RHAAK, FAISAL KHAN,et al. Processing of rock core microtomography images: using seven different machine learning algorithms[J].Computers&Geosciences 2016(86):120128.

[6]HEIKO ANDR A,NICOLAS COMBARET,JACK DVORKIN,et al.Digital rock physics benchmarks—part I: imaging and segmentation[J].Computers & Geosciences,2013(50):2532.

[7]HEIKO ANDRA, NICOLAS COMBARET, JACK DVORKIN,et al. Digital rock physics benchmarkpartⅡ: computing effective properties[J].Computers&Geosciences,2013(50):3334.

[8]余凱,賈磊,陳雨強,等.深度學習的昨天,今天和明天[J].計算機研究與發展,2013(9):17991804.

[9]HINTON G E, OSINDERO S, THE Y. A fastarkof learning algorithm for deep belief nets[J]. Neural Computation, 2006,18(7):15271544.

[10]HINTON G E.Learning multiple layers of representation[J].Trends in Cognitive Sciences, 2007,11(10):428434.

[11]程國建,楊靜,劉燁.結合模糊C均值聚類與BP神經網絡的巖石孔隙識別方法[J].電腦知識與技術,2013(30):68726873,6876.

[12]郭超,劉燁.多色彩空間下的巖石圖像識別研究[J].科學技術與工程,2014(18):247251,255.

[13]柴瑞敏,曹振基.基于Gabor小波與深度信念網絡的人臉識別方法[J].計算機應用,2014(9):25902594.

[14]單外平,曾雪瓊. 基于深度信念網絡的信號重構與軸承故障識別[J].電子設計工程,2016(4):6771.

[15]鄭毅,朱成璋. 基于深度信念網絡的PM_(2.5)預測[J].山東大學學報:工學版,2014(6):1925.

[16]LECUN Y, KAVUKCUOGLUK, FARABET C. Convolutional networks and applications in vision[C].IEEE International Symposium on Circuits and Systems ,2010:253256.

[17]KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks[C].Advances in Neural Information Processing Syetems, Annual Conference, Lake Tahoe, Nevada,2012:10971105.

[18]鄔美銀,陳黎,田青.基于卷積神經網絡的視頻圖像失真檢測及分類[EB/OL]. http://www.cnki.net/kcms/detail/51.1196.TP.20151028.1119.010.html.

[19]曹林林,李海濤, 韓顏順,等.卷積神經網絡在高分遙感影像分類中的應用[EB/OL].http://www.cnki.net/kcms/detail/11.4415.p.20160127.1150.040.html.

[20]龔丁禧,曹長榮.基于卷積神經網絡的植物葉片分類[J].計算機與現代化,2014(4):1215,19.

[21]賈世杰,楊東坡,劉金環. 基于卷積神經網絡的商品圖像精細分類[J].山東科技大學學報:自然科學版,2014(6):9196.

[22]趙凱旋,何東健.基于卷積神經網絡的奶牛個體身份識別方法[J].農業工程學報,2015(5):181187.

責任編輯(責任編輯:黃?。?

猜你喜歡
卷積神經網絡深度學習
基于卷積神經網絡溫室智能大棚監控系統的研究
基于深度卷積神經網絡的物體識別算法
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合