?

深度學習在農業領域的研究與應用

2024-04-23 19:28梁美靜毛克彪郭中華袁紫晉
農業工程 2024年1期
關鍵詞:智慧農業卷積神經網絡深度學習

梁美靜 毛克彪 郭中華 袁紫晉

摘 要: 深度學習是目前人工智能領域最重要的技術之一,在學術領域和工程應用中掀起了研究高潮。鑒于深度學習在農業領域的應用潛力和重要性,通過對深度學習有關文獻的研究,詳細描述了深度學習的概念,結合典型深度神經網絡的結構特征,對其特點、優缺點、變體及應用現狀進行了綜述;重點介紹了深度學習在語音識別、農業場景目標檢測、農業圖像語義分割領域的發展和應用;分析了深度學習在農業領域應用中存在問題和未來重點研究方向。

關鍵詞:深度學習;農業應用;卷積神經網絡;遞歸神經網絡;智慧農業

中圖分類號:S126 文獻標識碼:A 文章編號:2095-1795(2024)01-0030-07

DOI:10.19998/j.cnki.2095-1795.2024.01.005

0 引言

隨著人工智能技術和現代農業的發展,深度學習對于農業發展的重要性越來越顯著。深度學習在農業生產領域的應用不僅將成為現代農業的研究熱點之一,更是實現農業智能化的重要手段。深度學習作為一種包含多層網絡結構的機器學習模型,其深度表示從輸入到輸出的轉換步驟,并表示輸入層和輸出層之間的脈沖連接。深度學習利用多層神經網絡模型對數據訓練得到模型特征,通過將低層次特征組合成高層次特征來實現對數據的抽象表示。與深度學習相比,淺層學習通常需要借助人工經驗提取樣本特征,最終得到的是無層次結構的單層特征。淺層學習將被限制在不超過兩層非線性特征轉換層。而深度學習則可以通過對原始信號的逐層特征變換,自動地學習獲得層次化的特征表示。2006 年,HINTON G E 等[1] 首次提出了深度學習的概念和一種逐層貪婪的無監督訓練算法,利用分層初始化的策略使深度學習結構能夠很好解決淺層學習存在的問題。隨著深度學習的興起,許多研究應用中不需要再對特征進行單獨的選取和變換,而是將原始數據輸入到模型中,通過模型的自動學習得到適合分類的特征表示。

隨著云計算、大數據、物聯網等技術的快速發展,以及互聯網領域各種應用的出現,深度學習成為了近年來計算機科學領域最重要的發展,影響了包括農業的各個科學領域,促使世界互聯網科技巨頭公司之間競相推進深度學習,極大地推動了人工智能的發展。大數據蘊含豐富的價值和發展潛力,伴隨著數據規模的爆發式增長和海量聚集,深度學習模型作為人工智能的核心技術模型也不斷更新,反映了當前科學技術的最新研究進展。在農業領域,利用深度學習對農業大數據進行分析和有效利用是解決傳統農業存在問題和發展現代農業的重要手段,同時促進深度學習與農業的深度融合是實現農業智能化的重要途徑。本研究鑒于深度學習在農業領域的重要性及熱門程度,綜述不同類型的深度學習網絡架構及其優缺點、深度學習在農業上的發展和典型應用,針對大數據背景下深度學習目前存在的問題,展望其未來發展趨勢。

1 深度學習網絡結構

隨著大數據和計算能力的不斷提升,深度學習網絡結構在農業領域中被廣泛研究和應用。深度學習的概念現在泛指基于多層網絡結構的各種機器學習模型,每層均構成一個非線性信息處理單元。深度學習網絡結構可以對復雜和非線性關系進行建模并生成模型,因此在農業生產中研究和選擇合適的深度神經網絡結構模型及其變體至關重要。本研究通過表1 對卷積神經網絡和遞歸神經網絡架構的特點、優缺點、應用領域進行對比分析,在實際應用時根據不同網絡模型的特性進行選擇。

1.1 卷積神經網絡

卷積神經網絡是一類包含卷積計算的典型深層前饋神經網絡,是深度學習的代表算法之一。卷積神經網絡由仿造生物的視知覺機制構建,能夠進行平移不變分類。卷積神經網絡的結構是由輸入層、卷積層、池化層、全連接層和輸出層組成,如圖1 所示。卷積神經網絡具有局部感知和權值共享的特點,這使得它更接近于生物神經網絡,這種網絡結構可以有效地降低網絡模型的復雜性和減少權重的數量來提升神經網絡的泛化能力。卷積層也稱為特征提取層,主要作用是通過卷積運算提取圖像的不同特征。卷積層包含卷積、激活函數和最大池化3 種操作,上一層的特征面被卷積核卷積,卷積結果經過激活函數后輸出形成下一層的特征面的神經元,從而形成下一層對應的某個特征面的特征。池化層通常位于卷積層之后用于二次特征提取,并且它的每一個特征面都與池化層中的特征面唯一對應。池化層通過不同的池化操作對特征圖進行降維,來提高特征的尺度不變特性。全連接層主要是對提取的特征進行分類,然后輸出到輸出層。全連接層的每個神經元與其上一層的所有神經元全連接,以整合卷積層或者池化層中具有類別區分性的局部信息,但同時特征圖的空間結構會被破壞并且產生大量的冗余參數,通常用卷積層或全局平均池化層替代全連接層的方法來解決。

LeNet-5 模型是較早出現的卷積神經網絡[2]。作為卷積神經網絡的經典模型,其主要應用在計算機視覺領域中的手寫字符識別,在MNIST 數據集上的錯誤率只有0.9%,但它不能識別大規模圖像等復雜問題,其主要原因歸咎于當時的計算機的軟硬件基礎設施較差,缺乏大規模的訓練數據。目前LeNet-5 模型在農作物品種識別和分類、病害蟲識別、雜草識別及判斷農田土壤質量等方面應用較為廣泛。隨著研究的不斷深入和大數據時代的到來,KRIZHEVSKY A 等[3] 提出一種與LeNet-5 模型結構相似但具有更寬和更深結構的卷積神經網絡AlexNet。此模型使用了ReLU 激活函數、Dropout、GPU 加速技術及高效的GPU 支持的程序來解決ImageNet 問題,在ImageNet 大規模視覺識別挑戰競賽(LSVRC)中超越之前所有解決圖像分類任務的方法并贏得了冠軍,這使得卷積神經網絡再次流行起來并愈發受到研究人員的重視。此模型在處理復雜農產品病蟲害圖像方面比以往模型更具優勢。隨著卷積神經網絡不斷與傳統算法相融合及網絡架構不斷加寬加深的趨勢,并且針對出現的問題不斷提出改進措施,使得圖像識別和分類、目標檢測、目標分割和自然語言處理等技術在農業領域均獲得了成功的應用。盡管卷積神經網絡具有較好的應用前景,但也存在一些問題。一是目前農業領域的標注數據集相對較小,不足以支撐大規模的深度學習訓練。因此如何提高數據質量和數量是未來需要解決的關鍵問題之一。二是由于農業領域涉及的農作物種類、生長環境等因素較多,使得模型的泛化能力面臨一定的挑戰。如何改進卷積神經網絡的結構,提高模型的訓練速度和泛化能力是進一步研究的方向。三是如何進一步拓展卷積神經網絡在農業領域中的應用場景,為農業生產提供更加可靠和高效的智能化支持,助力農業領域的可持續發展。四是卷積神經網絡本身的數學模型缺少完善的數學驗證與解釋,卷積神經網絡的相關理論研究對于進一步發展有重要意義并且是當前最為匱乏也是最有價值的。

1.2 遞歸神經網絡

遞歸神經網絡作為深度學習領域一種重要的神經網絡,打破了傳統前饋網絡每個輸入和輸出一一對應的局限。遞歸神經網絡具有存儲性,通常用來處理序列數據,對序列數據進行特征提取和建模。其中常見的序列數據是語音、文本和視頻等,這類數據在處理過程中需要存儲前后時刻的信息,某一時刻的輸出對記憶和當前輸入都有依賴性。遞歸神經網絡結構主要由輸入層、隱藏層和輸出層構成,如圖2 所示,圖中t表示時刻,向量x、h、o 表示各層的數值,U、W、V表示各層傳輸的權重。各隱藏層之間互相連接,即遞歸循環網絡當前時刻的輸出不僅取決于當前的輸入,還取決于前一時刻的輸出。

遞歸神經網絡在處理長期依賴關系的時序數據中表現突出,在實際訓練過程中經常會發生梯度消失和梯度爆炸問題。MEMORY L S T[4] 針對出現問題提出了遞歸神經網絡的變體長短期記憶(LSTM)網絡。長短期記憶網絡是在隱藏單元引入了門控結構的遞歸神經網絡,增加了記憶功能,能夠較好地避免梯度消失或爆炸問題,讓網絡更好地處理長期或短期依賴關系的時序數據。長短期記憶網絡因其本身的優良性能,被廣泛應用在農業領域的氣象預測、作物病害檢測、農田監測和產量預測等方面。長短期記憶網絡的變體,如門遞歸單元 (gated recurrent unit, GRU)、卷積LSTM、窺視孔 LSTM(peephole LSTM)在農業方面得到廣泛應用[5-7]。于珍珍等[8] 基于SSA-LSTM 網絡模型對玉米種植期的土壤含氧量進行預測和分析,通過與BP、LSTM、GA-LSTM 和PSO-LSTM 預測模型試驗進行對比發現此模型的預測精度遠優于這4 種模型,其預測精度R2=0.959。賀志將等[9] 設計了一種基于VMD-LSTM 的動態稱量算法來預測奶牛體質量,預測EMRE 僅0.81%,ERMSE 為6.21 kg。王春穎等[10] 設計了一種基于ST-LSTM 的植物生長發育的預測模型,模型預測的圖像序列與歷史生長發育圖像序列相似度較高,在實際應用有一定的可行性,提高農業生產效率。

2 深度學習的應用

深度學習憑借著處理大量無標簽樣本及優秀的特征學習能力在很多應用領域正逐步替代傳統的機器學習方法。同時,深度學習的成功應用和目前計算機軟硬件技術的提高也讓越來越多的領域嘗試使用深度學習的方法去研究。深度學習已經在農業圖像處理、農業自然語言處理、農業計算機視覺和智慧農業等領域成為了研究焦點并且取得了一定的研究成果,但深度學習的應用領域不局限于這些。本研究將從語音識別、目標檢測和圖像語義分割技術在農業領域的研究情況及典型應用進行介紹。

2.1 語音識別

隨著移動互聯網和人工智能不斷發展,語音識別作為實現人機信息交互的重要技術,吸引了越來越多的研究人員對其領域進行研究并促使了語音識別技術在農業生產領域的應用和發展。語音識別技術在農業領域主要應用于智能化農機設備和智能農業管理系統中,實現語音交互以提高農業生產效率。語音識別是計算機對語音信息識別和理解并轉化為文本信息或指令的技術。傳統語音識別方法主要是基于GMM-HMM模型進行訓練的,其模型是淺層網絡模型,淺層網絡模型在處理語音信息中有一定的局限性,特別是處理高維語音數據時會增加模型計算負擔[11]。2009 年,深度學習的概念首次被應用到語音識別領域。2012 年,多倫多大學、微軟研究院(MSR)、谷歌和IBM 研究院的研究小組成功證明了深度神經網絡在語音識別方面優于傳統的高斯混合模型GMM,可被用于各種數據集的語音識別,包括具有大詞匯量的大型數據集[12]。深度學習與傳統方法相結合的方式推動了語音識別技術的快速發展,進而推動了語音識別技術在農業領域的發展。李江岱等[13] 提出基于LM-BP 神經網絡的采摘機器人語音識別系統使機器人對語音識別準確度提高,從而提高了采摘機器人的環境適應能力,實現采摘作業自動化。張鋒等[14] 提出基于雙向長短時記憶(Bi-LSTM)網絡的語音識別模型來控制機器人,數據集訓練的識別率>80%。在農業領域利用深度學習語音識別技術對農業機器人進行智能化控制,如通過語音指令實現自動化灌溉、除草等操作提高農業生產效率。

近年來,語音識別技術主要基于遞歸神經網絡(RNN),根據不同的應用場景和需求對其進行改進或綜合其他深度學習模型。端到端語音識別方法是目前語音識別領域的研究熱點,主流的端到端的語音識別方法有基于連接時序分類(CTC)和基于注意力機制 (attention model)兩類方法及其優化方法,在很多應用場景中都有不錯的識別效果[15-16]。語音識別在農業領域主要應用在農業信息采集、畜禽疾病檢測、語音控制無人農機等,語音識別在提高農業智能設備的人機交互發揮了重要作用。趙建[17] 為應對豬呼吸道疾病的預警,提出基于雙向長短時記憶網絡(BLSTM)和連續時序分類(CTC)聲學模型的豬連續咳嗽聲識別系統,通過試驗測試得到最佳試驗組豬咳嗽聲識別率達到93.63%。脫小倩[18] 提出了一種基于空洞卷積技術的Enhance 降噪網絡實現害蟲聲音識別和降噪,利用InsectFrames_2 對降噪之后的信號識別,識別精度達到68.75%??傮w而言,語音識別技術已經在農業領域成功應用并獲得了很多的研究成果,但理想安靜場景與復雜噪聲場景的語音識別準確率仍相差甚遠,因此語音識別方法的研究仍然任重而道遠。

2.2 計算機視覺

計算機視覺是研究計算機如何從數字圖像或視頻中獲得高層次理解,目的是讓計算機能夠模擬人眼對目標識別、跟蹤、檢測和其他視覺方面問題的具體過程,實現對輸入的圖像或視頻進行有效處理。隨著計算機視覺技術將與深度學習技術相結合,使得基于大規模數據集應用于農業生產管理的各個方面,更好地解決當前的農業問題,提高農業生產效率,進一步推動農業自動化和智能化的方向發展?;谏疃葘W習的計算機視覺技術在農業上的應用主要在植物目標檢測、植物病蟲害目標檢測、農業場景語義分割及病害圖像識別等。

2.2.1 農業場景目標檢測

目標檢測主要研究目的是能夠在給定的圖像或者圖像序列準確定位目標并判斷目標的具體類別。隨著基于深度學習的目標檢測研究,目標檢測在植物目標識別、農產品質量檢測及病蟲害識別等領域彰顯了重要的實際應用價值,但在現實目標檢測過程中,由于目標位置、大小和數量的不確定性和其他外在因素影響,導致其過程具有一定的復雜性和困難度。

傳統目標檢測方法是基于淺層分類器和手工設計特征的方法,主要是采用滑動窗口的方式對圖像實施候選區域選擇,然后應用HOG、SIFT、Haar、LBP 等方法提取圖像特征,進而把所提取的特征傳遞給分類器來確定候選區域的類別[19-22]。但傳統目標檢測方法在實際應用中不夠理想。隨著深度學習的持續發展以及在各個領域成功應用,眾多研究人員開始對基于深度學習的目標檢測方法進行研究,解決傳統目標檢測方法存在的問題,從而提高目標檢測的性能?;谏疃葘W習的目標檢測方法中比較典型的有基于候選區域的R-CNN、Fast R-CNN、R-FCN 及Mask R-CNN 等目標檢測模型,以及基于回歸的YOLO、SSD 及其改進方法[23-28]。隨著基于深度學習的目標檢測模型精度不斷提高,使用深度學習相關技術實現精確的農業場景目標檢測成為研究人員重點研究方向。余賢海等[29] 為克服花朵目標檢測不高的問題,提出一種在YOLOv5s 網絡基礎上增加卷積塊注意力模塊(CBAM)并利用加權框融合(WBF)方法的模型ACW_YOLOv5s,使模型對番茄花朵的目標檢測準確度提高到0.957、召回率0.942。武星等[30] 針對蘋果檢測識別提出一種基于YOLOv3 的輕量Light-YOLOv3 方法,其主要思想是利用一種類似殘差塊串聯的特征提取網絡與深度可分離卷積相結合,試驗表明模型檢測準確率達到94.69%。朱紅春等[31] 設計了基于Faster R-CNN 模型的目標檢測算法對復雜背景下的茶葉嫩葉類型進行檢測,檢測準確率和召回率都遠優于傳統目標檢測方法。王宇歌等[32] 設計基于YOLOv3 的目標檢測模型對測試圖像進行麥穗目標檢測與計數方法,模型在麥穗檢測中性能較好,檢測精確率達到76.96%、召回率93.16%,在產量估算上有實際意義。ZHOU C 等[33] 提出了一種重構的殘余致密網絡用于番茄葉病害檢測, 模型在AIChallenger 1 數據集中的番茄測試數據集上的平均識別準確率達到95%,在作物葉片識別和檢測方面可以比大多數現有模型獲得顯著改進,以更少的計算來實現高性能。FUENTES A 等[34] 使用Faster R-CNN、RFCN和SSD 檢測器從番茄葉圖像中識別10 種疾??;在對病蟲害檢測時,3 種檢測器與深度特征提取器VGG16、ResNet50 和ResNet152 的不同變體相結合,其中VGG16 在FRCNN 之上實現了83% 的最高平均精度。

2.2.2 農業圖像語義分割

圖像語義分割是通過一定方法對圖像的每個像素進行分類,把圖像分割為若干具有一定語義含義的區域塊并分配提前設定的標簽。隨著深度學習在計算機視覺方面的發展,基于深度學習的圖像語義分割在農業遙感圖像處理、農業病蟲害防治和檢測農作物生長狀態等方面應用廣泛?;谏疃葘W習的圖像語義分割無需人工設計特征,將海量的圖像數據直接輸入到深層神經網絡,自動處理復雜的圖像數據,最終獲得高層次的抽象特征。

LONG J 等[35] 在2015 年首次提出了應用全卷積網絡(FCN)實現圖像的像素級語義分割,可以處理任意尺寸大小的輸入圖像并通過端到端的方式獲得每個像素的目標分類結果。其他圖像語義分割的方法如SegNet 有效提升了分割結果的精細度并降低了圖像信息的損失和計算復雜度[36]。DeepLab v1 利用了全連接條件隨機場(CRF)的方法提高捕獲邊界細節的能力和分割結果的準確度[37]。有研究人員在DeepLab v1 的基礎上進行改進,提出了DeepLab v2、DeepLab v3 等模型,使得語義分割性能不斷增強[38-39]。王書志等[40] 利用SegNet、FCN 和U-NET 網絡對葡萄新梢進行圖像分割,FCN 網絡在復雜天氣背景下的分割精度都優于其他兩個網絡,其中FCN 網絡在標準測試集中的分割精度高達93.85%。楊蜀秦等[41] 提出一種改進的DeepLabv3+深度語義分割模型用于無人機多光譜遙感影響的農作物分類,試驗結果表明,模型對向日葵、玉米和西葫蘆3 種作物的平均像素精度達到93.06%,其平均交并比達到87.12%。李余康等[42] 針對復雜背景下的葡萄葉語義分割處理,采用DeepLab v3+模型算法進行特征提取和訓練學習,實現對葡萄葉的自動分割,能夠有效識別患病葡萄葉,試驗表明,對不同類別葡萄葉圖片的分割平均像素準確率98.6%。黃林生等[43] 提出的基于UNet 的語義分割模型可對生菜多光譜圖像實現性能較好的前景分割,平均像素分割準確率99.19%,平均交并比高達94.98%。董秀春等[44] 對四川省柑橘研究區進行試驗提出的基于U-net 和DeepLab v3+語義分割模型,并利用高分辨率遙感Google earth 圖像來提取果園空間信息,兩種模型在其分類總精度相當,模型預測的面積估算精度高達92%。

3 結束語

深度學習可以自動地提取特征,本質上是分層次的特征提取確定目標的過程。深度學習利用海量數據訓練模型參數和含有多層隱含層的神經網絡模型提取最佳參數,將低層特征組合形成高層次的復雜特征。深度學習技術作為發展最快、適應性最強的技術之一,在農業領域,深度學習與語音識別、圖像處理和計算機視覺等技術結合的應用方面有顯著優勢。物聯網技術、大數據的發展及深度學習的應用將會彌補傳統農業的缺陷。但目前存在的問題是深度學習需要大量的數據來進行訓練和優化,在農業領域由于很多樣本數據缺少標注使采集成本較高。另外深度學習缺乏堅定的理論基礎,深度學習模型的黑箱問題使無法理解其工作原理和工作方式,缺乏一定的可解釋性,限制了其在農業生產中的應用范圍。

研究了幾種典型的深度學習網絡模型并比較其優缺點,重點介紹了深度學習融合其他技術在農業領域的應用與優勢。深度學習發展迅速而且包含內容廣泛,可與大數據分析技術、物聯網技術、遷移學習及強化學習等相結合解決農業領域面臨的問題。在實際應用中,深度學習針對種植業方面的識別、檢測、分類等有眾多的研究應用,在畜禽養殖方面的研究應用相比之下較少,仍需進一步擴展深度學習在農業領域的應用場景和研究應用。大數據背景下,基于深度學習的畜禽行為特征識別和生長環境監測,與深度學習融合的農機設備應用到實際生產,加強深度學習在植物學、環境科學、動物學等領域的交叉研究,以及研究如何通過深度學習算法提供快速和準確的響應等均將成為未來研究的重點。大數據技術的發展在推動農業信息化、精準農業、農業智能化發揮重要作用,利用深度學習技術促進農業現代化發展是未來趨勢。

猜你喜歡
智慧農業卷積神經網絡深度學習
基于深度卷積神經網絡的物體識別算法
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
基于深度卷積網絡的人臉年齡分析算法與實現
北斗衛星對智慧農業的作用與應用探討
基于卷積神經網絡的樹葉識別的算法的研究
延邊地區“互聯網+農業”發展研究
基于物聯網技術的智慧農業實施方案分析
基于安卓的智慧農業APP設計與實現
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合