?

用于農作物種植信息提取的圖像分割技術研究進展

2023-12-13 15:25黃祥王克曉李波吳園
南方農業·上旬 2023年9期
關鍵詞:計算機視覺圖像分割深度學習

黃祥 王克曉 李波 吳園

摘 要 為了解農作物種植信息提取領域的圖像分割技術研究現狀,對常用的圖像分割方法進行了系統性梳理。根據是否引入深度學習算法將圖像分割技術分為傳統方法和深度學習分割方法。簡要概述了閾值分割、分水嶺分割、聚類分割、邊緣分割及多尺度分割等4種傳統圖像分割方法和FCN、DeepLab及SegNet等3種基于深度學習的圖像分割方法,分析了各種方法在農作物種植信息提取中的優缺點,以及圖像分割技術目前存在的難點,以期為提高圖像分割技術在農作物種植信息提取中的應用水平提供參考。

關鍵詞 農作物;遙感監測;圖像分割;深度學習;計算機視覺

中圖分類號:S771.8 文獻標志碼:C DOI:10.19415/j.cnki.1673-890x.2023.17.020

農作物種植面積是制定農業政策和優化農作物種植結構的重要依據,快捷、準確地獲取農作物種植面積對保障糧食安全和國家經濟發展具有重要意義[1-2]。傳統的農作物種植面積監測方法大多依賴于現場目視解譯,監測時效性和精確性較差。遙感技術憑借其快速、無損、大范圍等優點已廣泛應用于農作物種植信息監測。隨著傳感器技術的快速進步,無人機遙感得以飛速發展,高光譜、高分辨率遙感影像獲取成本大大降低,在農田信息監測領域表現出巨大的應用潛力。為了能夠更好地分析農田種植信息,本文對常見的圖像分割方法進行了比較分析。

1? 圖像分割概述

圖像分割是基于圖像灰度、顏色、形狀和紋理等特征,將圖像劃分成具有獨特性質的子區域。同一子區域的像素點被認為是同類,即是對圖片中有相同性質的像素賦予相同標簽的過程[3]。根據分割機理可以分為連續分割和非連續分割,連續分割是指將具有相同特征的像素劃分為同一區域,常見的連續分割方法有閾值分割、區域生成及聚類分割等。非連續分割是利用像素值突變特性所呈現的不同邊界,常見的分割方法有邊緣分割。近年來,隨著深度學習的飛速發展,計算機視覺實現了巨大突破,其中,圖像分割作為計算機視覺領域的重要技術,也取得了突破性進展。本文以深度學習是否引入分割算法為依據,將圖像分割分為傳統分割方法和基于深度學習的分割方法,并根據類別分別簡述其經典算法。

2? 傳統圖像分割方法

傳統的圖像分割方法大多基于光譜、紋理等淺層次特征進行區域劃分,簡單且易操作,分析效率高。本節對農作物種植信息提取中常用的經典圖像分割算法進行闡述,包括閾值分割法、分水嶺分割法、聚類分割法、邊緣分割法和多尺度分割法,并簡要描述其優缺點及在丘陵山區農作物遙感監測中的應用潛力。

2.1? 閾值分割法

最早的圖像分割方法是基于閾值的圖像分割方法,通過設定不同的灰度閾值,將同類劃分在同一灰度范圍內,進行粗糙的像素級別分割。這種分割方法,對于背景和目標區別明顯的簡單場景有效。根據不同的分割規則,可將閾值分割分為:局部閾值分割方法[4]、基于點的全局閾值分割方法[5]、基于區域的全局閾值分割方法[6]。閾值分割方法簡單易實現,并且耗時較短,能迅速完成分割。然而,該類方法只考慮到光譜信息,未考慮空間信息。對于同物異譜或異物同譜等現象,閾值分割并不能取得理想的分割效果。因此,對于種植結構復雜、地形起伏較大的丘陵山區,閾值分割的應用潛力較小。

2.2? 分水嶺分割法

分水嶺分割算法是一種基于區域生長的圖像分割方法,通過像素的相似性特征對像素點進行分類并構成區域[7]。分水嶺分割是將圖像特征看作地理上的地貌特征,將圖像的邊緣輪廓轉換為“山脈”,將均勻區域轉換為“山谷”。算法過程如下:1)以局部最小值作為谷底,局部最高值作為山峰。2)通過谷底向外慢慢生長,直至覆蓋所有區域。類似于向各個孤立的山谷中注入不同顏色的水,每一種顏色代表一個類別[8]。3)當水漲起來后,為了避免不同山谷間的水開始合并,在合并處建立障礙,連同山峰構成分水嶺,完成圖像分割。分水嶺分割算法適用于大部分應用場景,其核心在于種子點和生長原則的選取,將直接影響分割效果。通常以局部極小值點作為種子點,并圍繞種子點向外生長,由于圖像中存在噪聲像元和像元缺失等情況,出現局部種子點過多,易導致分割結果出現過度分割現象,同時,該方法相對復雜,耗時較長。

2.3? 聚類分割法

基于像素的聚類分割是將具有特征相似性的像素點聚集到同一區域[9],反復迭代聚類結果至收斂,以實現分割,代表方法有K-means聚類[10]、譜聚類[11](Spectral Clustering, SC)和簡單線性迭代聚類[12](simple linear iterative Clustering,SLIC)等。K-means聚類是最著名的聚類分割算法,于20世紀60年代提出,算法過程如下:1)首先從數據庫中隨機選取K個數據樣本作為聚類中心。2)依次測量每個樣本到每個聚類中心的距離,并把它歸到最近的聚類中心的類。3)重新計算已經得到的各個類的聚類中心。

4)迭代2~3步,直至新的聚類中心與原聚類中心相等或小于指定閾值。目前,基于K-means聚類算法已經發展出大量不同的改進算法。Achanta等在2010年提出SLIC算法,該算法是一種易于實現的圖像分割算法。SLIC算法通過構造像素點距離度量標準,來衡量顏色和空間相似度,對圖像進行聚類。SLIC 算法可以將圖像中的像素劃分為超像素塊,因此也被稱為超像素分割、在運算速度、物體輪廓保持等方面具有較高的綜合評價,被廣泛應用于多種圖像分割場景。

聚類分割算法基于特征相似性原則,包括光譜、紋理等特征,需滿足同一聚類中的對象特征相似度較高,而不同聚類中的對象特征相似度較小,更適用于目標地物特征差異明顯的應用場景。在農作物種植信息提取中,超像素分割法是應用較廣的聚類分割算法,相對其他聚類分割算法,對地物邊界的還原度更好,但是也存在耗時較長的問題。

2.4? 邊緣分割法

基于邊緣檢測的圖像分割方法[13],本質上是利用像元灰度值不連續進行圖像分割,其基礎是邊緣檢測。通過邊緣檢測并連接邊界處像素點,形成邊緣輪廓,從而將圖像劃分成不同的區域。邊緣檢測通常借助微分算子,將待分割圖像與微分算子卷積,完成邊緣像元提取,獲取地物輪廓信息。根據采用的微分算子,可以區分不同的邊緣檢測算法,常用的微分算子有Canny[14]、Roberts[15]等?;谶吘墮z測的圖像分割方法,過程簡單易操作,耗時較短,性能相對優良,對像元灰度值具有明顯突變的影像分割效果較好,但該算法易受圖像噪聲和像元缺失的影響,邊界特征無法被完整描述。因此,邊緣檢測后,對于斷開的邊緣輪廓,需要通過相似性準則搜索并連接相鄰邊緣點,以完整描述邊界信息,形成有意義的邊界。

2.5? 多尺度分割法

針對傳統單一尺度分割出現過分割或欠分割情況,比如,地物面積大而分割尺度小,必然導致分割結果過于破碎,反之分割尺度大而地物面積小,則分割結果不完全。Bruzzone和Carlin等[16]提出了多尺度分割算法,該算法的核心分割模型仍然是傳統的單一尺度圖像分割模型,比如閾值分割、區域生長和邊緣分割等,區別在于利用分割模型去處理多種尺度圖像,再將各尺度下的分割結果進行融合。具體算法過程如下:1)進行尺度變換,采用小波變換或金字塔變換將原始圖像變換為不同分辨率的新圖像。2)對變換后的不同尺度新圖像,借助傳統分割模型,逐一進行單一尺度分割。3)對不同尺度分割結果進行融合,得到多尺度分割結果。多尺度分割算法通過像素級的加權平均或區域級的合并等方式進行分割結果融合,使得融合后的分割邊界較為平滑,符合農作物種植信息提取要求。特別是丘陵山區,地形復雜,地塊破碎,單一尺度分割精度不夠理想,更適合采用多尺度分割算法。當然,多尺度分割的“尺度”數量較單一尺度多,尤其分割尺度太小時,運行效率極慢。

3? 基于深度學習的分割方法

近年來,深度學習發展迅猛,卷積神經網絡(Convolutional Neural Networks,CNN)被廣泛應用于圖像分類、識別等計算機視覺領域,基于卷積神經網絡框架的圖像分割技術發展迅速,并取得了突破性進展[17],成功構建了多種圖像分割模型。隨著圖像分割場景日益復雜化,傳統的圖像分割方法難以滿足實際要求,基于深度學習的圖像分割方法實現了更加高效和精準的分割。本節重點介紹幾種經典的基于深度學習的分割方法,包括:FCN[18]、DeepLab[19]、SegNet[20]等。

3.1? 完全卷積網絡

完全卷積網絡[18](Fully Convolution Networks,FCN)由Jonathan Long等學者于2015年提出,是首個端到端的深度學習分割模型,在圖像分割領域具有重要意義。FCN基于傳統的卷積改進而來,采用卷積層替換網絡中的全連接層。FCN的網絡架構采用編碼-解碼結構,編碼部分采用經典的CNN網絡,如VGG、ResNet等,用于特征提??;解碼部分,由于卷積和池化操作會導致圖像尺寸變小,使用上采樣方式對圖像尺寸進行恢復,得到輸入圖像尺寸大小的分割圖像。此外,通過跳躍連接,將淺層輸出和深層輸出進行聯合,減少底層的圖像信息丟失,同時避免網絡退化及梯度爆炸等問題。

3.2? DeepLab網絡

DeepLab[19]是Chen等學者基于FCN提出的一系列圖像分割模型,最新版本為DeepLab-v3+[21]?!癉eepLab-v3+”采用編碼-解碼結構。編碼器由深度卷積神經網絡(Deep Convolutional Neural Network,DCNN)模型及ASPP模塊構成,將圖像輸入DCNN進行處理,輸出中淺層特征圖和經過ASPP 融合卷積后的特征圖,并將兩者作為解碼器的輸入。解碼部分,對輸入的中淺層特征圖進行卷積,再與經過上采樣的ASPP特征圖進行融合,然后經過上采樣操作輸出原始尺寸大小的分割圖,實現端到端的語義分割。DCNN網絡是一種采用深度可分離卷積層的卷積神經網絡,將通道之間分開處理,減少光譜和空間相關性干擾。ASPP模塊將空洞卷積和特征金字塔池化結合在一起,在相同的計算代價下增大卷積核的感受野,挖掘多尺度上下文信息,以更好地捕捉地塊邊界。

3.3? SegNet網絡

SegNet是在FCN基礎上改進而來,由一個編碼器網絡、一個相應的解碼器網絡和一個逐像素分類層組成,其特點在于編碼階段,進行池化時,保留最大值的位置信息,然后,在解碼階段,利用最大池化索引進行非線性上采樣,將低分辨率編碼器輸出特征映射到原始輸入圖像分辨率特征圖,避免在編碼階段保存特征圖,從而節省內存空間。同時,消除了學習上采樣的需要,減少了訓練參數,從而節約了計算時間。

4? 結語

本文著重介紹了幾類常用的傳統圖像分割方法和幾種深度學習圖像分割方法,傳統的圖像分割方法在簡單場景下應用效果較好,而基于深度學習的圖像分割方法在復雜場景下效果更好。不同分割算法的優缺點不同,需要根據應用場景靈活選擇,甚至將多種分割方法結合使用,以獲得最佳分割效果。圖像分割作為計算機視覺領域的一項基礎技術,是圖像理解的重要一環,至今仍受到工業界與學術界的高度重視,但仍然存在一些難題:1)樣本標注工作繁重,海量樣本數據集構建難度大;2)小尺寸或復雜形狀目標分割精度不夠;3)基于深度學習的分割網絡對計算資源的消耗嚴重,使得模型收斂速度非常慢,在計算能力有限的情況下,模型訓練耗時長久;4)采用編碼-解碼結構的卷積神經網絡框架,運用卷積和池化操作,會降低圖像分辨率,深層次特征對細節信息表達不夠充分,導致目標地物輪廓分割得不夠細致,即使采用跳躍連接技術,將淺層特征和深層特征融合,也只在一定程度上緩解了上述問題。這些問題具有重要的研究價值,若能較好地解決,對于促進圖像分割技術落地、應用和推廣具有重要意義。

參考文獻:

[1] 胡瓊,吳文斌,宋茜,等.農作物種植結構遙感提取研究進展[J].中國農業科學,2015,48(10):

1900-1914.

[2] 王崠,吳見.農作物種類高光譜遙感識別研究[J].地理與地理信息科學,2015,31(2):29-33,2.

[3] 黃鵬,鄭淇,梁超.圖像分割方法綜述[J].武漢大學學報(理學版),2020,66(6):519-531.

[4] YEN J C, CHANG F J, CHANG S. A new criterion for automatic multilevel thresholding[J]. IEEE transactions on image processing: a publication of the IEEE Signal Processing Society, 1995, 4(3): 370.

[5] OTSU N. A threshold selection method from gray-level histograms[J]. IEEE transactions on systems, man, and cybernetics, 1979, 9(1): 62-66.

[6] PUN T. A new method for grey-level picture thresholding using the entropy of the histogram[J]. Signal processing, 1980, 2(3): 223-237.

[7] 王國權,周小紅,蔚立磊.基于分水嶺算法的圖像分割方法研究[J].計算機仿真,2009,26(5):255-258.

[8] 王鑫,羅斌,寧晨.一種基于小波和分水嶺算法的圖像分割方法[J].計算機技術與發展,2006(1):

17-19,22.

[9] 白雪飛.基于視覺顯著性的圖像分割方法研究[D].太原:山西大學,2014.

[10] 霍迎秋,秦仁波,邢彩燕,等.基于CUDA的并行K-means聚類圖像分割算法優化[J].農業機械學報, 2014(11):47-53.

[11] 張向榮,騫曉雪,焦李成.基于免疫譜聚類的圖像分割[J].軟件學報,2010,21(9):2196-2205.

[12] ACHANTA R, SHAJI A, SMITH K, et al. SLIC superpixels compared to state-of-the-art superpixel methods[J]. IEEE transactions on pattern analysis and machine intelligence, 2012, 34(11): 2274-2282.

[13] 劉俠,甘權,李冰,等.融合加權隨機森林的自動3D椎骨CT圖像主動輪廓分割方法[J].光電工程,2020,47(12):37-48.

[14] ER-SEN L, SHU-LONG Z, BAO-SHAN Z, et al. An Adaptive Edge-Detection Method Based on the Canny Operator[C]//International Conference on Environmental Science & Information Application Technology. IEEE, 2009.

[15] ROSENFELD A. The max Roberts operator is a Hueckel type edge detector[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 1981, 3(1): 101-103.

[16] BRUZZONE L, CARLIN L. A Multilevel Context-Based System for Classification of Very High Spatial Resolution Images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2006, 44(9):

2587-2600.

[17] 張明月.基于深度學習的圖像分割研究[D].長春:吉林大學,2017.

[18] SHELHAMER E, LONG J, DARRELL T. Fully Convolutional Networks for Semantic Segmentation[J]. IEEE transactions on pattern analysis and machine intelligence, 2017, 39(4): 640-651.

[19] CHEN L C, PAPANDREOU G, KOKKINOS I, et al. DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 40(4): 834-848.

[20] BADRINARAYANAN V, KENDALL A, CIPOLLA R. Segnet: A deep convolutional encoder-decoder architecture for image segmentation[J]. IEEE transactions on pattern analysis and machine intelligence, 2017, 39(12): 2481-2495.

[21] CHEN L C, ZHU Y, PAPANDREOU G, et al. Encoder-decoder with atrous separable convolution for semantic image segmentation[C]//Proceedings of the European conference on computer vision (ECCV). 2018: 801-818.

(責任編輯:丁志祥)

收稿日期:2023-06-19

基金項目:重慶市農業科學院市級財政科研項目(cqaas2023sjczqn007)。

作者簡介:黃祥(1988—),男,四川綿陽人,碩士,農藝師,主要從事農業遙感研究。E-mail:419850173@qq.com。

猜你喜歡
計算機視覺圖像分割深度學習
機器視覺技術發展及其工業應用
危險氣體罐車液位計算機視覺監控識別報警系統設計
一種改進的分水嶺圖像分割算法研究
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
一種圖像超像素的快速生成算法
基于魯棒性的廣義FCM圖像分割算法
深度學習算法應用于巖石圖像處理的可行性研究
基于深度卷積網絡的人臉年齡分析算法與實現
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合