?

基于深度學習的野生動物識別

2022-02-08 08:55黃志靜邵慕義張庭瑞沈嘉軼
電子測試 2022年22期
關鍵詞:圖像識別殘差野生動物

黃志靜,邵慕義,張庭瑞,沈嘉軼

(北京信息科技大學計算機學院,北京,100101)

0 引言

盡管人類社會已經得到了快速發展,也取得了很多生產力、科學技術等方面的成果,但在發展的同時一定程度上損害了自然環境,使得大自然中很多動植物種類逐漸消失尤其是野生動物,所以我國非常重視野生動物保護。如今,我國很多地區的野生動物都已經得到了等級性保護,包括一級保護和二級保護動物等,但依然有部分野生動物還沒有得到很好的保護,所以進一步加強野生動物保護、優化生態環境是非常必要和重要的,理應得到重視及關注[1]。而野生動物的識別技術,尤其是針對在具有噪音的野生環境下對野生動物進行識別就尤為重要,可以為加強野生動物保護助力。在野外設置合適的攝像頭進行拍攝,定時傳回圖片,對圖片進行識別,若發現野生動物就可以有針對性地采取措施,進行保護。

1 研究現狀

1.1 圖像識別

圖像識別是指借助計算機工具實現對圖像的處理、分析和理解,達到對不同模式下目標對象的識別分類,是將深度學習理論到實際的一種應用[2]。圖像識別技術的過程分為獲取目標信息、預處理圖像、對圖像特征進行提取和篩選、分類器設計和分類決策?;诰矸e神經網絡的圖像識別是一種較為新穎的圖像識別技術,它是在傳統圖像識別的基礎上加入卷積神經網絡的算法,使圖像識別領域邁向智能化。

1.2 卷積神經網絡

卷積神經網絡是對傳統神經網絡的改進,該網絡一般是對圖像的特征進行提取,然后將提取到的特征映射到神經網絡中,從而實現圖像的及分類.輸入層、卷積計算、激勵層、池化層、全連接和輸出層6個部分可以組成一個簡單的卷積神經網絡。在輸入層對圖像做一些簡單的預處理,隨后將其輸出給卷積層,使得卷積層對圖像的特征進行提??;然后,將提出的特征輸出給激勵層,激勵層對其做一些非線性映射,再通過池化層將圖像的主要特征提取出來;最后,通過全連接層將提取到的所有特征進行匯總,產生分類器,實現對圖像的識別分類.神經網絡憑借局部感知和參數共享兩大特點在圖像處理領域占有一定的地位,局部感知使得卷積核對輸入的空間局部模式有較好的響應,而參數共享降低了網絡模型復雜度和權值數量[3]。兩者的結合不僅可以使網絡有效地從大量樣本中學習到想要的特征值,還降低了模型的復雜度,避免了復雜的特征提取過程。

1.3 野生動物保護現狀

1.3.1 管控力度不足

我國幅員遼闊,地形和地勢多樣,這就使野生動物的分布也呈現多元化趨勢。由于野生動物生長習性不同,使野生動物的分布范圍極為廣泛,且野生動物種類較多,在開展管控的過程中難度較大,經常出現管控力度不足的情況。并且,由于野生動物管控涉及的環節和流程較多,導致在實際開展工作的過程中,很難完全落實相關活動,一定程度上阻礙了我國野生動物保護水平的提升[4]。

1.3.2 監管難度較大

野生動物品類繁多,生活作息和生活環境也各不相同,如果通過人工的方式進行監管,可能會帶來較大的工作量,從時間的角度和區域范圍的角度,都涉及較大跨度。除此之外,盜獵現象也在普遍發生,并且已經形成了一定規模的產業鏈,這對開展野生動物的工作產生了一定的阻礙,所以繼續提升改善野生動物的監管技術。

1.4 野生動物保護策略

為提升保護野生動物管理水平,需要從對監管技術的提升改善入手?,F階段通過人眼對不同作息和不同野外生存環境的野生動物進行觀察的難度是較大的,當然也有一些監管機構采用了野生動物識別技術,進行有效的野生動物監管,但是對于復雜的野外環境還是會存在光線或者障礙物等噪音影響識別工作。因此提升對噪聲的抗干擾能力便成為野生動物識別技術的關鍵,比如,在有一定陽光直射監管攝像頭時,或者被樹葉遮擋部分監管攝像頭視線時,系統采用的野生動物識別技術依然可以有較高成功率地識別出野生動物的品種,便于記錄野生動物野外生存情況的相關信息。

2 模型構建

2.1 數據增強

我們選擇的數據集為cifar100中的10小類每類只有500張訓練集和100張測試集,同時由于圖片較小每張圖片趨同,所以使用數據增強對數據集進行擴充,介于自然界的動物是會從左到右或者從右到左所以我們將圖片進行隨機的左右翻轉以派生出更多圖片。

2.2 圖片加噪點

我們選擇圖像噪聲是圖像在獲取或傳輸過程中受到的隨機信號的干擾,在圖像上出現的一些隨機的、離散的、孤立的像素點,這些點會干擾人眼對圖像信息的分析。圖像的噪聲通常是比較復雜的,很多時候將其看成是多維隨機過程,因而可以借助于隨機過程描述噪聲,利用隨機樣本取值函數在32*32*3(RGB)上隨機產生浮點數加到測試集中。

2.3 殘差網絡

深度卷積神經網絡在圖像分類方面,引發了一系列突破。通過改變疊層的數量(深度),深度網絡自然整合低/中/高水平的功能,終端到終端多層方式的分層器,和特征的“水平”都變得更加豐富[5]。所以人們普遍認為網絡層數越多對于信息的收集也會越好、非線性表達能力也會增強,可以提取出更加深層次的信息。

但是隨著網絡變深(層數增多),反向傳播求取梯度的時候,容易發生梯度消失或梯度爆炸的問題。如當每次求梯度時候的數值很接近零,當層數過多時候相乘的梯度將會趨近于0(梯度消失)、大于1(梯度爆炸)。同時深度網絡也可能造成退化問題。

發現淺層網絡在有時候會比深層網絡的效果更好,所以通過在卷積層之間添加恒等連接(y=F(x,{Wi})+x)來保證深層網絡不會損失數據,當淺層輸出結果已經很好時殘差部分權重可設為0。

如圖1,通過將上述功能包裝成深度殘差塊[6],通過調用殘差塊來卷積,可以有效解決深層網絡退化問題。

圖1 軟閾值函數關系式

2.4 軟閾值化

軟閾值函數是大部分降噪方法的核心步驟。它將小于設定的正數閾值的特征設置為零。傳統設置軟閾值的方法需要業務領域的專家根據專業知識,通過不斷地調試來選擇一個合適的軟閾值,這種方法不具備學習能力,更缺乏可擴展性。因此,將軟閾值學習和深度殘差網絡結合,通過自動學習和調整,形成一種有效地消除噪聲信息和構建高判別性特征的方式,其輸入與輸出的關系如圖2所示。

圖2 軟閾值函數關系式

該閾值的意義在于使得不同的樣本有了不同的閾值,而且閾值為一個不大的正數,如果與當前任務無關時,通過閾值化將它們設置為0,實現對無關信息的抑制。

2.5 深度殘差收縮網絡

SENet則是最為經典的注意力算法之一。如圖3所示,SENet通過一個小型網絡學習得到一組權值系數,用于各個特征通道的加權。子網絡先對輸入的所有特征求平均值,成為(N*1*1*16)維度;然后經過全局均值池化和平均等操作得到一個特征A,再另一條路徑,將全局均值池化之后的特征圖輸入到一個小型的全連接網絡中。這個全連接網絡將輸出進行歸一化操作,使輸出保持在0和1之間并獲得一個數,記為a;將系數(scales)進行sigmoid激活,然后和A相乘得到閾值a*A,從而應用閾值。

圖3 深度殘差收縮模塊

2.6 模型訓練

循環次數過多會導致過擬合,在32步長下,通過調整循環次數,獲得較好的結果,如表1所示。

表1 循環次數測試結果對比

通過資料查詢,因為訓練數據集數量較少,每次使用的圖片數量越少對于每張圖的利用效率越高,在300循環次數下,使用較短的步長可以更加充分地利用數據集,使得準確率提高。如表2所示。

表2 步長測試結果對比

3 實驗結果

對于深度殘差網絡和深度殘差收縮網絡進行一個對比試驗,測試識別準確率。深度殘差網絡和深度殘差收縮網絡進行對比試驗,都在有噪音的情況下,兩個準確率對比如圖4。在有噪音情況下,深度殘差收縮網絡準確率高于深度殘差網絡。

圖4 DRSN和DRN在有噪點下的準確率

深度殘差收縮網絡本身,在有無噪聲的情況下進行的一個對比,如圖5。在有無噪聲的情況下,有噪音條件下深度殘差收縮網絡準確率在5000步時逼近無噪聲條件下,可以更好地避免噪音對圖像識別的影響。

圖5 DRSN在有無噪點下的準確率

完成了網絡的構建和訓練之后,將訓練好的模型保存下來,從視覺中國網上對野生動物進行搜索,下載了100張圖片,對這100張圖片進行預處理,首先取上1/5和下4/5的圖片取中間,然后將其變成32*32大小的,再將其rbg通道變成32*32*3的,將標簽做one-hot處理。處理完之后投入訓練之后保存好的模型進行測試,結果較為理想,準確率對比如表3所示。

表3 無噪點測試準確率對比

表3是在測試數據沒有添加噪點的情況下進行的測試,表4是加了噪點之后的測試數據,發現效果還是不錯的。

表4 有噪點測試準確率對比

4 結束語

本文詳細介紹了基于深度殘差收縮網絡的野生動物識別的相關研究。分別通過與深度殘差網絡對比實驗,以及在是否存在噪點這一變量的情況下對比實驗,得出結論相對于深度殘差網絡,深度殘差收縮網絡對于野生動物識別模型訓練上能夠有效地降低噪聲對圖像識別的影響。

猜你喜歡
圖像識別殘差野生動物
基于雙向GRU與殘差擬合的車輛跟馳建模
保護野生動物
基于殘差學習的自適應無人機目標跟蹤算法
保護野生動物
保護野生動物
保護野生動物
基于Resnet-50的貓狗圖像識別
基于遞歸殘差網絡的圖像超分辨率重建
高速公路圖像識別技術應用探討
圖像識別在物聯網上的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合