?

基于VGG-16卷積神經網絡的水稻害蟲智能識別研究

2020-04-07 17:50錢蓉孔娟娟朱靜波
安徽農業科學 2020年5期
關鍵詞:害蟲準確率卷積

錢蓉 孔娟娟 朱靜波

摘要 為了實現自然場景下水稻害蟲實時精準被識別,構建基于VGG-16卷積神經網絡的水稻害蟲智能識別模型。該模型采用VGG-16卷積神經網絡為核心網絡結構,根據水稻害蟲的個體特征和自然場景,對VGG-16網絡的卷積層局部調整,優化主要模型參數,實現水稻害蟲的智能識別,其識別的平均準確率是90.7%,實現對沙葉蟬、大螟、斑須蝽、點蜂緣蝽和白背飛虱的準確識別。研究結果顯示,采用卷積神經網絡技術可以實現自然場景下害蟲圖像的精準識別,代替人工辨認,提高水稻害蟲防治率,實現實時、精準防治的目標。

關鍵詞 水稻;害蟲;智能識別;VGG-16;卷積神經網絡

中圖分類號 S125 ?文獻標識碼 A ?文章編號 0517-6611(2020)05-0235-04

doi:10.3969/j.issn.0517-6611.2020.05.066

開放科學(資源服務)標識碼(OSID):

Abstract In order to achieve realtime accurate recognition of rice pests in natural scenes, an intelligent rice pest recognition model based on VGG16 convolutional neural network was constructed. The model used the VGG16 convolutional neural network as the core network structure. According to the individual characteristics of rice pests and natural scenes, the convolutional layer of the VGG16 network was locally adjusted, the main model parameters were optimized, and intelligent recognition of rice pests was achieved. The average accuracy rate of recognition was 90.7%, which could ?accurately identify the leafhoppers, giant salamanders, spotted tadpoles, beetailed salamanders and whitebacked planthoppers. Research results showed that the use of convolutional neural network technology could ?achieve accurate recognition of pest images in natural scenes, instead of manual recognition to improve the pest control rate of rice, and to achieve the goal of realtime and accurate control.

Key words Rice;Insect pest;Intelligent recognition;VGG16;Convolutional neural network

水稻是我國重要的糧食作物,隨著我國人口的逐年增長,糧食的需求量不斷增大,因此,提高水稻產量成為影響國計民生的重要科研工作。在實際生產中,影響水稻產量的因素很多,害蟲的侵襲是主要影響因素之一,因此水稻害蟲及時有效防治迫在眉睫。傳統的水稻害蟲防護依靠人為查看和辨認,這會造成辨認錯誤或防治時效慢等不良后果,會導致水稻被侵害的面積巨大,既降低水稻產量,也帶來大量糧食作物含有農藥殘留物的危害。因此,采用智能圖像識別技術,實現害蟲實時、準確有效識別,有利于害蟲的高效精準防治。

圖像智能識別技術[1-3]在農業領域應用較廣,研究人員在作物害蟲圖像智能識別方面已開始初步探索。張建華等[4]針對棉花受棉蚜、棉葉螨、棉盲蝽、斜紋夜蛾和煙粉虱等害蟲為害后葉片表面出現不同癥狀,提取色斑圖像和非色斑圖像的多個特征,并應用徑向基支持向量機實現害蟲識別,棉花蟲害識別正確率達88.1%。Wang等[5]把人工神經網絡和支持向量機作用于圖像識別,構建一個昆蟲標本圖像智能識別系統,其識別準確率達到93%。Bernardes等[6]使用小波變換能量特征提取和支持向量機的實際分類,分類的準確率為89.5%。Xie等[7]提出了基于多任務稀疏表示與多核學習的害蟲圖像分類方法,將該方法用于24種農田害蟲圖像的識別,準確率達到90.3%。謝成軍等[8]提出了一種基于圖像編碼與空間金字塔模型相結合的農田害蟲圖像表示與識別方法,通過35種害蟲的識別試驗,平均識別準確率達到89.2%。楊國國等[9]把圖像顯著性檢測技術應用到茶園害蟲識別中,對數字圖像進行顯著性分析,實現在圖像中對害蟲進行定位并完成自動分割,從而提高茶園害蟲識別準確率,使茶園害蟲的識別率達到 91.5%。楊信延等[10]提出一種基于Canny邊緣檢測算子和Prewitt的分割方法,并結合SVM可實現對溫室粉虱和薊馬誘蟲板的識別,其平均識別準確率達93.5%。

目前,在農作害蟲圖像智能識別研究方面,多數研究成果聚焦于理論,鮮見報道考慮與實際應用相結合。鑒于此,筆者瞄準實際問題,以服務農業為根本,積極探索害蟲圖像智能識別應用研究。該研究以田間自然背景下害蟲圖像作為試驗數據集,基于VGG模型構建智能識別系統,具有較高的實踐使用價值。

1 資料與方法

1.1 試驗環境

水稻害蟲圖像智能識別試驗在裝有4個NVIDIA Tesla P40 24 GB卡和2個Intel至強 E5-2697v4處理器18核36線程服務器上完成,該服務器裝有Ubuntu 16.0操作系統、TensorFlow 1.0框架。

1.2 試驗數據

試驗選取的樣本圖像均在自然背景下地間田頭采集而得,為后期實際推廣應用奠定基礎。試驗共選取水稻害蟲圖像5類,其中條沙葉蟬459幅、大螟349幅、斑須蝽419幅、點蜂緣蝽281幅、白背飛虱312幅,共1 820幅樣本圖像,選取每個類別的80%數據構建訓練集,剩余20%的數據構成測試集,具體分布見表1。

研究采用弱監督卷積神經網絡技術實現圖像智能識別,要求人工標注所有試驗樣本的類別信息。為了規范試驗數據集,需要對數據集作如下統一處理:

①在Anaconda平臺上對所有試驗數據作刪除重復樣本和刪除不清晰樣本等預處理。如圖1所示,分別是研究對象主體部分不可見和不清晰的樣本。

②采用LabelImg工具,人工標注試驗數據集。如圖2所示,左圖是原始樣本,右圖是已標注樣本。

③根據標注文件,裁剪試驗數據集。根據左邊標注信息,在matlab平臺上完成自動裁切工作,得到裁切后的樣本(圖3)。

④對裁剪后數據集進行二次去重和清除臟數據的處理。

⑤根據4∶1的比例構建試驗的訓練集和測試集。

1.3 試驗方法

卷積神經網絡是一種模擬人腦結構的多層次非全連接的神經網絡,具有強大的特征提取能力,通過有監督的多層網絡學習,能夠直接從原始圖像中識別理解圖像內容[11-12]。VGG-16是一個經典的卷積神經網絡模型,由Simonyan 等[13]在2014年提出,該網絡模型共經歷13次卷積層、4次池化和3個全連接層,共16層,具有局部連接、權值共享、池化等特點,其網絡結構如圖4所示。輸入圖片尺寸變化規律是從224x224到112x112等,直到最后變成7x7。因此VGG-16結構簡單而優美,層次清晰,實現起來也很規整。VGG-16最大的特點是通過3×3濾波器的組合與堆疊,可提取輸入圖像包含的細小特征[14]。

試驗的輸入圖像尺寸是3個通道的224×224,采用VGG-16構建可識別5種害蟲的智能識別模型,整過網絡模型分為卷積層、池化層、全連接層和分類層,其中卷積層共有5個卷積段,每個卷積段采用2或3個卷基層連續堆疊組成卷積序列,卷積過程中采用”SAME”模式,不會改變特征圖的分辨率;在池化層采用2×2池化窗口,步長為2,用于減小卷積后的特征圖像尺寸大小,也實現了模型的平移不變性;在全連接層由3個連續的全連接進行組合,通道數分別為4 096、4 096、1 000個;最后,在分類層由具有1 000個標簽的SoftMax分類器進行分類輸出。

2 結果與分析

試驗采用準確率為考核指標,用Precision代表,計算方法如下:

Precision=TPTP+FP(1)

式中,TP 為正樣本又被預測為正樣本的個數,FP為負樣本被預測為正樣本的個數。

該試驗在網絡訓練過程中重點優化的參數包括:卷積核數量、學習率、epoch的數量和batchsize,卷積核大小確定為2×2,卷積核數量太大,會導致計算量過大,影響訓練速度,數量太少,會丟失很多有用信息,降低樣本利用率;學習率對卷積神經網絡模型訓練影響較大,對于同一模型結構在其他條件相同的情況下,設置不同的學習率,以此確定適合于模型訓練較優的學習率;batchsize的大小確定梯度下降的方向,取值恰當,能提高內存利用率,也能較快確定梯度下降方向,減少訓練震蕩;把epoch的數量設為1,可以把1個完整的數據集傳遞給神經網絡訓練,因為試驗數據集的多樣性,需要選擇合適的epoch個數,不僅體現出試驗數據集的特點,也不會導致模型過擬合或欠擬合。該試驗訓練中各項參數設置、準確率如表2,最優網絡模型的loss曲線如圖5所示,橫坐標代表迭代次數,縱坐標表示loss值,損失曲線已相對穩定,未有較大震蕩。

3 討論

該研究結果表明,測試集準確率最優可達90.7%,與傳統識別方法相同,在相同的測試集上識別準確率有較大提高。然而,害蟲樣本采集地環境較差,給田間實地采集工作帶來很多不利影響,致使各類別害蟲自然背景下圖像樣本的數量都很有限。因此,與在特定背景下害蟲樣本圖像智能識別的準確率相比,該研究的識別準確率略低,分析其原因是由于受樣本數量、自然背景復雜、害蟲體態多變性和害蟲顏色多樣性等因素影響,后續將針對存在的問題進行深入研究,從而提高模型智能識別的準確。

4 結論

該研究采用VGG-16模型構建自然背景下水稻害蟲圖像智能識別系統,取得了較高的識別準確率,說明用智能識別技術幫助農民辨認害蟲的設想有可行性。因該研究建立在自然背景下田間采集而得到的數據集上,樣本能貼近田間實況,不拘泥于實驗室的理想情況,研究成果具有很強的實踐意義,對水稻作物害蟲及時防治起到一定的指導作用,也證實了該研究成果有進一步推廣應用的價值。

參考文獻

[1]KRIZHEVSKY A,SUTSKEVER I,HINTON G E.ImageNet classification with Deep Convolutional Neural Networks[J].Advances in neural information processing systems,2012,25(2):1106-1114.

[2]WANG J,YANG Y,MAO J H,et al.CNNRNN:A unified framework for multilabel image classification[C]// 2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR).Las Vegas,NV,USA:IEEE,2016.

[3]DENG J,DONG W,SOCHER R,et al.ImageNet:A largescale hierarchical image database[C]// 2009 IEEE Computer Society Conference on Computer Vision and Pattern Recognition(CVPR 2009).Miami,Florida,USA:IEEE,2009.

[4]張建華,冀榮華,袁雪,等.基于徑向基支持向量機的棉花蟲害識別[J].農業機械學報,2011,42(8):178-183.

[5]WANG J N,LIN C T,JI L Q,et al.A new automatic identification system of insect images at the order level [J].Knowledgebased systems,2012,33:102-110.

[6]BERNARDES A A,ROGERI J G,OLIVEIRA R B,et al.Identification of foliar diseases in cotton crop[M]//TAVARES J M R S,NATAL JORGE R M.Topics in medical image processing & computational vision.Dordrecht:Springer,2013.

[7]XIE C J,ZHANG J,LI R,et al.Automatic classification for field crop insects via multiple-task sparse representation and multiple-kernel learning [J].Computers and electronics in agriculture,2015,119:123-132.

[8]謝成軍,李瑞,董偉,等.基于稀疏編碼金字塔模型的農田害蟲圖像識別[J].農業工程學報,2016,32(17):144-151.

[9]楊國國,鮑一丹,劉子毅.基于圖像顯著性分析與卷積神經網絡的茶園害蟲定位與識別[J].農業工程學報,2017,33(6):156-162.

[10]楊信廷,劉蒙蒙,許建平,等.自動監測裝置用溫室粉虱和薊馬成蟲圖像分割識別算法[J].農業工程學報,2018,34(1):164-170.

[11]HINTON G E,SALAKHUTDINOV R R.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504-507.

[12]ABDELHAMID O,MOHAMED A,JIANG H,et al.Convolutional neural networks for speech recognition[J].IEEE/ACM Transactions on Audio Speech & Language Processing,2014,22(10):1533-1545.

[13]SIMONYAN K,ZISSERMAN A.Very deep convolutional networks for largescale image recognition[R].2015.

[14]LIU H,LU J W,FENG J J,et al.Groupaware deep feature learning for facial age estimation[J].Pattern recognition,2017,66:82-94.

猜你喜歡
害蟲準確率卷積
基于3D-Winograd的快速卷積算法設計及FPGA實現
蝸牛一覺能睡多久?
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
冬季果樹常見蛀干害蟲的防治
從濾波器理解卷積
高速公路車牌識別標識站準確率驗證法
基于傅里葉域卷積表示的目標跟蹤算法
棗樹害蟲的無公害防治
農業害蟲的冬季防治
一種基于卷積神經網絡的性別識別方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合