?

基于區分矩陣的屬性約簡算法的作物病害識別方法

2015-04-17 12:48張會敏張云龍張善文
江蘇農業科學 2015年1期
關鍵詞:圖像分割粗糙集

張會敏 張云龍 張善文 等

摘要:利用作物葉片癥狀進行作物病害識別是植保中的一個重要研究內容。提出了一種基于區分矩陣屬性約簡的黃瓜病害葉片圖像分割與病害識別方法。首先,利用最大類間方差法對黃瓜病害葉片圖像進行病斑分割;其次,提取病斑圖像的36個分類特征;再次,利用基于區分矩陣的屬性約簡算法對36個特征進行特征選擇;最后,利用最近鄰分類器進行病害識別。在3種常見黃瓜病害葉片圖像數據庫上的試驗結果表明,該方法是有效可行的,能夠為基于病害葉片的作物病害識別系統研究提供參考。

關鍵詞:粗糙集;圖像分割;最大類間方差法;病害識別;黃瓜葉片病斑

中圖分類號: TP391.41文獻標志碼: A文章編號:1002-1302(2015)01-0387-03

收稿日期:2014-03-19

基金項目:河南省鄭州市科技攻關(編號:131PPTGG426);安徽省自然科學基金(編號:1208085MF94、1208085MF98);河南省科技攻關(編號:142102310518);河南省教育廳科學技術研究重點項目(編號:14B520064)。

通信作者:張會敏(1981—),女,河南漯河人,講師,研究方向為計算機應用技術。E-mail:zhangshanwen1965@163.com。作物病害嚴重影響我國農業生產的產量和質量。及時、快速地發現并識別農作物病害對正確地采取相應措施防治病害、減少病害帶來的損失具有重要意義。但由于實際病害葉片的形狀、紋理和顏色多種多樣,使得從葉片圖像中提取的病害分類特征也各種各樣,各種特征對病害識別的貢獻不同,因此需要進行特征選擇[1]。粗糙集(rough sets,RS)是一種經典的特征選擇方法,能夠直接從給定問題的描述集出發,通過不可分辨關系和等價關系類給出問題的近似域,從而得到該問題的內在規律。多年來,RS已被成功應用于人工智能、模式識別、智能控制、機器學習、信息處理、數據挖掘、醫療診斷、專家系統以及決策分析等領域[2-3]。屬性約簡是RS的一個重要應用[4],基于RS的屬性約簡是在保持信息系統分類或決策能力不變的前提下,通過對知識的化簡,導出分類問題的分類規則和決策?;趨^分矩陣的屬性約簡策略是建立在兩兩互異目標上屬性集合的區分矩陣[5]。區分矩陣的元素代表能夠區分2個目標的屬性組合。實際應用中可以將區分矩陣中出現次數多少作為屬性重要性的判斷依據,即出現次數越多的屬性的重要性越大。本試驗在研究作物病害葉片圖像分割的基礎上,將基于區分矩陣的屬性約簡策略應用于病害葉片圖像分類特征選擇中,提出了一種有效的作物病害識別方法。

1作物病害葉片圖像特征提取

作物病害葉片病斑圖像分割是病害識別的一個重要步驟。最大類間方差(Otsu)閾值法因其分割精度高、適用范圍廣而成為廣泛采用的一種圖像閾值分割方法[6],其原理是:將病害葉片圖像像素分為病斑和正常2類,再通過計算劃分出2類病害的類間方差值,若類間方差值小于某一給定值,合并初始劃分的2類。然后計算此時所有類的類間方差值和分離因素的F值,若F值大于某個給定值,則退出該算法;否則,就按順序在已存在的類中繼續對圖像分割。最后得到葉片病斑圖像。

由于實際得到的病害葉片圖像為RGB模式,該色彩模式對光照比較敏感,而HIS色彩模式能夠克服采集過程中光照對病害識別率的影響,因此在作物病害識別中須要將RGB轉換成HIS,HIS顏色模型反映了人的視覺對色彩的感覺[7-8]。由RGB轉換HIS的公式如下:

I=(R+G+B)/3

S=1-3(R+G+B)[min(R,G,B)]

H=θG≥B

θ-2πG

式中:θ=arccos[(R-G)+R-B]/2(R-G)2+(R-B)(G-B)。

在本試驗中,利用Matlab中的Imread函數分別提取彩色葉片圖像中R、G、B 3個通道的圖像,再利用式(1)將其轉換為H、I、S模式。然后,采用Otsu閾值法分別將H、I、S圖像轉換為二值化圖像,以提取葉片病斑區域。不妨將得到的病斑二值化圖像仍記為H、I、S。

為了得到能區分作物病害的顏色特征值,分別計算病害葉片圖像R、G、B分量和分割后的病斑圖像的H、I、S分量的均值、方差、偏度、峰值、能量、熵,共6×6=36個統計特征參數[9]。計算公式如下:

p(b)=h(b)/s

b=∑b=1bp(b)

bk=1/δ3∑(b-b)3p(b)

δ2=∑b=1(b-b)2p(b)

bF=1/δ4∑b=1(b-b)4p(b)-3

bN=∑b=1[p(b)]2

bE=∑b=1p(b)lg[p(b)]。(2)

式中,p(b)為灰度級,h(b)為直方圖,s為圖像的面積,b為灰度均值,b為b的均值、bk為偏度,bF為峰值,bN為能量,bE為熵。

若直接把提取的36個病害圖像特征參數用于構建病害識別模型,則識別效果的穩定性較差,因為各個特征對識別結果的貢獻不同,有些特征甚至會影響識別結果。因此,須要對得到的特征進行選擇。筆者使用基于區分矩陣的屬性約簡方法對得到的36個特征進行選擇。

2基于區分矩陣的屬性約簡方法

基于區分矩陣的屬性約簡方法基本思想:將屬性在區分矩陣中出現的次數作為目標屬性的重要性判斷函數。計算各屬性的重要性判斷函數f,由此可以確定第1個重要屬性,此時重要屬性的判斷函數f值最大。在第1個重要屬性簡單求出后,進一步快速簡單地求出后續的重要屬性。設決策表S的核值集合為Core,其屬性約簡過程如下:

輸入S的屬性約簡矩陣RM;輸出S的屬性約簡Redu;

(1)初始化,令Redu=Core,H=;

(2)令Q={RM(aj)|aj∈Redu或AFI(aj)=0},則RM=RM-Q,B=A-Redu-H;

(3)對aj∈B,計算f(aj)=Max{ak},(k=1,2,…,m),其中f(x)為屬性重要性判斷函數;

(4)Redu←Redu∪{aj};

(5)對每個aj∈B,令H2(aj)∩RM(ak),H3(aj)=|H2(aj)|;

(6)對所有aj∈B,令RM(aj)←RM(aj)-H2(aj),f(aj)←f(aj)-H3(aj);若f(ak)=0,則H1=∪{ak};

(7)重復步驟(2)~(6),直到判斷函數AFI為零向量;

(8)輸出Redu 。Redu為信息表的一個屬性約簡。

3基于病害葉片的作物病害識別方法

由以上分析可得作物病害識別步驟如下:

(1)將采集到的每幅病害葉片圖像轉換為HIS模式;

(2)采用Otsu閾值法分別將葉片圖像的H、I、S分量進行病斑分割,再轉換為二值化圖像,不妨還記為H、I、S;

(3)利用式(2)分別提取H、I、S的36個分類特征,得到一個特征向量,然后生成包括條件屬性集合和結論屬性集合的滿足粗糙集數據處理要求的二維關系規則表;

(4)將關系表中的每類特征屬性進行歸一化和離散化處理;

(5)利用基于區分矩陣的屬性約簡方法對關系表進行屬性約簡,依次消去可省略的屬性(列)和合并重復的對象(行),再對每一個對象進行簡化,消去冗余的屬性值;

(6)根據一定的評選準則選取有效識別規則的屬性簡化表,最終獲得優選的最簡單判定規則;

(7)利用最近鄰分類器對植物病害進行識別。該分類器的基本思路是計算待測試樣本與訓練樣本之間的歐式距離的最小值,由此確定待識別測試樣本的類別。

4結果與分析

為了驗證本研究提出的作物病害識別方法,采集溫室黃瓜常見的細菌性角斑病、黃瓜炭疽病和黃瓜褐斑病的病害葉片各100幅,其中50幅圖像作為訓練集,其余50幅作為測試集。本研究所使用的病害樣本圖像均是在陜西楊凌農業示范區科學園黃瓜溫室采集得到的,黃瓜品種為中農26號。以白色為背景色,在自然光照的非強光條件下對自然發病的黃瓜葉片進行圖像采集得到黃瓜病害葉片圖像。以Matlab 7.X軟件中自帶的圖像處理工具箱為圖像處理和分析平臺,計算以上特征參數,數據統計分析采用常用統計分析SAS軟件。

采用Otsu閾值法分別將病害葉片進行病斑分割,分割定位待識別的黃瓜葉片病害部分病斑,利用式(2)提取病害葉片病斑的36個分類特征。圖1為3種黃瓜病害葉片圖像及對應的分割病斑圖像的H分量。

首先將得到的36個特征進行離散化,即把每個特征劃分成有限個區域,本試驗中取5個區域,使得每個區域中對象的決策值相同。然后利用基于區分矩陣的屬性約簡方法對這36個特征進行屬性約簡,得到6個重要的屬性,分別為病斑分量H的均值、方差、能量,病斑分量I的均值,病斑分量S的方差和能量。再將這6個屬性組成一個特征向量來表示這個樣本。最后利用最近鄰分類器對病害種類進行分類,結果見表1。為了說明本研究所提出方法的有效性,表1中給出了基于全部36個特征和基于其他2種方法[10-11]的識別結果。由表1看出,本研究提出的方法的識別率最高,對黃瓜褐斑病的識別率高達94.26%,表明該方法用于黃瓜葉部病害圖像識別是有效可行的。

表1不同黃瓜病害識別方法的識別結果

方法識別率(%)36個特征識別法78.59文獻[10]82.88文獻[11]90.35本研究所提出的方法94.26

葉片圖像采集和識別試驗結果顯示:(1)病害識別中并非特征越多越好,應對識別特征進行優化組合或特征選擇;(2)即使同一病害樣本在不同成像環境下拍攝,圖像特征向量也會存在一定差異;(3)不同黃瓜品種、不同發病時期的病癥表現差異較大。這些差異應與識別效果相結合,可以通過制定圖像的采集規范予以解決。

5結論

本研究利用最大類間方差法分割黃瓜病斑圖像,再提取病斑圖像的36個特征,然后利用粗糙集對36個特征進行屬性約簡,得到6個重要特征,最后利用最近鄰分類器對病害進行分類。該方法提取病斑具有操作簡單、分割效果好的特點。本試驗結果表明該方法是有效可行的。由于病害葉片拍攝狀態和光照等環境因素對顏色特征存在影響,發病程度及病斑的典型性也可能對識別準確率有影響,這些因素對拍攝照片中顏色特征的定量關系有待進一步研究。對于某些顏色、形狀特征非常相似的其他黃瓜病癥,還應進一步提取病斑的顏色、形狀和紋理等特征,綜合考慮決定黃瓜病害癥狀的物理特征,以實現對病害的有效識別。

參考文獻:

[1]李旺,唐少先. 基于圖像處理的農作物病害識別研究現狀[J]. 湖南農機,2012,39(1):176-178.

[2]Qian Y H,Liang J Y,Pedrycz W,et al. An efficient accelerator for attribute reduction from incomplete data in rough set framework[J]. Pattern Recognition,2011,44(8):1658-1670.

[3]胡可云,陸玉昌,石純一. 粗糙集理論及其應用進展[J]. 清華大學學報:自然科學版,2001,41(1):64-68.

[4]樊持杰,陳麗敏,夏春艷. 基于RS的屬性約簡算法[J]. 微計算機信息,2010,26(2):222-223.

[5]李智玲,胡彧. 一種改進的區分矩陣屬性約簡算法[J]. 計算機系統應用,2008,17(10):51-55.

[6]王祥科,鄭志強. Otsu多閾值快速分割算法及其在彩色圖像中的應用[J]. 計算機應用,2006,26(增刊1):14-15.

[7]虎曉紅,李炳軍,席磊. 基于多示例圖的小麥葉部病害分割方法[J]. 農業工程學報,2012,28(13):154-159.

[8]Tushar H J, Ravindra D B, Prashant G P. Crop disease detection using image segmentation[J]. World Journal of Science and Technology,2012,2(4): 190-194.

[9]Revathi P,Revathi R. Knowledge discovery in diagnose of crop diseases using machine learning techniques[J]. International Journal of Engineering Science and Technology,2011,3(9): 7187-7190.

[10]岑喆鑫,李寶聚,石延霞,等. 基于彩色圖像顏色統計特征的黃瓜炭疽病和褐斑病的識別研究[J]. 園藝學報,2007,34(6):1425-1430.

[11]賈建楠,吉海彥. 基于病斑形狀和神經網絡的黃瓜病害識別[J]. 農業工程學報,2013,29(增刊1):115-121.于翰林,盧澤民,朱詠莉. 基于嵌入式Web服務器的pH值檢測系統的設計[J]. 江蘇農業科學,2015,43(1):390-393.endprint

猜你喜歡
圖像分割粗糙集
基于二進制鏈表的粗糙集屬性約簡
優勢直覺模糊粗糙集決策方法及其應用
多?;植诩再|的幾個充分條件
雙論域粗糙集在故障診斷中的應用
兩個域上的覆蓋變精度粗糙集模型
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合