?

高光譜成像技術在農產品無損檢測中的應用

2023-02-10 11:43熊春暉佘永新
糧油食品科技 2023年1期
關鍵詞:光譜信息波長預處理

熊春暉,佘永新?,焦 遜,邵 勇,賈 莉,王 淼,肖 明,王 靜

(1. 中國農業科學院 農業質量標準與檢測技術研究所,北京 100081;2. 青海大學 農林科學院,青海,西寧 810016)

近年來,近紅外光譜技術已經逐漸被應用于農產品的無損檢測中。近紅外光譜技術可以為原子間的化學鍵提供振動信息,由于不同化學鍵在不同環境中對近紅外光的吸收波長有明顯差別,從而根據原子間化學鍵的振動信息(拉伸和彎曲)來分析農產品樣品的生物化學變化[1-3]。但近紅外光譜技術僅能提供光譜信息,不能提供樣本的空間信息,從而限制了近紅外光譜技術在結構屬性研究中的應用[4]。高光譜成像技術(Hyperspectral imaging,HSI)將近紅外光譜技術和圖像技術相結合,同時獲得農產品的光譜信息和圖像信息。將獲取的圖像信息用于檢測農產品的外部品質,如紋理、色澤、形態等。光譜信息則用于檢測農產品的內部品質和食用安全性。結合了光譜與圖像,它可以快速,非破壞性和非接觸式的分析單個或多個農產品[5-7]。隨著人們對高品質鮮活農產品的需求增加,開發并運用快速、準確、無損的農產品品質與質量安全檢測方法具有重要意義。

目前,我國常用的傳統農產品品質檢測方法,大多以化學分析方法為主,包括蛋白質電泳、標準系列比色法、凱氏定氮法、薄層色譜法、質譜聯用法、高效液相色譜法等[8-17],這些方法通常準確度高,精密度好,但也存在許多缺點,例如需要繁瑣的前處理過程,檢測時間較長,對農產品產生結構性破壞,經濟成本較高。高光譜技術作為一種快速發展的農產品無損檢測方法,憑借其快速、無損、無污染、可重復的優點,在農產品品質與安全檢測方面逐漸凸顯其優勢,截至目前,高光譜成像技術已經在農產品種質資源表型鑒定、品種優選、品質分級、營養成分快速判定、有毒有害物質篩查與預警等方面進行了諸多研究報道[18-25]。

近年來雖然高光譜成像技術在農產品品質與安全檢測方面發展較快,但目前系統闡述基于高光譜成像技術在農產品品質與食用安全性檢測等方面的基本原理、研究進展、應用場景等報道相對較少。為了深入了解高光譜成像技術的成像原理和國內外最新的研究成果[2],本研究總結了高光譜成像技術的設備組成和檢測機理,并對特征融合、關鍵檢測步驟及相關算法進行歸納。其次,綜述了高光譜成像技術在農產品品種分類鑒別、理化性質檢測和食用安全性無損檢測中的應用場景。同時,針對近五年基于高光譜成像技術進行的農產品檢測研究進展進行總結。最后,在此基礎上展望了高光譜成像技術在農產品無損檢測方面的發展前景。

1 高光譜成像技術進行無損檢測的理論基礎

1.1 HSI系統的原理及主要組成部分

HSI技術可以在不同的連續波長帶下產生大量相同樣品的圖像。這些不同波長的圖像形成一個超立方體,其具有光譜維度(波長λ軸)和兩個空間維度(X軸和 Y軸)??臻g維度可以描繪每個像素的位置,光譜維度可以描繪每個像素的光譜數據。由于不同特定波長下,對應不同分布的化學成分,成像樣品具有不同光譜反射率,從而反映農產品樣品的不同化學成分分布。

圖1為Specim IQ便攜式高光譜成像儀,由軟件和硬件兩方面組成。硬件包括:三角支架;兩個照射樣品的光源,為鹵素燈;三角支架夾具和相機夾具,固定支架和相機位置;檢測器(Specim IQ相機),獲取高光譜圖像和光譜信息;用于調整焦距的鏡頭;可供檢測器左右移動的中置桿和一個控制檢測器拍攝的計算機。所需要的軟件都在計算機上,包括高光譜圖像的采集軟件和可以進行預處理及數據分析的軟件。

圖1 高光譜成像儀Fig.1 Hyperspectral imager

1.2 圖像采集

對于高光譜圖像的獲取,一般分為點掃描、線掃描和面掃描三種方法。點掃描是在空間維度中(X軸和Y軸)對所有像素逐一掃描并累加,從而形成高光譜圖像。對于線掃描,每次沿X軸的空間維度獲取一條樣本圖像,并記錄線中所有像素的光譜信息,從而匯集為一個高光譜圖像。對于面掃描(波長掃描),區別于以上兩種掃描方式,它每次獲取單個波長的樣品圖像,并在每個波長上重復獲取圖像。最后將所有波長對應的圖像疊加從而形成高光譜圖像。在三種采集方式中,線掃描是農產品質量分析中最常用的圖像獲取方式,也非常適用于食品加工的流水線工作[1]。

1.2.1 圖像特征融合

在利用高光譜技術獲得農產品圖像時,顏色、紋理和形態是最常見的特征,它們可以揭示農產品的品質、所受病蟲害及其內外部缺陷等信息。這些特征比較容易獲取但往往需要結合標準的化學物理檢測方法對感興趣區域進行測量,或者通過專家和經驗進行描述。如表1所示,針對農產品最常見的特征有三種分析方法:顏色分析、圖像紋理分析和形態學分析,它們可以作為新的特征與光譜信息融合,結合光譜信息來訓練模型,能起到提高算法準確性、提高模型穩定性的作用。

表1 圖像特征融合分類Table 1 Classification of image feature fusion

1.3 光譜數據信息處理方法

面對大量待掃描的樣本,一般按 Kennard-Stone算法[7]將樣本隨機劃分為訓練集和預測集,訓練集用來估計模型中的參數,使模型能預測其他未知信息。由于高光譜信息量巨大導致光譜表現不佳,可以結合化學計量學算法篩除冗余信息并提取重要信息[2]。

1.3.1 光譜預處理

由高光譜系統采集到的光譜數據除了包含樣本有效信息外,還存在背景干擾信息、電流產生的噪聲和雜散光干擾等。為建立性能穩定的高光譜預測模型,可以根據產生噪聲的不同來源,對高光譜數據進行預處理操作[8]。

使用最廣泛的預處理方法包括平滑、歸一化、導數、基線校正、標準正態變量(Standard Normal Variate,SNV)、去趨勢、多元散射校正(Multiplicative Scatter Correction, MSC)和正交信號校正(Orthogonal Signal Correction, OSC)。目前,常用的平滑方法包括Savisky-Golay平滑濾波器(S-G Filtering)、Gaussian濾波器、平均濾波器和中值濾波器等。也可以將以上預處理方法組合使用,從而提高模型的預測性能。

1.3.2 特征波長提取

特征波長選擇是篩選出與目標屬性相關的最有效關鍵波長。然后,基于這些選定的關鍵波長,進行誤差較小的定性或定量研究。優化波長選擇的方法有很多,如回歸系數(Related Coefficient,RC)、連續投影算法(Successive Projections Algorithm,SPA)、競爭性自適應重加權采樣(Competitive Adapative Reweighted Sampling,CARS)、模擬退火(Simulated Annealing, SA)、主成分分析法(Principal Component Analysis,PCA)、無信息變量消除法(Uninformative Variables Elimination, UVE)、隨機蛙跳(Random Frog, RF)算法、遺傳算法(Genetic Algorithm,GA)等。由于高光譜數據的復雜性,不同的最佳波長選擇算法可能會產生不同的結果。因此,在選擇最佳波長時,應組合不同預處理方法使用,比較幾種不同的算法以獲得預測效果最佳的一種。

1.3.3 模型的建立與驗證

由于高光譜圖像的高維度和多重共線性,需要使用多元分析方法來分析和建立光譜數據與樣本目標特征之間的關系。一般來說,多元分析方法分為定量分析和定性分類。

對于定量分析,其目的通常是建立樣品中的某個屬性與光譜數據之間的關系。通過使用這種回歸關系,我們通過該屬性在樣品內部的分布情況進行定量分析。定量分析方法可以是非線性的,也可以是線性的。典型的非線性定量分析方法主要包括人工神經網絡(Artificial Neural Network,ANN)、支持向量機(Support Vector Machine,SVM)和支持向量回歸(Support Vector Regression,SVR)。線性分析方法主要包括偏最小二乘回歸(Partial Least Squares Regression, PLSR)、逐步線性回歸(Stepwise Linear Regression, SLR)和多元線性回歸(Multiple Linear Regression,MLR)。常用的預測模型性能評價指標有決定系數(R2)、均方根誤差(RMSE)、相對誤差(RE)和殘差預測偏差(RPD)。一般來說,驗證結果較好的預測模型,其訓練集和預測集應該有接近1的R2值,大于3的RPD值和盡量小的RMSE、RE。

對于定性分類,一般包括有監督分類和無監督分類。光譜數據分析常用的監督分類方法包括k-近鄰(K-Nearest Neighbor, KNN)、ANN、線性判別分析(Linear Discrimination Analysis, LDA)、支持向量機(SVM)和偏最小二乘判別分析(Partial Least Square Discriminant Analyses,PLS-DA)。用于光譜數據分析的典型無監督分類方法包括主成分分析(PCA)、層次聚類和k均值[1]。定性分類后,研究者一般以預測模型的準確度或誤判率[9]作為分類效果的評價指標。準確率的指標越接近于100%,誤判率越接近于0,代表預測模型的分類效果越明顯;若準確率低于70%則可判定識別效果不明顯。

2 高光譜成像技術在農產品品質檢測中的應用

常用的高光譜波長范圍為可見–近紅外(400~1 000 nm)、近紅外(900~1 700 nm)和短波紅外波段(1 000~2 500 nm)三種波段。高光譜成像技術憑借其高信噪比、高穩定性、高分辨率的特點在農產品品質檢測中得到廣泛應用。

2.1 品種分類

不同種類的農產品品種繁多,由于不同品種的農產品其生長環境、產量等存在差異,導致品種間營養成分、用途、價格差異較大。導致市場上以次充好現象頻發,給農產品的國際貿易、地理標志產品保護以及消費者權益保護帶來阻礙[2]。品種分類是農產品儲藏、育種以及開發利用的重要依據[8],由于大部分農產品品種外觀極其相似,很難通過肉眼觀察進行品種分類。通過高光譜成像技術對不同種類的農產品品種進行無損分類,有助于商業分級,可以有效避免以次充好現象的發生。在品種分類的研究中,將掃描農產品得到的光譜信息和紋理特征、顏色特征和形態學特征等結合進行建模,所建模型性能優于單一使用光譜或圖像信息。

由表2可知,不同種類農產品所用的光譜處理及建模算法有所不同,最常用的包括 MSC、SNV算法用于光譜散射校正,盡量消除樣品狀態、測量環境等因素帶來的影響。因為高光譜成像技術結合了化學計量學、機器學習等方法,操作軟件主要使用ENVI、Matlab、PyTorch和Python等。分別用于選取樣本感興趣區域從而提取光譜數據;對數據進行數據預處理、特征波長選擇及常規方法建模;構造神經網絡以及對數據進行可視化等。高光譜成像技術可運用于各個種類農產品的品種鑒別中,包括谷物、果蔬、肉制品等。由表2中統計的案例均表明了高光譜成像技術在谷物、果蔬、肉制品等農產品的品種鑒別方面的可行性,并結合了化學計量學和機器學習方法可以為農產品的品種鑒別提供更加無損、快速、低成本的方法。

表2 高光譜成像技術在農產品品種分類中的應用Table 2 Application of hyperspectral imaging technology in identification of agricultural products

2.2 理化性質檢測

對于農產品內部理化性質的分析,可使用建模算法來建立回歸模型從而對相關屬性進行含量預測。由于農產品的營養價值直接體現在其內部的理化性質上,故對其進行分析有利于農產品的育種篩選、商業分級等。高光譜成像技術憑借“圖譜合一”的自身優勢已經被廣泛運用于農產品的含水量、蛋白質等理化指標的檢測中。

2.2.1 谷物含水量檢測

廉孟茹等[26]采用高光譜技術對鮮食水果玉米進行光譜數據采集,選取 MSC對光譜進行預處理?;?MSC預處理數據選用 SPA、CARS以及RF分別提取含水量的特征波長并建模分析。結果表明,MSC-CARS-PLS模型的含水率預測效果最好,預測集的決定系數達到0.825,預測均方根誤差(RMSEP)為 0.006。該模型預測效果較好,但只使用了 PLS一種建模方法。除PLS外,建議使用多種建模方法,進行比較獲得最佳建模方法。

2.2.2 果蔬含水量檢測

李紅等[27]利用高光譜成像技術,并結合顏色特征和光譜信息對生菜冠層含水量進行檢測。在去除圖像的背景噪聲和光強校正后,利用SNV進行光譜預處理,采用蒙特卡羅無信息變量消除法(Monte Carlo Uninformative Variable Elimination,MCUVE)剔除無關變量,再結合SPA和基于最小絕對收縮和選擇算法(Least Absolute Shrinkage and Selection Operator, LASSO)篩選特征波長。從而建立 MCUVE-LASSO-SPA-PLS模型,其預測集相關系數為0.901,均方根誤差為0.929,效果較好。在特征波長篩選步驟中,組合使用三種算法達到更好的消除冗余信息、篩選波長的效果。故可使用 MCUVE-LASSO-SPA-PLS模型計算生菜冠層每個像素點的干基含水率,從而實現生菜冠層葉片干基含水率可視化檢測。孫紅等[28]為了快速檢測馬鈴薯葉片的含水量,結合顏色特征和光譜信息,在862.9~1 704.2 nm波長范圍內采集葉片光譜成像數據和圖像信息,分別用相關性分析(Correlation Analysis, CA)和RF兩種算法進行光譜特征分析各篩選得到15個特征波長。分別用兩種算法篩選出的特征波長建立 CA-PLSR和RF-PLSR模型。結果顯示,RF算法選取的特征波長分布范圍較CA法范圍更廣,具有局部“峰谷”特性,且RF-PLSR建模后效果更佳,其預測集精度R2為0.947,RMSE為2.15%。然而,在他們的研究中,由于沒有使用SNV算法等進行光譜預處理,直接在全波長的基礎上篩選特征波長和建立預測模型,模型的運行效率可能較低。因此進一步的研究中可以使用光譜預處理來提高模型性能和運行效率。

2.2.3 肉品含水量檢測

王迪等[29]利用高光譜成像技術對羊肉含水量進行無損檢測。在1 000~2 500 nm范圍內對羊肉樣本進行光譜信息采集,分別使用SNV、MSC和去趨勢校正法等6種算法進行處理,選出最佳預處理算法為去趨勢校正法(Detrend Correction,DC)。原始數據經 DC處理后,采用相關系數法(Correlation Coefficient Method, CCM)篩選特征波長,建立特征波長下羊肉含水量的PLSR模型和逐步多元線性回歸(Stepwise Multiple Linear Regression, SMLR)模型。如表3、表4所示,比較了兩種模型的定量分析指標,SMLR模型對含水量預測效果最好,預測集的相關系數為0.865,標準誤差為0.039,模型指標較好可以實現對羊肉含水量的無損檢測。

表3 不同預處理方法下的PLSR模型結果[29]Table 3 The results of PLSR model under different preprocessing methods

表4 特征波段下的PLSR和SMLR模型結果[29]Table 4 Results of PLSR and SMLR models under characteristic bands

2.2.4 農產品中蛋白質含量檢測

王朝輝等[30]結合顏色特征和光譜信息研究大米中蛋白質含量,提取了408.3~1 007.2 nm范圍內的大米光譜信息并與化學方法測定的蛋白質含量相結合,比較SG、MC、MSC三種預處理方法的效果,得出MC算法效果最佳,再使用SPA法篩選特征波段?;谌ㄩL分別建立 PLSR、主成分回歸(Principal Component Regression,PCR)、BP神經網絡預測模型,對比確定最優模型為PLSR。建立MC-SPA-PLSR模型,預測各像素點的蛋白質含量,訓練集的相關系數為0.904。再結合其灰度圖像可對大米中蛋白質含量分布進行可視化檢測。胡鵬偉[31]提出一種基于CARS和SPA結合多層前饋神經網絡的預測建模方法,實驗以含有不同濃度蛋白質的牛奶為對象,利用高光譜成像系統共采集到5種牛奶的高光譜數據,進行實驗對比選擇采用標準化方法對獲取到的吸收光譜預處理,然后采用CARS結合SPA篩選特征波長,建立 CARS-SPA-BP模型,其測試集決定系數達到 0.968,均方根誤差(RMSEP)達到了0.034。該研究創新性的結合了CARS和 SPA算法既降低了模型運算量,還可以概括樣品的光譜信息,具有實際意義,但在運用BP神經網絡進行建模計算時要注意過擬合的問題。田容才等[32]分析早秈稻籽粒光譜反射率與籽粒粗蛋白含量的關系,在325~1 075 nm波長范圍內,使用SG平滑進行光譜預處理,再進行反射率數據與粗蛋白含量的相關性分析,篩選敏感波長。最后,建立基于敏感單波長、波長組合和光譜參數的一元線性、多元線性、指數和多項式模型。研究發現,在基于敏感波長的估測模型中,四元線性模型估測效果最佳,其驗證集的R2、RMSE和RE分別為0.518、0.154%和1.303%;在基于光譜參數構建的估測模型中,DSI為自變量構建的多項式模型估測效果較優,其預測集的R2為0.581;RMSE為0.230%;RE為2.307%。本研究基于敏感波長和光譜信息分別建模,R2值均較低,應考慮預測值與實測值含量間是否為線性關系。若在后續研究中將敏感波長與圖像特征融合進行建?;蛟S能提高模型精度并對R2值帶來改善。

2.2.5 脂肪含量的無損檢測

Liu等[33]提出了一種基于注意力機制的卷積神經網絡回歸模型ACNNR,結合高光譜成像來預測單個玉米籽粒中的含油量。在866.4~1 701.0 nm范圍內采集單個玉米籽粒胚側和非胚側的高光譜圖像,并比較了 CNNR、ACNNR和偏最小二乘回歸(PLSR)的性能。對于PLSR,使用一系列光譜預處理和降維方法最終確定最優混合 PLSR模型。而對于CNNR和ACNNR,僅使用原始光譜作為其輸入。結果表明,胚胎側更適合建立回歸模型;注意力機制有助于減少預測誤差,使ACNNR表現最佳。ACNNR模型將光譜信息通過“端對端”的處理方式,節省了預處理、特征提取等步驟,并得到了比傳統建模方法(PLSR)更好的性能參數。接下來可以引入不同品種玉米籽粒的含油量建立預測模型,增加模型的穩健性。

馬文強等[34]對核桃仁脂肪含量進行預測。采集862.9~1 704.02 nm和382.19~1 026.66 nm波段的新疆“溫 185”核桃仁的光譜信息。采用MSE和SNV法進行預處理后,通過CARS與CCM,對核桃仁樣品的脂肪含量進行了特征波段篩選。通過PLSR算法建立了全光譜波段與特征光譜波段的預測模型,與全光譜波段相比蛋白質含量預測模型的驗證集R2由0.66增長到0.91,RMSEP由1.37下降到0.78;脂肪含量預測模型的驗證集R2由 0.83增長到 0.93,RMSEP由 0.98下降到0.47。該研究表明采用CARS與CCM算法結合,篩選出的特征波段可以有效降低全光譜信息的復雜度,提高建模質量。章海亮[35]利用高光譜技術采集900~1 700 nm范圍三文魚樣本的光譜數據。對全譜利用SPA算法提取特征波長,然后基于特征波長建立 PLS模型,利用 PLS模型,對 100個樣本的光譜數據進行三文魚脂肪建模分析,模型預測集的R2為0.913,RMSE為0.920%。本研究模型精度較高,但缺少光譜預處理,直接對全波段進行特征波長篩選和建??赡軐е履P瓦\行效率較低。

2.3 農藥殘留檢測

中國作為農業大國,每年都需要使用大量農藥來減少昆蟲和病害對農作物的干擾,從而保證農作物的正常生長。農藥一方面可以用來防治農作物中的病蟲害,但另一方面使用不當也會給人們的健康帶來危害[36]。不同于傳統檢測方法,高光譜成像技術具有快速、無損的特點,滿足現代農業需求。針對農藥殘留的問題,目前已有國內外團隊進行相關研究。

REN等[37]以施加了不同樂果濃度的菠菜葉為研究對象,使用 MSC算法對光譜數據進行校正。此外,卡方檢驗特征選擇算法分別與支持向量分類(Support Vector Classification,SVC)、KNN、RF和LDA等建模方法相結合。結果表明卡方檢驗與 LDA組合是最佳模型,該模型的預測準確度和標準偏差分別為99.7%、0.008,預測模型識別準確率較高,該方法可用于菠菜中樂果農藥的無損檢測。SUN等[38]以萵苣葉中的混合農藥(氰戊菊酯和樂果)為研究對象,采用SNV算法對萵苣葉的高光譜數據進行預處理。然后分別使用CARS和隨機森林遞歸特征消除(RF-RFE)選擇特征波長,再利用SPA結合最小二乘支持向量回歸(Least Squares Support Vector Regression,LSSVR)建立氰戊菊酯和樂果的預測模型。結果表明,預測氰戊菊酯的 CARS-SPA-LSSVR模型預測集R2為0.889,RMSEP為 0.018,預測樂果的 RF-RFE-SPA-LSSVR模型預測集R2為 0.939和RMSEP為 0.008。本研究創新性的結合了CARS-SPA和RF-RFE-SPA算法分別進行特征波長的篩選,簡化了校準模型,提高了模型精度。

高光譜成像技術不僅可以對農產品進行單一種類的農藥殘留檢測,還可以同時對不同種類的農藥殘留進行無損檢測,趙昱萱等[39]結合高光譜技術和化學計量學方法,采集450~950 nm波長范圍薄荷葉的光譜信息,對薄荷葉上的異丙甲草胺、煙嘧等4類除草劑殘留進行種類判別。使用SG平滑和 MSC對光譜信息進行預處理。利用PCA算法對原始數據進行降維后,建立SVM模型。分別利用網格搜索(Grid Search, GS)、粒子群算法(Particle Swarm Optimization, PSO)及灰狼算法(Gray Wolf Optimizer, GWO)對SVM模型參數進行處理。經過對比不同模型,SG-PSOSVM、SG-PCA-GWO-SVM和MSC-GS-SVM對測試集的判別正確率達到了100%,其中 SG-PCAGWO-SVM 計算時間最短。MSC-GS-SVM 具有最優的泛化能力,該方法應用范圍廣泛,可以實現對薄荷葉片上常見除草劑的無損檢測。潘明康[40]基于高光譜成像技術對柿子表面不同農藥殘留種類進行檢測。在400~1 000 nm范圍內采集柿子的高光譜數據再經過SNV進行光譜預處理,分別選用PCA和SPA算法進行全波段降維?;赑CA法和SPA提取的特征波長分別建立SVM、BP神經網絡和 ELM 的農藥殘留種類檢測模型。實驗結果表明,SPA降維效果優于 PCA,基于 SPASVM模型分類效果最好,識別準確率為90%。本研究中三種模型中對農藥殘留檢測精度有待提高,可嘗試更多高光譜降維方法和其他預測模型,提高模型識別準確率。桂江生等[41]提出一種基于高光譜圖像技術的西蘭花農藥殘留定性檢測新方法。首先在383.70~1 032.70 nm波段內分別采集噴砂了吡蟲啉、阿維菌素、丙森鋅3種農藥的西蘭花高光譜圖像,并采用 MSC對原始光譜數據進行預處理,再分別使用PCA和SPA算法選擇特征光譜。最后,使用 MD、LSSVM、ANN和ELM 4種分類算法建立基于全波段和特征波段信息的農藥殘留檢測模型。結果表明:基于 SPAELM 模型的識別效果最好,預測集的正確率為96.7%。

姜榮昌等[42]提出了一種快速無損識別大白菜農藥殘留種類的方法。將含有均勻噴灑農藥(毒死蜱、樂果、滅多威和氯氰菊酯)的大白菜樣本為研究對象,分別獲取其400~1 000 nm高光譜圖像,并選取感興趣區域后經 MSC預處理;分別采用CARS、PCA算法和離散小波變換(discrete wavelet transform, DWT)降維;最后,將降維后的高光譜數據分別輸入 CNN、多層感知機(Multi-Layer Perceptron, MLP)、 KNN 和支持向量機SVM建立模型并比較。結果顯示,DWT-CNN算法總體精度為 91.2%。本研究使用離散小波算法降維,能夠有效過濾高頻干擾信息;且與PCA和CARS降維算法相比較,基于離散小波變換降維數據的同時,不僅較好的保留原始光譜曲線形狀,而且還能較好還原曲線相對空間位置,提高了高光譜數據分類識別準確度。

叢孫麗[43]利用高光譜圖像技術對生菜葉片多種農藥殘留鑒別研究。采集 431~962 nm波段的生菜葉片光譜數據。采用SNV算法對原始光譜數據預處理,并使用SPA選出15個特征波長再建立 SVM 鑒別模型。接著,在特征光譜數據的基礎上建立基于三種智能優化算法的 SVM模型(ABC-SVM、CS-SVM 及 GSA-SVM),綜合考慮模型運行時間、訓練集和測試集準確率及收斂迭代次數,GSA-SVM模型性能最優。確立 GSASVM模型中最佳粒子個數為40時GSA-SVM達到了最佳鑒別效果,測試集準確率為 96.1%。本研究對生菜葉片多種農藥殘留的定性研究聚焦于高光譜圖像技術的光譜信息,沒有研究生菜葉片農藥殘留與圖像特征之間的關系,也沒有對混合農藥殘留的含量實行可視化分析。因此,今后需要在這兩方面進行深入研究,提高模型精度的同時使農殘量可視化。

對農產品中農藥殘留的無損檢測需求,使得高光譜成像技術在農殘檢測方面具有較高的應用潛力。上述研究多聚焦于使用光譜信息進行農藥殘留的鑒別與殘留量的檢測,未融合圖像信息進行處理。若能結合農產品的紋理特征等,則能起到提高模型通用性和準確率的效果。也可以對殘留農藥在農產品中的分布進行可視化處理,進一步對殘留農藥含量進行檢測。

2.4 病菌及毒素感染檢測

農產品在采摘、運輸和營銷過程中若保存措施不當極易受到病菌感染,農產品表面及內部的病菌存在不僅會導致品質下降,還會對農產品的食用安全性帶來不利影響。一些真菌還會產生高溫條件下難以去除的真菌毒素,限制了農產品的產量同時也造成了污染,也對消費者健康造成危害。高光譜成像技術憑借其無損快速的特點可以對農產品的實時健康進行檢測,滿足現代農業發展的要求。并且能夠在農作物的初步階段預防植物病害,有助于農作物的健康控制和優化產量,而不只是單單依賴于農藥的使用[44]。

在真菌感染檢測方面。由于發霉的花生含有大量的黃曲霉毒素,能對絕大多數動物起急性毒害作用,而且具有明顯的致癌作用。若能進行無損區分霉變花生,能對生產和售賣起到積極作用。Qi[45]利用高光譜識別發霉花生。將花生的光譜數據,進行了連續小波變換(Continuous Wavelet Transform, CWT)和可分性分析,再利用閾值法,分離出五個小波特征(WFs)來識別發霉花生。此外,將SPA得到的七個最佳波段與WFs進行了比較。采用PLS-DA和SVM作為分類器,對WFs和最優頻帶進行評價。根據PLS-DA和SVMs的總體分類結果,連續小波變換 CWT分類后與PLS-DA相結合分類效果更佳,測試數據的分類結果至少為96.2%。Feng等[46]采用874~1 734 nm光譜范圍內的近紅外高光譜成像系統檢測藍霉菌對栗子的霉變危害。從高光譜圖像中提取光譜數據后使用SPA選出了12個特征波長。采用ANN,包括反向傳播神經網絡(Back Propagation Neural Network, BPNN)、進化神經網絡、ELM等模型,利用全光譜和特征波長建立模型。使用全光譜和最佳波長的BPNN和ENN模型獲得了令人滿意的性能,分類精度均超過99%。兩份研究中的模型精度較高,然而在他們的研究中,都缺少光譜預處理步驟;并且均只針對單一品種的農產品進行霉變檢測,在接下來的研究中應該增加更多的品種,以增強所建立預測模型的魯棒性。

Chu[47]利用高光譜成像評估三個雜交種的健康和真菌感染玉米籽粒之間的差異。分別采用PCA-SVM、SPA-SVM,研究了像素級(PW)和對象級(OW)兩種采樣策略。使用PC1和PC3到 PC6開發的對象級,OW-SPA-SVM模型對三個玉米雜交種的準確率均高于OW-PCA-SVM模型,分別為100%、98.9%和98.9%。在像素級分析中,PW-SPA-SVM模型的核級分類準確率更高分別為100%、100%和100%。本研究從圖像的不同采樣方法入手,對比了像素級和對象級檢測方法對模型準確性的影響,可由實驗結果看出搭配PW采樣,模型分類更好。

劉琦等[48]為了區分感染小麥條銹菌的潛育期小麥,在325~1 075 nm范圍內利用定性偏最小二乘(Discriminant Partial Least Squares,DPLS)、ANN和SVM這3種方法建立識別潛育期小麥條銹菌的模型,經過對比三種模型的準確度,以FD篩選特征光譜時三種模型中SVM識別效果最佳,FD-SVM識別準確率均可達到100.00%,能明顯起到區分被感染小麥的作用。但該研究所選波段仍是全波段范圍,含有較多無效信息,若能找到識別潛育期小麥條銹菌的敏感波段,使建立模型所選波段更加科學合理,將使識別模型更加高效、準確。

Siedliska[49]使用高光譜成像技術檢測真菌感染導致的水果腐爛。將“Senga Sengana”和“Honeoye”兩個品種的草莓分別接種灰霉病菌和急性衣原體的致病真菌,而將未接種的果實作為對照。在接種后的4天內獲得了果實的反射光譜?;谠脊庾V使用2ND篩選出19個特征波長,并用于構建監督分類模型。在所研究的分類模型中,使用BPNN模型的預測精度最高,接種和對照果實的鑒別準確率均在97%以上,可以有效對感染真菌的草莓果實進行無損區分。

除了對被污染農產品中的病原體進行檢測,高光譜成像技術還可以對農產品中所含有的真菌毒素進行定性定量檢測。

丁靜等[50]為實現小麥嘔吐毒素含量快速檢測,在1 000~2 500 nm范圍內采集小麥赤霉病籽粒樣本的高光譜圖像,組合使用SG-NL-MA對原始光譜進行預處理,再使用SPA和區間組合優化結合連續投影算法(ICO-SPA),結合PLSR、MLR和最小二乘支持向量機回歸(LS-SVR)模型比較三種模型的預測效果。結果表明,ICO-SPA提取出的 22個特征波段能有效反映病粒樣本中的大分子含量的差異,其中ICO-SPA-MLR模型效果最優,預測集相關系數、均方根誤差和相對分析誤差分別為0.921、0.375 mg/kg和2.79。該研究針對小麥單一品種進行 DON含量預測實驗,ICO-SPA的特征波長選擇算法獲得了讓人滿意的結果,若換成其他小麥品種,ICO-SPA的效果如何有待進一步的研究和驗證。

玉米作為食品和飼料生產中的重要作物之一,但玉米在運輸和貯藏過程中極易發生霉變,霉變后會產生分布廣泛、危害嚴重的黃曲霉毒素和玉米赤霉烯酮,若對兩種毒素處理不當,極易引起人、畜、禽中毒。因此,及時檢出霉變玉米尤為重要。殷勇等[51]為通過高光譜技術檢測霉變玉米中黃曲霉毒素B1含量,選擇5種不同霉變程度的玉米為試驗材料,采集371.05~1 023.82 nm波段內樣本的光譜信息,再進行 MSC預處理;運用PLSR來選擇特征波長,然后利用Fisher判別分析(Fisher Discriminant Analysis, FDA)分別對全波長和特征波長下霉變玉米進行鑒別分析。結果表明,而在特征光譜下的FDA鑒別正確率均在98%以上。王光輝等[52]欲結合高光譜信息和紋理特征,檢驗霉變玉米中的玉米赤霉烯酮含量。在371.05~1 023.82 nm波段內采集原始數據后使用MSC進行預處理;根據CCM進行數據降維,再通過SPA結合信息熵選擇出8個特征波長;建立特征波長下的赤霉烯酮含量的 BP神經網絡預測模型。結果表明,特征波長的光譜信息所建立的預測模型最佳,赤霉烯酮含量預測正確率為100%,均方根誤差為0.161。

通過表5對上述研究中所探究的農產品、病菌種類等進行了總結。在高光譜成像技術檢測病菌和毒素感染的研究中,研究人員將獲取的病菌毒素的光譜信息和圖像信息融合檢測,加強了高光譜成像技術對病菌毒素檢測的靈敏度和普遍性。但上述研究成果多針對于單一或少數品種農產品進行圖像提取,在此基礎上進行建模操作,后期可以對多個品種混合的農產品進行檢測,從而提高預測模型適用性。

表5 農產品檢測的光譜范圍以及算法Table 5 Spectral region and algorithms for agricultural products detection

3 結論與展望

高光譜成像技術作為農產品營養品質與質量安全無損檢測的有利工具,融合了成像技術和光譜技術的優點,產生帶有空間信息和光譜信息的三維數據立方體,彌補了傳統成像技術和光譜技術的缺點[1]。近二十年來,該技術已經廣泛應用于各種農產品的質量檢測,如果蔬、谷物、肉制品和咖啡等副食產品。高光譜成像技術可檢測到的目標質量屬性也很全面,不僅包括品種分類、營養物質檢測,還可以對被真菌感染和毒素污染的農產品進行檢測。另外還有針對農產品的新鮮度評價以及缺陷評價等。這些大量的成功應用也表明HSI具有快速、準確的優點,可以作為一種無損、便捷、低成本的檢測方法實現農產品的質量分析。

目前,高光譜成像技術大多數報道聚焦在以實驗室規模內進行的可行性研究,缺乏相關研究證明模型在實際場景中應用的適用性[53]。其次,HSI生成的大量光譜數據,限制了其在農產品快速檢測中的應用,從冗余的光譜信息中提取出有用的特征數據及建立合理的預測模型成為解決該問題的關鍵。另外,在實際應用中,使用高光譜相機捕捉樣品圖像及光譜信息的操作難度不大,但后續的數據處理及建模方法對于非專業人員來說難度較大,可能對高光譜成像技術投入生產線使用帶來技術限制。

因此,未來可以開展針對化學計量學和機器學習算法的相關研究,開發更多針對高光譜成像技術在實際應用中使用的更加簡單、快捷的技術和算法,可以實現對高精度的高光譜數據進行快速分析,從而提取特征波長并建立回歸模型[54]。隨著光譜技術和計算機技術的發展,將有更先進的光學設備和相關算法被研究人員開發出來,使高光譜成像技術作為一種快速高效的無損檢測技術,在農產品品質和安全檢測領域發揮更大的作用。

猜你喜歡
光譜信息波長預處理
HPLC-PDA雙波長法同時測定四季草片中沒食子酸和槲皮苷的含量
基于光譜和Gabor紋理信息融合的油桃品種識別
基于植被光譜信息的龜裂堿土堿化程度預測研究
基于預處理MUSIC算法的分布式陣列DOA估計
雙波長激光治療慢性牙周炎的療效觀察
傅立葉變換光譜儀的研究現狀與光譜信息分析原理
日本研發出可完全覆蓋可見光波長的LED光源
淺談PLC在預處理生產線自動化改造中的應用
絡合萃取法預處理H酸廢水
一種基于區域生長的高分辨率遙感影像道路提取方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合