?

光譜成像技術在玉米種子質量檢測方面的研究進展

2023-12-29 03:41靖相柱郭業民趙文蘋桑茂盛
北方農業學報 2023年5期
關鍵詞:玉米種子光譜玉米

靖相柱,孫 霞,郭業民,趙文蘋,郭 榛,桑茂盛

(山東理工大學農業工程與食品科學學院,山東淄博 255000)

種子是一切農業生產的基礎,優質種子是提高作物產量的關鍵[1]。玉米屬禾本科植物,原產中美洲和南美洲[2]。玉米對環境的適應能力較強,產量高,是世界各國的主要糧食作物。玉米種子中的維生素含量為水稻、小麥的5~10 倍,是保健食品行業的潛在資源[3]。由于玉米種子在種植、收獲、干燥、運輸、加工、貯藏等過程中,受外部環境和自身活動的影響,易使種子的質量發生改變,進而影響到產量的高低,為保障玉米種子質量,因此要對玉米種子質量進行檢測。目前,對玉米種子質量檢測的方法主要有形態鑒定法、人工感官鑒定法、化學分析法等[4-5]。

形態鑒定法和人工感官鑒定法易受個人經驗等因素的干擾,且存在工作量大、作業周期長、檢測效率低等缺點,難以保證結果的準確性;利用化學分析法檢測玉米種子雖然準確性高、特異性強,但極易對玉米種子造成損傷,并且存在檢測周期長、可重復性差等缺點,這幾種方法均不適用于大規模檢測。目前機器視覺技術、近紅外光譜技術在玉米種子質量檢測方面得到了較為廣泛的研究和應用[6-8]。TU 等[9]基于RGB 圖像結合微調后的VGG-16 網絡,鑒別玉米目標品種的種子,準確率為98%。ALTUNTA等[10]基于機器視覺技術分類單倍體和二倍體玉米種子,VGG-19 模型取得了最優效果,準確率達到94.22%。馮曉等[11]基于輕量級卷積神經網絡和遷移學習構建了玉米籽粒雙面特征模型,準確率達99.83%,優于單面特征模型。FAN 等[12]使用近紅外光譜技術檢測單粒種子的活力,利用主成分分析法(principal component analysis,PCA)和連續投影法(successive projections algorithm,SPA)進行特征降維,結合4 種機器學習方法構建了8 種預測模型,結果表明8 種模型的準確率均達到84%以上。但以上機器視覺技術只能獲取種子表面的物理特征信息,無法獲取種子內部的成分含量信息;近紅外光譜技術只能提供關于整個樣品的平均光譜信息,不能直接獲取像素級別的信息,這一技術缺陷也限制其在圖像分析和圖像處理中的應用。因此,尋求一種快速、有效、穩定的玉米種子質量檢測方法具有現實性和迫切性。

光譜成像技術(spectral imaging techniques)融合了傳統的光譜技術和圖像技術,并且在光譜和圖像信息與被測物質成分之間建立數學關聯,由此獲得被測樣品的檢測結果,具備無損、快速、高分辨的優點,已經應用在各類糧食作物、經濟作物、蔬菜作物等農產品的無損檢測中[13-15]。截至目前,光譜成像技術已在玉米種子活力、含水率、病害檢測和品質與產地鑒別等方面進行了多項研究[16-19]。光譜成像技術應用于玉米種子質量檢測主要是結合化學計量學方法,依托采集的光譜數據信息,利用多種數據預處理方法,實現對相關檢測指標的定性判別和定量分析,最終建立有較強魯棒性的模型,但在對同一種指標進行檢測時,不同學者用到的預處理方法不同,提取的特征波長數也不同,導致檢測指標與其特定吸收波長的聯系存在爭議,因此,將建立的模型應用到不同設備上指導農業生產仍是研究重點。本文闡述了光譜成像技術基本構成及原理、光譜數據預處理的方法、光譜特征波長提取方法、建模分析方法以及模型評價指標,綜述了目前光譜成像技術在玉米種子質量檢測中的應用成果,展望了光譜成像技術在玉米種子質量檢測中的前景,以期促進光譜成像技術更廣泛地應用于玉米種子的質量檢測中,從而進一步保障玉米種子產業安全生產具有重要意義。

1 光譜成像技術原理

1.1 光譜分析技術

光譜分析技術是通過光譜系統采集在特定波長范圍內的光譜信息,分析物質吸收、發射或散射光的波長從而確定樣品成分和性質的一種技術。其基本原理是根據原子、分子和離子的內部結構等特點,通過光在不同物質中的傳播以及相互作用不同,對物質進行分析和檢測。常見的光譜分析技術主要包括:可見光譜分析、近紅外光譜分析和中紅外光譜分析,目前針對近紅外光譜技術的研究最為常見[20]。光譜分析技術具備快速、無損、簡便等優點,由于光譜分析技術采用單點掃描的方式,易受樣本分布均勻性的影響,需在不同的位置多次測量樣本信息;另外,該技術只能提供大規模樣品的平均光譜信息,不能直接獲取像素級別的信息,如何進行圖像的分析和處理也是需要關注的問題。

1.2 光譜成像技術

光譜成像技術的概念是1985 年由GOETZ 等[21]提出的。早期光譜成像技術主要用于遙感領域的地物探測[22]。圖1 所示光譜成像系統的構成主要是光源、光控裝置、攝像機、載物臺、計算機。光譜成像技術采集的光譜波長范圍廣泛,包括了200~2 560 nm的紫外線光譜區域、可見光譜區域、近紅外光譜區域。按照光譜系統掃描方式的不同將其分為點掃描式、線掃描式及面掃描式。線掃描式可以沿一個方向連續掃描,適用于傳送帶系統,因此是食品工業中最常用的掃描方式[23]。光譜成像技術基本原理見圖2[24],光譜圖像是由許多矢量像素構成的三維光譜立方體[25]。

圖1 光譜成像系統示意圖Figure 1 Schematic diagram of the spectral imaging system

圖2 技術原理圖[24]Figure 2 Technical schematic chart[24]

這些矢量像素同時包含了波長(λ)下的光譜信息和二維空間信息(X,Y),通過指定特定波長λ 或者指定空間坐標(X,Y)可以分別提取波長λ 處的圖像信息和特定像素點(X,Y)的光譜信息。光譜成像技術可以對多個目標同時進行檢測,具有“圖譜合一”的優點。受內外部環境的影響,光譜成像技術采集的光譜會帶有冗余信息,這些冗余信息會對數據處理造成影響,使光譜數據處理效率降低,因此光譜成像技術通常應用在基礎研究中。

2 光譜檢測技術工藝

2.1 種子檢測狀態

由于玉米種子的表皮富有光澤,會產生全反射,形狀呈卵形、U 形,影響光譜穿透效果,因此,玉米種子的檢測狀態影響光譜分析和光譜成像技術在檢測玉米種子質量過程中采集的光譜數據。玉米種子檢測狀態主要包括玉米種子整體、玉米種子研磨成粉、單粒玉米種子。玉米種子整體檢測是將相同重量的玉米種子均勻平鋪在培養皿中使高度保持一致,由此獲取平均光譜信息,但采集前需要大量樣本;粉末狀態檢測是將種子研磨成粉后放在培養皿中采集光譜信息,但是這種方法會破壞樣品內部結構,浪費種質資源;單粒玉米種子檢測,國內研究相對較少,其原因主要是由于光譜采集系統中配件的缺失和實驗操作復雜所致。

2.2 光譜成像數據預處理

光譜信息量龐大,目前應用到的處理軟件主要有HSI Analyzer、Matlab、Envi 和Unscrambler X。光譜成像技術(spectral imaging techniques)流程圖見圖3。由于采集圖像前,光譜數據易受到光源光照強度的影響出現噪聲干擾,這些干擾會影響光譜數據準確性。因此,采集樣品圖像前需對光譜系統進行黑白板校正。采集信息完畢后首先對圖像進行背景剔除,通過小波變換法(wavelet transform,WT)、主成分分析法(principal component analysis,PCA)來去除圖像壞點、不完整的背景信息和圖像的模糊邊緣;其次,要對圖像的感興趣區域(ROI)進行提取,這就要求使用閾值分割算法(OTSU)等對圖像進行分割處理,其目的是將有差異的區域分割出來,使它們互不相交;最后,對紋理、顏色和形態特征進行提取。紋理特征的提取方法有灰度共生矩陣(GLCM)[26-27],顏色特征的提取方法有顏色直方圖等,形態特征的提取方法有幾何參數法等[28-29]。

圖3 光譜成像技術流程圖Figure 3 Flow diagram of spectral imaging technology

利用光譜采集樣本圖像時,由于受到外界環境等因素的干擾,會使采集到的光譜圖像中摻雜一些噪聲,出現噪聲會影響模型精度,因此需對采集到的原始光譜數據進行預處理。常用的光譜預處理的方法有平滑法(moving average,MA)、標準正態向量法(standard normal variate,SNV)、多元散射校正(multiplicative scatter correction,MSC)[30-32]。

2.3 光譜數據特征波長提取方法

由于利用光譜成像技術采集的圖像數據量大,使波長之間有較大的冗余度,在數據處理時非常耗時,導致建立的模型不穩定、效率低,所以對光譜特征波長的提取是模型好壞的關鍵一步。常用的特征波長提取方法有競爭性自適應重加權算法(competitive adaptive reweighted sampling,CARS)、主成分分析法(principal component analysis,PCA)、連續投影算法(successive projections algorithm,SPA)、遺傳算法(genetic algorithm,GA)和隨機蛙跳(random frog,RF)算法等[33-34]。

2.4 模型的建立和評價方法

由于采集到的光譜數據冗余度較大,會導致建立模型的精度較差,因此需要對模型進行定性定量分類建模。在定性分類建模時應用支持向量機(support vector machine,SVM)、偏最小二乘判別分析(partial least squares-discriminant analysis,PLS-DA)、線性判別分析(linear discriminant analysis,LDA)等方法[35-36];定量分類建模的方法主要有主成分回歸(principal component regression,PCR)、支持向量回歸(support vector regression,SVR)、偏最小二乘回歸(partial least squares regression,PLSR)、多元線性回歸(multiple linear regression,MLR)等[24]。

通過上述方法進行定性、定量分類建模后,由于使用不同測試數據測試的模型精度出現誤差,所以必須對建立的模型進行校準驗證。目前采用交叉驗證法(cross validation,CV)可以得到一個準確、穩定的數據[37],用來評估模型的交叉驗證法主要有建模集決定系數(R2C)、預測集決定系數(R2P)以及建模集的均方根誤差(root mean squared error of calibration,RMSEC)、預測集的均方根誤差(root mean squared error of prediction,RMSEP)和相對預測偏差(residual predictive deviation,RPD)5 個參數指標,最后模型的相關系數越接近1,均方根誤差越接近0,RPD 的值大于3.0 小于6.5 時意味著模型性能越好,精度越高。

3 光譜成像技術在玉米種子質量檢測中的應用

3.1 玉米種子活力檢測

種子活力影響種子發芽率、出苗率、幼苗生長勢,通常作為評價玉米種子質量的重要指標。在收獲后,由于處理不當導致熱損傷或物理損傷,種子的活力可能會喪失。在貯藏過程中,種子呼吸會產生大量的水分和熱量,這也會導致種子老化,影響種子活力。在大田播種低活力的種子后,會造成出苗緩慢、發芽率低等問題,導致減產。應用光譜成像技術及時測定種子活力,篩選出活力低的種子,對作物生產具有重大意義。

WAKHOLI 等[38]利用光譜成像技術對玉米種子的活力進行分類,通過對建立的不同模型進行對比,發現支持向量機模型的分類正確率最高。但是在利用不同分類模型建模時出現了錯誤分類,究其原因是收集到的數據中存在噪聲,導致數據產生偏差,由此可見,在數據收集過程中,對環境控制是非常重要的。王亞麗等[39]設計了基于近紅外光譜技術的玉米種子活力分級裝置,建立PLS-DA 模型對種子活力進行定性判別,最終校正集相關系數為0.987,預測集相關系數為0.960,對玉米種子活力逐粒無損檢測及分級具有良好的效果。此外,單?;b置作為玉米種子活力分級裝置的關鍵部位,將有活力和無活力的玉米種子分別吹送至相應的分種箱,其分離效率是完成種子檢測及分級速率的關鍵,另外轉盤傾斜角、轉盤速度以及孔高度參數的設置會對單?;b置產生影響。FENG 等[40]在874~1 734 nm 光譜范圍內使用光譜成像技術鑒定了8 個不同人工老化時間處理下的玉米種子活力,采用PCA 對不同老化時間下的玉米籽粒進行定性分析,應用二階導數選擇特征波長,建立基于全光譜和最佳波長的SVM 分類模型,最終發現在0、12、24 h,分類精度范圍在61%~100%,在其他時間下分類精度較低,說明使用光譜成像技術結合化學計量學方法可以評估種子的活力和種子的老化程度。

上述研究大多基于玉米種子活力的定性分析,如活力水平預測、種子老化評價?;盍z測方法主要集中在具有一致性狀的玉米種子上,并且建立的模型準確率較高,可以達到快速、準確地檢測某一種玉米種子活力的要求。但是,在種子成分預測過程中與種子活力相關的定量分析的研究較少,且只關注了同一批次、同一品種的玉米種子,導致所建立的模型只能應用于當前任務,可移植能力不佳。

3.2 玉米種子含水率檢測

種子含水率是評價種子質量的重要指標。在種子貯存過程中,過高的水分會導致種子的呼吸作用變強,產生大量的水分和熱量,引起種子發霉,降低種子的活力特性,因此通過測定種子水分,防止種子變質,是保證種子質量的重要手段。目前傳統測定種子含水率的方法有蒸餾法、烘干法、微波法、電導法等。但是這些方法存在檢測過程耗時、破壞性強等缺點,不利于無損、高效檢測。

ZHANG 等[41]通過光譜成像技術結合深度學習的方式對玉米種子含水率進行了預測,運用偏最小二乘法(partial least squares,PLS)、卷積網絡(convolutional neural networks,CNN)、長短期記憶(long-short term memory,LSTM)和CNN-LSTM 分別建立了單粒水分模型,結果表明,胚側CNN-LSTM模型預測集的綜合指數為0.141,最適合水分測定,但CNN 模型需要訓練的參數太多,必須保證有足夠的訓練樣本。WANG 等[42]利用光譜成像技術結合變量選擇法,分別建立了玉米種子前后兩面不同放置位置的水分預測模型,有效地對水分進行了定量分析,得出前后兩面驗證集的相關系數分別為0.969和0.946,均方根誤差分別為0.464%和0.616%。廉孟茹等[43]應用光譜成像技術對144 根人工剝開玉米苞葉的鮮食玉米水分含量進行了預測,采用卷積平滑法(savitzky-golay,SG)、SNV、MSC、MA 對光譜數據進行處理,用SPA、CARS、RF 分別提取含水率的特征波長并建模分析,得出預測集相關系數分別為0.825 和0.006,但是針對田間未去除苞葉的鮮食玉米含水率的無損檢測模型還需進一步研究。

光譜成像技術在測定玉米種子水分方面取得了良好的效果,可滿足玉米種子質量檢驗快速、高效的要求。但是光譜采集的數據信息量極大,具有高維數和冗余度,因此在建模之前要進行多個數據預處理和特征波長的提取,這不僅增加了光譜建模過程的復雜性,且過度使用預處理方法還可能導致光譜信號失真,從而降低模型泛化性能。

3.3 玉米種子病害檢測

玉米種子在貯存過程中,由于溫濕度不一,易受真菌侵染發生霉變,影響其營養品質。黃曲霉和鐮孢菌產生的赭曲霉毒素、嘔吐毒素及伏馬菌素等真菌毒素,影響人們的食用和使用,給糧食行業帶來嚴重損失。近年來,光譜成像技術已被應用于染病種子的檢測。

KIMULI 等[44]采用短波紅外高光譜成像系統(SWIR) 結合PCA、PLS-DA 和階乘判別分析(flexible discriminant analysis,FDA)對4 個黃玉米品種感染黃曲霉毒素B1(AFB1)程度進行分類預測,準確率為96%。由于混合樣品的化學成分變化有限,PLS-DA 和FDA 模型在分離混合樣品時收到的AFB1 信息較少,導致兩個模型合并樣本的黃曲霉毒素分類結果較差。YANG 等[45]以實測真菌孢子數為依據,將霉變狀態劃分為4 個等級,通過高光譜技術結合深度堆疊稀疏自編碼器算法(stacked autoencoder)有效識別了玉米籽粒發霉程度,模型準確率超過90%,但真菌孢子在培養過程中的0~10 d孢子生長速度較慢,原因可能是真菌還在適應環境,沒有從玉米粒胚中吸收大量的營養。SHEN 等[46]通過可見光近紅外光譜成像技術和機器視覺技術相結合,采集270 組玉米籽粒的光譜信息,利用PCA+LDA 建立光譜和圖像特征融合模型,最終準確率為92.2%,該方法可以有效地檢測貯藏玉米中的曲霉菌屬和鐮刀菌屬污染情況,但光譜和圖像響應特性曲線易受玉米品種、侵染真菌種類和貯藏條件的影響,且在該試驗中僅對少數菌株進行了研究,以上原因均有可能導致建立的模型精度較差。DA CONCEISO 等[47]利用近紅外高光譜成像技術結合圖像的模式對感染黃萎鐮刀菌和禾谷鐮刀菌的玉米種子進行了判別,建立PLS-DA 預測模型,最終預測集相關系數為1??敌⒋娴萚48]通過光譜成像技術結合麻雀搜索算法(sparrow search algorithm,SSA)對感染伏馬菌素的種子進行了檢測,建立PLS-DA、PLS和BP 神經網絡(back propagation neural network)判別模型,最終SPA-SSA-BP 神經網絡與PLS-DA 模型精度達95.56%。

以上研究表明,光譜成像技術可以用于檢測種子是否受到真菌侵染及真菌毒素的危害。多數學者將光譜成像技術和機器視覺技術相結合進行檢測,提高了樣本特征的全面性,模型識別精度多數超過90%。但由于種子霉變時受環境溫度、樣品形態的影響,導致研究中的真菌濃度低于實際濃度,使所建立的定量模型產生誤差,因此未來應加大不同霉菌對玉米種子光譜成像特征影響的研究力度。

3.4 玉米種子品質與產地鑒別

玉米種類眾多,在大小和外觀上具有很強的相似性,肉眼難以區分,不同產地的玉米種子受環境的影響其特性會出現差異。在貯存、加工、銷售等環節,一些不法商家將不同品質的種子進行混合,影響種子質量。因此對玉米品質和產地的鑒別可以保障農民的權益,促進農業發展。近年來,光譜成像技術在鑒別品質和產地方面已經有了相關研究。

ZHANG 等[49]通過近紅外光譜技術對3 個不同玉米品種的凍害進行了鑒別并采用MSC、SNV、SG進行了預處理,建立了PLS-DA、KNN 和SVM 3 種模型進行比較,最終分類準確率為90%,說明該方法可以鑒別不同程度凍害的玉米,但由于該試驗樣本種類數量較少,模型精度還需進一步驗證。WANG等[50]采用近紅外光譜成像技術對3 種甜玉米種子(無處理的、人工加速老化的、經過熱損傷的)進行鑒別,建立的PLS-DA 模型準確率為95%,該模型對區分3 種不同處理的玉米的甜玉米種子具有良好的效果。ZHOU 等[51]通過光譜成像技術結合卷積神經網絡(CNN)和分區投票方法對12 個不同玉米品種種子的胚狀體和非胚體形態進行了識別。結果表明,6 個品種的普通玉米種子鑒定出胚狀和非胚狀的準確率分別為93.33%和95.56%;6 個品種甜玉米種子鑒定出胚狀和非胚狀的準確率分別為97.78%和98.15%。王慶國等[52]通過光譜成像技術對不同產地和不同年份的玉米種子進行了鑒別,得到了均值、標準差、熵和能量4 種特征,建立的PLS-DA 模型的預測集和驗證集相關系數為0.991 和0.984,但是在該研究中檢測的樣本數量較少,模型的精度還需要進行多次驗證。

以上研究表明,光譜成像技術可以對玉米種子的品質和產地進行鑒別。但近紅外光譜成像技術建立的模型準確率在95%以下,其原因在于掃描方式為單點掃描,無法評估樣本整體信息,易受樣本分布均勻性影響,因此將近紅外光譜成像技術與其他檢測技術相結合是未來的研究重點。雖然基于光譜成像技術建立的模型準確率高,但還存在圖像信息利用率不足和模型可移植性不強的問題,如何將光譜成像技術廣泛應用在玉米種子產地鑒別的現實需求中也是未來研究應該突破的重點。

4 存在問題與展望

綜上所述,國內外學者利用光譜成像技術在玉米種子質量檢測中都取得了不同的成果,并且在光譜成像預處理方面采取了多種算法,使建立的模型精度和數據準確性更高,但是光譜成像技術仍存在一些不足,主要體現在以下幾個方面。

(1)光譜成像中包含大量冗余信息,相關研究介紹了不同的預處理算法、特征波長選擇算法、建模方法,但是相關研究所使用的方法各不相同,建立具有較強魯棒性和較好泛化性能的模型仍是相關領域研究的重點,而建立更加標準化、普適化的建模方法是未來的發展要求。

(2)光譜成像包含圖像信息和光譜信息,相關研究大多側重于光譜信息的發掘而忽略與圖像信息相結合。傳統的圖像處理技術主要是提取圖片的紋理特征和顏色特征等,無法提取光譜圖像的全部特征,而深度學習技術的不斷發展,包括CNN、深度殘差網絡(deep residual network,ResNet)、LSTM 等能夠提取圖像更深層次的特征,深度學習方法與光譜成像技術的融合有助于推動相關技術進一步發展。

(3)相關光譜設備都是大型設備,小型化、國產化是設備發展的趨勢。隨著我國產業技術升級,研究轉向高新技術突破,必然打破高端高光譜設備由國外壟斷的現狀。

(4)光譜成像技術的優勢在于能夠同時、快速、無損地檢測樣品的多項指標,且具有實時檢測的潛力。相關研究大多處于基礎研究階段,僅為光譜成像技術的產業化應用提供了一些參考,只有較少的研究實現了實際應用,而這更多地依賴于建立具有良好魯棒性和泛化性能的模型以及發展更加小型、便攜式的光譜設備。

隨著科技的不斷發展,光譜成像技術在各類行業的應用范圍越來越廣,要求也更嚴格。針對存在的問題,首先,未來應建立一個玉米種子數據庫,通過加大抽樣力度,把玉米種子品種進行分類和分級,嘗試多種預處理算法,設計對應的光譜成像系統,達到降低成本、節約時間的效果,進而提高模型精度;其次,建議研究人員基于機器視覺技術、近紅外光譜技術和HIS 技術相結合的方法對玉米種子質量進行檢測;最后,開發一種更智能的玉米種子加工自動化分揀儀器。以數字化、圖像化和信息化為代表,建立一個通用的、穩健的模型是未來農產品無損檢測發展的必然趨勢。

猜你喜歡
玉米種子光譜玉米
不同條件下對濟寧地區玉米種子萌發特性的研究
基于三維Saab變換的高光譜圖像壓縮方法
影響玉米種子發芽率的因素及對策
收玉米啦!
我的玉米送給你
玉米種子生產存在的問題及管理辦法
星載近紅外高光譜CO2遙感進展
苦味酸與牛血清蛋白相互作用的光譜研究
生物活性水對玉米種子萌發及幼苗生長的影響
鋱(Ⅲ)與PvdA作用的光譜研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合