?

基于近紅外光譜技術的空苞山核桃快速識別

2024-03-12 03:25俞儲澤翁定康曹爍森
中國食品學報 2024年2期
關鍵詞:山核桃波長預處理

俞儲澤,翁定康,曹爍森,孫 通

(浙江農林大學光機電工程學院 杭州 311300)

山核桃(Carya cathayensis Sarg)是胡桃科山核桃屬喬木植物,有18 個種、3 個變種,廣泛分布在亞洲、歐洲和美洲,其果實是我國著名干果[1-2]。在我國,浙江臨安和安徽寧國是山核桃主產區,年產量接近全國的90%[2-3]。山核桃品質優良,果仁中含有豐富的蛋白質、脂肪和多種微量元素,營養價值高,深受人們的喜愛[4]。在山核桃生長過程中,有部分果實沒有果仁或者果仁發育受阻,這種現象被稱為“空苞現象”,引起“空苞”的原因包括環境不適、授粉不良、營養缺乏和結果過多等[5]。根據GB/T 24307-2009《山核桃產品質量等級》,癟籽率和半籽粒率≤1%且無空籽為特級山核桃,癟籽率和半籽粒率≤2%且無空籽為一級山核桃,癟籽率和半籽粒率≤3%且無空籽為二級山核桃。"空苞"現象的發生嚴重影響山核桃產品的品質。有效剔除空苞山核桃,將有利于提升山核桃的整體品質和提高其市場售價,保障種植戶的收益,最終促進山核桃產業的健康發展。因此,非常有必要對空苞山核桃進行快速、無損、準確識別。

近紅外光是波長在780~2 526 nm 范圍的電磁波,當近紅外光照射有機物樣品時,會使樣品分子從基態躍遷到激發態,從而產生近紅外光譜[6]。近紅外光譜主要反映有機物含氫基團(C-H、NH、O-H 等)的倍頻與合頻吸收信息[7]。在不同的分子結構中,同一基團或不同基團的近紅外吸收峰位置與強度均有所差別,因此近紅外光譜可以反映有機物分子結構與含量等信息[8]。因快速、無損、穩定等優點,近紅外光譜廣泛應用于蔬菜、水果、肉類等農產品的品質檢測與分級[9-12]。近年來,近紅外光譜分析技術也被應用在堅果內部缺陷檢測方面。蔣大鵬等[13]采用近紅外光譜技術對正常和霉變松子進行檢測,所建立的分類模型的準確率為100%。Hu 等[14]利用近紅外光譜技術對新鮮板栗的品質進行研究,發現線性判別分析(Linear discriminant analysis,LDA)模型對正常板栗和霉變板栗的識別效果最佳,分類模型的驗證集準確率為96.37%。鄭劍等[15]對褐變和正常板栗進行近紅外光譜檢測,采用變量選擇方法篩選特征波長變量,并建立板栗褐變的分類模型,其模型正確率可達0.88。Rogel-Castillo 等[16]應用PLS-DA 模型對隱性損傷和正常杏仁進行分類,結果表明其識別錯誤率在8.2%~9.2%之間。Pannico 等[17]利用近紅外光譜技術對缺陷和正常榛子進行識別,分類模型的決定系數為0.89,交互驗證均方根誤差為0.88。Moscetti 等[18]通過近紅外光譜技術對蟲害板栗和正常板栗進行分類,結果表明分類錯誤率為8.41%,AUC 值為0.952。由上可知,國內外研究者大多將近紅外光譜技術應用于杏仁、板栗、松子等堅果的缺陷和病害檢測,而對山核桃內部缺陷的檢測尚未見研究報道。

本研究以完整帶殼山核桃為對象,利用兩種近紅外光譜檢測裝置采集山核桃的光譜,采用8種預處理方法進行光譜預處理,利用CARS 方法篩選特征波長變量,采用3 種判別分析方法空苞山核桃識別模型,并比較不同預處理、近紅外檢測方式及判別方法等所建立的識別模型性能,以確定較優的空苞山核桃識別模型,為空苞山核桃的快速、無損識別提供方法與技術支持。

1 材料與方法

1.1 試驗材料

山核桃樣本采購于杭州臨安,隨機選擇大小均勻、外觀正常的469 個山核桃作為試驗樣本,依次標號并保存于4~6 ℃冷庫中直到試驗使用。光譜采集前,將山核桃樣本從冷庫中取出并在室溫環境中放置12 h,以保證山核桃溫度與室溫一致。光譜采集完成后,將全部山核桃樣本進行手工破殼,破殼后的山核桃殼和山核桃仁分別置于A4 打印紙上觀察是否存在空苞,將空苞山核桃樣本記為類別A,正常山核桃樣本記為類別B。

樣本劃分的方法有隨機抽樣法、kennardstone 法、光譜-理化值共生距離法等[19]。本試驗采用kennard-stone 分類法對469 個山核桃樣本按照2∶1 劃分為校正集和預測集,校正集有30 個空苞山核桃樣本和277 個正常山核桃樣本,用于建立分類模型;預測集有18 個空苞山核桃樣本和144 個正常山核桃樣本,用于驗證分類模型。

1.2 儀器與設備

AvaSpec-HS1024×122TEC 型微型光纖光譜儀,荷蘭Avantes 公司;FC-UV600-2-ME 型光纖,荷蘭Avantes 公司;FA2004 電子分析天平,上海舜宇恒平科學儀器有限公司;游標卡尺,德國美耐特公司。

1.3 光譜采集

試驗采用兩種近紅外光譜檢測裝置采集山核桃樣本的光譜,兩種檢測裝置的原理示意圖如圖1 所示。檢測裝置1 中,2 盞鹵素燈分別位于山核桃樣本的兩側,三者中心位于同一水平線,光源總功率為300 W。檢測裝置2 中,4 盞鹵素燈間隔90℃環繞于山核桃樣本四周,五者中心處于同一水平面,光源總功率為600 W。

圖1 山核桃近紅外光譜檢測裝置示意圖Fig. 1 Schematic diagram of Carya cathayensis near-infrared spectroscopy detection device

光譜采集前,將山核桃樣本從冷庫中取出放置在通風干燥處12 h,使樣品的溫濕度與實驗室環境保持一致,以減少試驗誤差。此外,為保證所測光譜的穩定性,近紅外光譜儀需要預熱30 min。本研究采用2 種山核桃近紅外光譜檢測裝置以漫透射方式采集山核桃樣本的光譜,并以直徑30 mm 的聚四氟乙烯球作為參比。在檢測裝置1中,將山核桃頂端和底部與光源垂直放置,采集1次光譜記為位置1,順時針旋轉90°再采集1 次光譜記為位置2,然后將山核桃頂端和底部與光源平行放置,采集1 次光譜記為位置3,取3 次光譜平均值作為山核桃樣本的近紅外光譜。在檢測裝置2 中,將山核桃頂端和底部與光源呈45°放置,采集1 次光譜記為位置1’,順時針旋轉90°再采集1 次光譜記為位置2’,取2 次光譜平均值作為山核桃樣本的近紅外光譜。對整個帶殼山核桃樣本的近紅外光譜采集,檢測裝置1 積分時間為80 ms,檢測裝置2 積分時間為50 ms,掃描次數和平滑點數均為1 次和1。

1.4 光譜預處理及特征波長選擇

光譜預處理可以消除或降低由光譜儀器、采集環境等因素造成的光譜噪聲、基線漂移等影響。預處理方法中,SG 平滑(Savitzky-golay smoothing)是消除光譜噪聲的一種最常用的方法[20];導數(Derivative)可以用來校正光譜的基線偏移和漂移,消除基線和其它背景的干擾[21];多元散射校正(Multiplicative scatter correction,MSC)可以有效消除樣品光譜中由光散射引起的干擾[22];標準正態變量變換(Standard normal variate transformation,SNV)可以用來消除光程變化、顆粒大小及其散射產生的干擾[23];歸一化(Normalize)是將數據按比例縮放以減少分布差異、特征、規模等的影響[24];去趨勢(Detrend)可減少光譜數據采集過程中產生的偏移影響[25];基線校正是一種用來減少偏差的方法[26]。本研究采用上述8 種方法對光譜進行預處理,以盡可能消除光譜噪聲。

由于近紅外光譜數據的變量數目繁多,會存在較多的冗余和無用信息,需要進行特征波長選擇,以獲取有用信息變量,減少建模時間,提升模型的穩定性。本研究采用CARS 方法[27]篩選空苞山核桃的特征波長,以剔除與空苞山核桃無關的信息變量,簡化山核桃空苞的識別模型,并提高模型的穩定性和精度。在CARS 變量選擇過程中,蒙特卡羅采樣次數為50,采用PLS 交叉驗證建模,并根據最低錯分率確定最優變量子集。

1.5 識別模型建立與評價

LDA 是一種常用的模式識別方法,其基本原理是將高維光譜數據投射到低維的向量空間,以實現光譜數據壓縮,并使同類樣本投影點接近[28]。二次判別分析(Quadratic discriminant analysis,QDA)和線性判別分析均基于貝葉斯規則,區別在于線性判別分析假設每一種分類的協方差矩陣相同,而二次判別分析中每一種分類的協方差矩陣不同。馬氏距離判別分析(Mahalanobis distance discriminant analysis,MDA)使用馬氏距離作為相似性度量。本研究采用上述3 種判別分析方法建立空苞與正常山核桃的分類模型,分類模型性能由敏感性、特異性以及總正確率指標進行評價。模型性能評價指標定義如式(1)~(3)。

式中,TP——真陽性,表示空苞山核桃被正確判別為空苞山核桃;FN——假陰性,表示空苞山核桃被錯誤判別為正常山核桃;TN——真陰性,表示正常山核桃被正確判別為正常山核桃;FP——假陽性,表示正常山核桃被錯誤判別為空苞山核桃。

2 結果與分析

2.1 山核桃的物理參數及近紅外光譜分析

469 個山核桃樣本的物理參數如表1 所示。由表1 可知,根據GB/T 24307-2009《山核桃產品質量等級》,試驗所用的山核桃樣本的質量、直徑等參數均在合理范圍內,具有一定的代表性。

表1 山核桃物理參數Table 1 Carya cathayensis physical parameters

從本質來說,可以采用近紅外光譜分析技術對正常和空苞山核桃進行分類是由于兩類山核桃內部組成成分存在差異,其差異體現在近紅外光譜信息中,通過對近紅外光譜信息的處理從而實現對兩者分類。圖2 是200~1 160 nm 波長范圍2種檢測裝置采集的山核桃原始光譜。由圖2 可知,山核桃近紅外光譜在200~520 nm 波長范圍的噪聲比較大,因此選用530~1 100 nm 波長范圍的山核桃近紅外光譜用來分析。山核桃樣本的近紅外光譜在800~1 000 nm 波長范圍存在明顯的波峰和波谷,其中光譜波峰分別位于930 nm 和1 000 nm 處,光譜波谷分別位于880 nm 和959 nm 左右處;在530~800 nm 波長范圍存在較為微弱的波峰,分別位于590 nm 及780 nm 左右處。從圖2 中還能看出,正常山核桃的吸光度雖普遍高于空苞山核桃,但兩者光譜相互重疊,很難直接從形態上加以區分。因此,需要采用化學計量學方法進行分析處理,以提取有用的光譜差異信息,建立山核桃空苞的分類模型。此外,檢測裝置1 與檢測裝置2的山核桃近紅外光譜相比,采用檢測裝置2 采集的近紅外光譜吸光度值比檢測裝置1 的略高。

圖2 200~1 100 nm 波長范圍的山核桃近紅外光譜Fig. 2 Near-infrared spectra of Carya cathayensis in the wave length range of 200-1 100 nm

2.2 主成分分析

對山核桃原始光譜信息進行主成分分析,其結果如表2 所示。山核桃光譜的第1,2,3,4 主成分方差貢獻率分別為84.08%,12.21%,2.65%,0.87%,累計貢獻率可達99.82%,可以代表山核桃的原有光譜信息。

表2 山核桃光譜的主成分貢獻率Table 2 Principal component contribution rates of Carya cathayensis spectra

第1 主成分和第2 主成分的方差貢獻率達到96.30%,遠大于其它主成分,主成分分析不僅可以進行數據降維,同樣也能對兩類樣本間的差距進行初步分析。因此,以第1 主成分和第2 主成分為變量繪制散點分布圖,結果如圖3 所示。

圖3 第1 和第2 主成分散點分布圖Fig. 3 1st and 2nd principal component scatter plots

由圖3 可以看出,正常山核桃和空苞山核桃的主成分散點分布聚集在一起,沒有明顯的簇擁現象,說明兩者之間的主成分散點分布沒有明顯的差異。用前2 個主成分不能對正常和空苞山核桃進行正確的分類,因此需要采用模式識別方法對山核桃光譜作進一步分析。

2.3 分類模型建立

2.3.1 全波長分類模型 對山核桃樣本光譜,采用歸一化等8 種方法進行光譜預處理,然后應用LDA、QDA 和MDA3 種方法建立空苞和正常山核桃的分類模型建,并利用預測集樣本對分類模型精度進行驗證,其結果如表3 和表4 所示。經MSC預處理后的山核桃近紅外光譜如圖4 所示。

表3 不同預處理和建模方法下山核桃空苞的分類模型結果(檢測裝置1)Table 3 Classification model results of Carya cathayensis with empty bud under different preprocessing and modeling methods(Detection device 1)

表4 不同預處理和建模方法下山核桃空苞的分類模型結果(檢測裝置2)Table 4 Classification model results of Carya cathayensis with empty bud under different preprocessing and modeling methods(Detection device 2)

圖4 MSC 預處理后530~1100 nm 波長范圍的山核桃近紅外光譜Fig. 4 Near-infrared spectra of Carya cathayensis after MSC pretreatment in wave length range of 530-1 100 nm

從表3 和表4 可以看出,相較于原始光譜建立的模型,經歸一化、一階導數、標準正態變量和多元散射校正預處理后的光譜建立的模型能提高對空苞山核桃的識別率,而對正常山核桃的識別率略微降低;經SG 平滑和二階導數預處理后的光譜建立的模型對空苞和正常山核桃的識別率都降低;經去趨勢和基線校正預處理后的光譜建立的模型對空苞山核桃和正常山核桃的識別結果影響不明顯;經過MSC 處理后的光譜建立的模型對空苞和正常山核桃的識別率都大幅上升,3 種建模方法所建立的分類模型性能均為最優,其模型的敏感性、特異性和總正確率均為1。3 種建模方法相比而言,對空苞山核桃識別結果最佳的是MDA模型,QDA 模型次之;對正常山核桃識別結果最佳的是LDA 模型,QDA 模型次之。對兩種光譜檢測裝置而言,使用檢測裝置1 的光譜建立的3 種模型精度都高于檢測裝置2。

為了探究MSC 處理對建立的分類模型精度的影響,將經MSC 處理后的光譜進行可視化,兩種檢測裝置經MSC 處理后的光譜如圖4 所示。從圖4 中可以看出,相較于原始光譜,經MSC 處理后的兩種山核桃的光譜曲線更加集中于同種類別,空苞山核桃吸光度值在900~1 000 nm 波長范圍內低于正常山核桃,可以基本區分兩者。由此可見,MSC 預處理能夠有效消除散射的影響,使光譜中與空苞變化相關的有用信息凸顯出來。因此,經MSC 方法預處理后所建立的山核桃空苞分類模型的性能較優。

2.3.2 基于特征波長的分類模型 特征波長的選取可以有效減少無關變量的數目,從而起到減少變量數、提高模型精度的作用。對于全波長建模結果,由于檢測裝置1 中建立的山核桃分類模型優于檢測裝置2,因此采用CARS 方法僅對檢測裝置1 中的光譜數據進行特征波長選擇。圖5 為經MSC 預處理后的山核桃光譜的CARS 變量篩選結果。由圖5a 可知,在1~5 次MC 采樣過程中,被選擇的山核桃空苞的波長變量數快速下降;在5~25次MC 采樣過程中,被選擇的波長變量數緩慢下降,對應山核桃空苞特征波長變量的粗選與精選兩個過程。圖5b 為山核桃空苞分類模型的錯分率隨采樣次數的變化情況。在26 次MC 采樣時,分類模型的錯誤率最小,此時選取的特征波長建模效果最佳。圖5c 為MC 采樣過程中山核桃光譜各波長變量的回歸系數變化情況,“*”對應的位置為分類模型錯分率最低的MC 采樣次數。最終,共獲得34 個山核桃空苞的特征波長變量。對于原始光譜及其它預處理光譜,利用CARS 方法在相同參數下進行變量篩選,分別獲得27,13,27,27,48,54,43和24個特征波長變量。

圖5 MSC 預處理后光譜的CARS 變量篩選過程Fig. 5 CARS variable screening process of spectra after MSC preprocessing

經CARS 變量篩選后,采用LDA、QDA 和MDA 方法分別建立空苞和正常山核桃的分類模型,其結果見表5。相比于全波長分類模型,采用CARS 篩選的特征波長建立的分類模型的變量數和計算時間大大減少,各種分類模型的敏感性基本不變,特異性略有降低,總正確率基本持平。由此可見,CARS 方法可以較為有效地篩選出空苞山核桃的特征波長變量。與全波長分類模型結果類 似,MSC-CARS-LDA、MSC-CARS-MDA 和MSC-CARS-QDA 模型的識別結果最優,其特異性、敏感性和正確率均為1,說明可以很好地識別兩類山核桃。

表5 基于CARS 特征波長的山核桃空苞的分類模型結果(檢測裝置1)Table 5 Classification model results of Carya cathayensis with empty bud based on CARS sensitive wavelengths(Detection device 1)

3 結論

本研究利用近紅外光譜分析技術和模式識別方法對空苞山核桃進行快速無損識別。采用兩種近紅外檢測裝置采集山核桃的光譜,比較了8 種不同預處理方法及CARS 變量篩選后所建立的LDA、QDA 和MDA 分類模型的性能。結果表明,檢測裝置1 的空苞山核桃分類模型性能優于檢測裝置2 的分類模型,MSC 為較優的預處理方法,建立的山核桃空苞分類模型的性能最優,LDA、QDA和MDA 模型的特異性、敏感性和正確率均為100%。經CARS 特征波長篩選后,建模所用變量數大幅減少,分類模型得到有效簡化,而精度與全波長模型持平。本文為空苞山核桃的快速無損識別提供一種可行的方法,也為其它堅果類的內部缺陷識別研究提供新思路。

猜你喜歡
山核桃波長預處理
HPLC-PDA雙波長法同時測定四季草片中沒食子酸和槲皮苷的含量
山核桃
基于預處理MUSIC算法的分布式陣列DOA估計
雙波長激光治療慢性牙周炎的療效觀察
日本研發出可完全覆蓋可見光波長的LED光源
淺談PLC在預處理生產線自動化改造中的應用
絡合萃取法預處理H酸廢水
山核桃
便攜式多用途光波波長測量儀
基于自適應預處理的改進CPF-GMRES算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合