?

基于高光譜成像技術的烤煙上部煙葉成熟度光譜特征分析及判別模型構建應用研究

2024-03-26 08:07鄧建強王大彬乾艷尹忠春彭五星李富強任曉紅
中國煙草學報 2024年1期
關鍵詞:成熟度波段煙葉

鄧建強,王大彬,乾艷,尹忠春,彭五星,李富強,任曉紅*

基于高光譜成像技術的烤煙上部煙葉成熟度光譜特征分析及判別模型構建應用研究

鄧建強1,王大彬2,乾艷1,尹忠春1,彭五星1,李富強1,任曉紅1*

1 湖北省煙草公司恩施州公司,湖北 恩施 445000;2 中國農業科學院煙草研究所,農業農村部煙草質量安全風險評估實驗室 青島 266101

【目的】研究不同成熟度上部煙葉的高光譜特征及智能化判別的可行性?!痉椒ā窟\用便攜式高光譜儀采集3種成熟度(尚熟(SS)、成熟(CS)、過熟(GS))上部煙葉的高光譜圖像并提取光譜數據。運用相關性分析、主成分分析以及方差分析等方法分析光譜特征并構建5種模型(支持向量機(SVM)、K近鄰(KNN)、隨機森林(RF)、LightGBM和XGBoost)用于成熟度判別評價?!窘Y果】(1)可見光(400~720 nm)與近紅外(750~1000 nm)內部各波段之間相關性較強,而兩個區域之間相關性較弱;(2)5個特征值大于1的主成分(PC1~PC5)幾乎包含了所有的光譜信息,且主成分方差分析結果表明不同成熟度上部煙葉的光譜反射特征在可見光、紅邊以及部分近紅外區域(950~1000 nm)統計學差異顯著;(3)5種模型中SVM性能最優,2021年度樣品的判別精確率、召回率和F1分數均在0.95以上,而2022年度以及2021+2022年度樣品分別在0.93和0.92以上?!窘Y論】上部煙葉高光譜存在多重共線性,具有很好的降維效果,且不同成熟度的光譜反射特征存在顯著差異。SVM判別性能在不同年度間具有很好的穩定性,可用于上部煙葉成熟度判別。

便攜式高光譜儀;上部煙葉;成熟度;光譜特征;模型構建及應用

煙葉采收成熟度對烤后煙葉品質有重要影響[1-2]??緹熒喜繜熑~占整株煙葉總產量的30%~40%,優質上部煙葉具有煙氣濃度高、香氣量足等特點,是高檔卷煙的重要原料來源[3]。上部煙葉在成熟過程中發生一系列復雜的生理生化反應,導致其煙葉內含物質組成發生變化,進而影響上部煙葉品質[4],因此研究上部煙葉成熟過程中代謝物變化規律對于指導上部煙成熟采收具有重要意義[5-7]。然而,上述研究采用的生理生化指標檢測方法,存在經濟成本高、時間周期長等問題,無法在生產中大范圍推廣。目前技術人員主要通過葉片顏色、葉脈特征、莖葉夾角等外觀特征進行成熟度判斷,但此過程依賴于主觀經驗,對從業人員的經驗積累有一定要求,且個體之間主觀感受存在差異。因此發展一種快速檢測技術用于指導煙葉成熟采摘具有重要現實意義。

高光譜成像技術是一種三維檢測技術,通過對目標物進行二維平面掃描可以給出每一個像素單元完整的光譜反射曲線,具有光譜波段多、分辨率高、圖譜合一等特點[8]。高光譜既能反映目標物的外觀特征,又能探測內部的化學成分信息,目前在農產品品質檢測方面已有相關研究報道[9-11],而成熟度是其中一個重要研究領域,如小白杏[12]、油茶果[13]以及玉米種子[14]等。在煙草領域,目前有關高光譜成像技術的研究亦有相關報道。李智慧等[15]利用高光譜成像技術和機器學習方法對煙葉中的非煙物質進行分類識別,訓練集和測試集正確率分別為99.82%和99.47%。張慧等[16]基于高光譜和紋理融合的方法實現了烤煙的有效無損分類。張龍等[17]基于高光譜成像技術實現了煙葉和雜物的分類,總體分類精度達到99.92%。在煙葉成熟度研究方面,李鑫等[18]基于高光譜成像技術構建了中部煙葉成熟度的判別模型,并取得了理想效果,但缺少對不同成熟度煙葉光譜特征的深入分析。因此本研究擬基于高光譜成像技術探究不同成熟度上部煙葉的光譜特征,在此基礎上構建不同模型用于上部煙葉成熟度判別,最終為上部煙葉成熟度智能化檢測技術開發提供啟示和借鑒。

1 材料與方法

1.1 試驗材料

試驗于2021—2022年在湖北省恩施州宣恩縣椒園煙葉種植區(E 29.9751°,N 109.3915°,海拔1050 m)進行,供試品種為云煙80,土壤類型為山地黃棕壤,煙田土壤的基礎理化性質如下:土壤pH 6.20,全氮1.85 g/kg,有機質27.65 g/kg,堿解氮149.36 mg/kg,速效磷30.08 mg/kg,速效鉀224.96 mg/kg。

1.2 設備與儀器

高光譜成像系統(北京易科泰生態技術有限公司)包括:便攜式高光譜儀(Specim IQ,空間分辨率為512×512像素,光譜分辨率7 nm,波段數204)、鹵素燈光源、三腳架、校正白板、黑色幕布等。

1.3 高光譜圖像采集

從7月下旬煙草成熟期開始,每隔7 d左右由專業技術人員采摘代表尚熟(SS)、成熟(CS)和過熟(GS)的上部煙葉樣品進行高光譜圖像掃描(曝光時間大約為220 ms)。2021年度共采集樣品91份,其中SS樣品30份、CS樣品30份、GS樣品31份。2022年度共采集樣品184份,其中SS樣品62份、CS樣品61份、GS樣品61份。

1.4 數據預處理

由于圖像中的每個像素點包含一條光譜曲線,利用ENVI軟件將整個葉片作為感興趣區域(Region of Interest, ROI),將ROI中所有像素點的光譜反射率的平均值作為該片煙葉的光譜反射數據,最終得到代表不同成熟度所有煙葉樣品的高光譜數據。圖1展示了2021年度3個成熟度所有上部煙葉樣品的高光譜反射曲線。

注:(a)SS、(b)CS以及(c)GS。

Note : (a) SS, (b) CS and (c) GS.

圖1 2021年度烤煙上部煙葉所有樣品的高光譜反射曲線

Fig. 1 Hyperspectral reflection curve of upper tobacco leaf samples in 2021

1.5 模型介紹及評價

1.5.1 數據集劃分

首先將不同成熟度的上部煙葉樣品按照7:3的比例隨機劃分為訓練集和測試集,且彼此之間樣品不重疊。其中,訓練集用于模型構建,并且在模型訓練過程中采用了5折交叉驗證的方法,測試集用于評價模型的泛化性能。

1.5.2 算法介紹

本研究采用支持向量機(SVM)、K近鄰(KNN)、隨機森林(RF)、LightGBM和XGBoost等算法對不同成熟度上部煙葉樣品數據集進行建模。SVM是一種對數據進行二元分類的廣義線性分類器,其決策函數由少數的支持向量確定,是一個具有稀疏性和穩健性的分類器,通過引入核函數可實現非線性分類。KNN是數據挖掘分類中最簡單的方法之一,其核心思想是如果一個樣本在特征空間中的K個最相鄰樣本大多屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別中樣本的特性。RF是Breiman等提出的一種基于決策樹的集成算法,對數據噪聲容忍度好,具有人工干預少、運算速度快等優點。LightGBM是一個實現GBDT算法的框架,支持高效率的并行訓練,并且具有更快的訓練速度、更低的內存消耗、更好的準確率,支持分布式可以快速處理海量數據等優點。XGBoost是基于Boosting框架的一個算法工具包,可以用于并行計算效率、缺失值處理以及預測性能等方面。

1.5.3 模型評價指標

1.5.3.1 混淆矩陣

表1為混淆矩陣,包括真正例(True Positive,TP)、假正例(False Positive,FP)、假反例(False Negative,FN)和真反例(True Negative,TN)4種情況。根據測試集中每個樣品預測的正確與否,把整個測試集的全部數據,分別放到這4個格子的相應位置。

表1 混淆矩陣表現形式

1.5.3.2 準確率(Accuracy)

準確率表示分類正確的樣本占總樣本的比例,公式(1):

1.5.3.3 精確率(Precision)

精確率又叫查準率,表示預測結果為正例的樣本中實際為正樣本的比例,公式(2):

1.5.3.4 召回率(Recall)

召回率又被稱為查全率,表示預測結果為正例的樣本中實際正例數量占全樣本中正例樣本的比例,公式(3):

1.5.3.5 F1分數

F1分數是綜合了精確率和召回率的一個判斷指標,F1分數取值范圍為0到1,1是最好,0是最差,F1分數越高,說明模型越穩健,公式(4):

1.6 數據分析軟件

本研究使用ENVI軟件提取煙葉樣品的高光譜數據,使用 R語言進行高光譜數據的特征分析,使用Python進行判別模型構建。

2 結果

2.1 不同成熟度上部煙葉高光譜特征分析

2.1.1 不同成熟度上部煙葉高光譜反射特征

圖2展示了上部煙葉成熟過程中高光譜反射曲線的變化??傮w上,上部葉片的高光譜曲線呈現典型的綠色植物光譜特征,即在400~500 nm和600~700 nm之間形成吸收波谷,在550 nm處形成反射峰,在680 nm附近反射率急劇上升,進入近紅外區域后逐漸達到平臺,反射率大約在0.7左右,在680~750 nm之間反射率急劇上升的區域就是所謂的“紅邊”。上部煙葉的光譜反射率在可見光區域差異顯著且隨成熟度增加而上升(GS>CS>SS);在紅邊位置,上部煙葉的光譜反射率隨成熟度同樣呈上升趨勢;在近紅外區域不同成熟度高光譜反射曲線視覺上差異不明顯。值得注意的是,在950 nm附近,所有葉片都有一個明顯的吸收峰,這是由葉片中水分子吸收導致的[8]。

圖2 三個成熟度烤煙上部煙葉的平均光譜曲線

2.1.2 不同成熟度上部煙葉高光譜相關性分析

圖3繪制了不同成熟度上部煙葉高光譜的相關性。如圖3所示,400~720 nm波段之間存在正相關性,750~1000 nm波段之間同樣具有正相關性,而400~720 nm與750~1000 nm兩個區域之間相關性較弱,甚至某些波段間呈現負相關。

注:藍色代表正相關,紅色代表負相關,顏色越深表示相關性越強,反之相關性越弱。

Note: Blue represents positive correlation, red represents negative correlation. The darker the color, the stronger the correlation, and vice versa, the weaker the correlation.

圖3 不同成熟度上部煙葉高光譜各波段間的相關性矩陣

Fig. 3 Correlation matrix among various bands of hyperspectral data for upper tobacco leaves at different maturity levels

2.1.3 不同成熟度上部煙葉高光譜主成分分析及其方差分析

為探究不同成熟度上部煙葉高光譜特征差異,需對高光譜波段進行比較分析,然而高光譜波段數量多,對其全部波長進行差異性分析工作量十分龐大,若僅分析比較少數波段則缺乏代表性,因此對其降維處理減少變量個數是進行差異分析的必要條件。相關性分析結果表明不同成熟度上部煙葉各波段之間存在較高的相關性,因此它們的光譜數據特別適合利用主成分分析進行降維處理。表2列出了上部煙葉高光譜數據主成分特征值及其貢獻率,共提取得到5個特征值大于1的主成分,它們的方差累積貢獻率達到0.99,表明以上5個主成分能夠全面地反映烤煙上部葉片的光譜信息。

表2 烤煙上部煙葉高光譜主成分特征值及貢獻率

各主成分在400~1000 nm波段上的載荷系數如圖4a所示。其中 PC1在400~740 nm附近具有較高的載荷系數,PC2在740~1000 nm范圍內載荷系數較高,PC3在980 nm附近載荷系數達到最大值,約為0.4,在其它波段上載荷系數較小,PC4在400 nm時載荷系數約為0.5,此后隨著波長增加,載荷系數相對較低,PC5的載荷系數在680~750 nm之間存在一個明顯的峰值,最大值在0.3左右,在其它波段上載荷系數較低。載荷系數越大意味著各主成分包含該波段上的光譜信息越多,因此PC1主要包括絕大部分可見光信息、部分紅邊信息,PC2主要包含絕大部分近紅外信息、部分紅邊信息,PC3主要包含950~1000 nm范圍內部分近紅外信息,PC4主要包含部分紫色光(400~430 nm)信息,PC5主要包含部分紅邊信息。

在此基礎上,本研究進一步分析比較了不同成熟度烤煙上部葉5個主成分的差異性(圖4b~4f)。對于PC1,3個成熟度得分平均值排序為GS>CS>SS,且三者之間存在統計學極顯著差異(<0.01)。對于PC2,3個成熟度得分均值排序為CS>SS>GS,且三者之間統計學差異不顯著(>0.05)。對于PC3,3個成熟度得分均值排序為GS>CS>SS,其中SS極顯著低于CS和GS(<0.01),而CS和GS之間差異不明顯(>0.05)。對于PC4,3個成熟度得分均值排序為GS>CS>SS,且SS同樣極顯著低于CS和GS(<0.01),而CS和GS之間差異不明顯(>0.05)。對于PC5,3個成熟度得分均值排序為GS>CS>SS,且三者之間差異極顯著(<0.01)。

注:abc代表差異顯著(<0.05),ABC代表差異極顯著(<0.01)。

Note: abc represents significant difference (<0.05), ABC represents extremely significant difference (<0.01).

圖4 不同成熟度上部煙葉各主成分載荷系數變化曲線(a)以及各主成分箱線圖和方差分析結果(b~f)

Fig. 4 Curves of loading coefficients of principal components derived from upper tobacco leaves at different maturity levels (a) and boxplots and variance analysis of principal components (b-f)

2.2 模型構建及應用

2.2.1 5種模型優化評價

將2021年度訓練集中上部煙葉的高光譜數據輸入到SVM、RF、KNN、LightGBM和XGBoost 5種模型中,使用網格搜索并采用5折交叉驗證的方法得到各個模型的最優超參數組合(表3)。

表3 5種模型的最優超參數組合

續表3

方法Methods超參數Hyperparameters搜索空間Search Space KNNn_neighbors7 p3 weightsdistance LightGBMlearning_rate0.01 max_depth-1 min_child_samples2 num_leaves3 reg_alpha0 XGBoosteta0.01 eval_metricmlogloss max_depth1 gamma0.0001

將以上具有最優超參數組合的5種模型應用到2021年度測試集中上部煙葉成熟度判別,通過分析比較各項性能指標,進而確定最優模型(圖5)。如圖5a所示,SVM的判別準確率最高,達到95%以上,其余4種模型的判別準確率相同,均在90%以上。5種模型對測試集樣品判別的混淆矩陣結果如圖5b~5f所示,在SVM中有一個SS樣品被誤判為CS,而其它4個模型中有兩個SS樣品被誤判為CS。

注:a,模型準確率;b,SVM;c,RF;d,KNN;e,LightGBM;f,XGBoost。

Note: a, accuracy of models; b, SVM; c, RF; d, KNN; e, LightGBM; f, XGBoost.

圖5 5種模型判別測試集上部煙葉成熟度的準確率以及混淆矩陣結果

Fig. 5 Accuracy of the five models in classifying the maturity of upper tobacco leaves from test set and the results of confusion matrix

基于混淆矩陣的結果,本研究計算了5種模型對不同成熟度上部煙葉判別的精確率、召回率以及F1分數等指標(表4)。對于SS樣品,5種模型的精確率均為100%,SVM的召回率(89%)和F1分數(94%)最高,其它4種模型相同(78%、88%);對于CS樣品,SVM的精確率(86%)和F1分數(92%)最高,5種模型的召回率均為100%;對于GS樣品,5種模型的精確率、召回率和F1分數均為100%。由此可見,SVM對SS和CS樣品的判別性能優于其它4種模型,5種模型對GS樣品的判別性能一致。5種模型對所有成熟度上部煙葉判別的精確率、召回率以及F1分數的結果如圖6所示,SVM的精確率、召回率以及F1分數均大于0.95,優于其它4種模型,因此選擇SVM作為上部煙葉成熟度的最優判別模型。

表4 5種模型判別上部煙葉成熟度的精確率、召回率以及F1分數

圖6 5種模型判別上部煙葉成熟度的精確率、召回率以及F1分數的平均值

2.2.2 SVM模型應用驗證

為驗證SVM模型對不同年度間上部煙葉成熟度判別應用的穩定性,本研究利用2022年度以及2021+2022年度上部煙葉樣品的訓練集對SVM模型進行重新訓練構建,然后利用測試集進行應用驗證(圖7)。對于2022年度上部煙葉(圖7a),SS樣品中有1個被誤判為CS,CS樣品中有1個被誤判為SS,GS樣品中有2個被誤判為CS;對于2021+2022年度樣品(圖7b),SS中有3個樣品被誤判為CS,CS中有1個被誤判為SS,GS中有3個被誤判為CS。

注:a,2022年度樣品;b,2021+2022年度樣品。

Note: a, Samples from 2022; b, Samples from 2021+2022.

圖7 SVM判別不同年度上部煙葉成熟度的混淆矩陣結果

Fig.7 Confusion matrix results of SVM in classifying the maturity of upper tobacco leaves across different years

基于混淆矩陣結果,本研究分別計算了SVM對2021和2021+2022年度上部煙葉成熟度判別的精確率、召回率和F1分數(表5)。對于2022年度,SS、CS和GS樣品的精確率為94%、86%和100%,召回率為94%、95%和91%,F1分數為94%、90%和95%,3項指標在所有成熟度上的平均值均為93%。對于2021+2022年度,SS、CS和GS樣品的精確率為97%、82%和100%,召回率為90%、97%和90%,F1分數為93%、89%和95%,3項指標的平均值分別為93%、92%和92%。

表5 SVM判別不同年度上部煙葉成熟度的精確率、召回率和F1分數

3 討論

綠色植物的高光譜反射特性是由內部組織結構形態和化學成分決定的。在可見光范圍內,色素是影響植物光譜吸收的主要因素,其中葉綠素所起的作用最大,此外葉紅素和葉黃素以及花青苷在可見光波段也有吸收[8]。當植物開始成熟衰老時,葉片中色素含量降低,進而導致葉片的高光譜反射特性發生變化[8]。在近紅外波段,植被的光譜反射特性主要受植物葉片內部構造以及-C-H、-N-H和-O-H等化學基團的影 響[8]。在可見光與近紅外之間,反射率急劇上升,形成所謂“紅邊”,這是綠色植物高光譜反射曲線最為明顯的特征[8]。在本研究中,烤煙上部煙葉成熟過程中葉綠素等色素含量逐漸減少導致了可見光區域的光譜反射率逐漸上升,這與李鑫等[18]的研究結果一致,而在近紅外區域,葉片成熟過程中內部構造以及化學基團的變化對上部煙葉的光譜反射率影響較小。相關性分析表明,上部煙葉在可見光和近紅外兩個區域之間的高光譜波段相關性較弱,說明兩個區域之間相對獨立,內在關聯性較小,而兩個區域內部各自波段之間相關性較強,內在關聯性強,具有很好的降維潛能。

主成分分析共提取得到5個主成分,它們的累積方差貢獻率達到0.99,表明上部煙葉高光譜的204個波段可被壓縮為5個主成分變量,極大簡化了數據的復雜程度,同時也進一步說明上部煙葉高光譜存在嚴重多重共線性。對于不同成熟度上部煙葉高光譜特征的差異性,根據各主成分的載荷系數以及方差分析結果可知,總體上不同成熟度上部煙葉在可見光區域具有顯著性差異,而在近紅外區域差異不明顯。950~1000 nm近紅外區域內包含葉片含水量信息,根據PC3方差分析結果可推知上部煙葉水分含量隨成熟度增加而降低[19],且SS水分含量與CS、GS存在極顯著差異,而CS和GS之間差異不明顯。在400~430 nm紫色光區域,SS與CS、GS的光譜反射率差異極顯著,而CS和GS之間反射率差異不顯著。在紅邊位置,不同成熟度上部煙葉差異同樣顯著。以上結果表明不同成熟度上部煙葉的高光譜反射特征存在明顯差異,這為判別模型構建奠定了理論基礎。

以上5種模型中SVM具有最優判別性能,與李鑫等[18]研究結果一致,可能原因是煙葉成熟是一個漸進演化的過程,成熟度判別實質上是在兩個相鄰類別之間找到一個合適的臨界狀態,而SVM分類原理同樣是在兩個類別之間找到一個最優超平面,因此SVM的工作原理特別適用于煙葉成熟度判別。對于其它4種模型,KNN算法是基于距離度量的依據K個最近鄰樣本屬性進行分類的算法,RF是基于集成學習的思想將多棵決策樹進行集成的算法,根據每棵決策樹的結果取其平均值實現分類,而LightGBM和XGBoost是基于GBDT思想框架下的兩種不同算法,以上4種模型無法在兩個成熟度類別之間找到一個臨界狀態,因而可能影響了判別性能[20]。此外,本研究進一步考察驗證了SVM模型對不同年度間上部煙葉成熟度判別性能的穩定性,2022年度以及2021+2022年度上部煙葉判別的精確率、召回率和F1分數的平均值均在92%以上,與2021年度的判別結果近乎一致,表明SVM模型可用于不同年度間上部煙葉成熟度判別。此外,SVM對CS樣品的判別性能弱于SS和GS,原因可能是CS分別與SS、GS之間存在臨界狀態增加了SVM尋找最優超平面時的難度,使得SVM在判別CS與SS以及CS與GS時可能會發生誤判,從而增加了CS誤判的概率。

4 結論

本研究基于高光譜成像技術探究了不同成熟度烤煙上部葉的光譜特征并構建了成熟度判別模型。不同成熟度上部煙葉高光譜波段存在多重共線性,且光譜反射特征在可見光、紅邊以及部分近紅外區域(950~1000 nm)差異顯著。5種判別模型中SVM性能最優且在不同年度間具有很好的穩定性,可用于煙葉生產中成熟度判別。本研究為將來煙葉成熟度智能化判別提供了理論和技術支持。

[1] 左天覺. 煙草的生產、生理和生物化學[M]. 上海:上海遠東出版社,1993.

ZUO Tianjue. Production, physiology, and biochemistry of tobacco plant[M]. Shanghai: Shanghai Far East Publishers,1993.

[2] 宮長榮. 煙草調制學[M]. 北京:中國農業出版社,2003.

GONG Changrong. Tobacco curing[M]. Beijing: China Agriculture Press, 2003.

[3] 朱尊權. 提高上部煙葉可用性是促“卷煙上水平”的重要措施[J]. 煙草科技,2010(6): 5–9, 31.

ZHU Zunquan. Improving usability of upper leaves, an important measure for accelerating up-grading cigarette quality[J]. Tobacco Science & Technology, 2010(6): 5–9, 31.

[4] 賈中林,鄭慶霞,戴華鑫,等. 烤煙上部葉成熟過程中代謝組的差異分析[J]. 煙草科技,2023, 56(1): 1-10.

JIA Zhonglin, ZHENG Qingxia, DAI Huaxin, et al. Differential analysis of metabolome of upper flue-cured tobacco leaf during ripening process[J]. Tobacco Science & Technology, 2023, 56(1): 1-10.

[5] 賈中林,尹啟生,戴華鑫,等. 烤煙上部煙葉成熟生理特性研究進展[J]. 煙草科技,2022, 55(7): 99-112.

JIA Zhonglin, YIN Qisheng, DAI Huaxin, et al. Research progress on physiological characteristics of mature upper leaves of flue-cured tobacco[J]. Tobacco Science & Technology, 2022, 55(7): 99-112.

[6] 孫皓月,李文剛,俞世康,等. 上部葉脂質代謝與煙葉褐變的關系研究[J]. 中國煙草學報,2022, 28(04): 31-38.

SUN Haoyue, LI Wengang, YU Shikang, et al. Study on the relationship between lipid metabolism and browning of upper tobacco leaves[J]. Acta Tabacaria Sinica, 2022, 28(04): 31-38.

[7] 孫光偉,陳振國,王玉軍,等. 烤煙上部葉采收時SPAD值與鮮煙組織結構、生理指標及烤后煙葉內在質量的關系[J]. 中國煙草學報,2019, 25(05): 63-69+104.

SUN Guangwei, CHEN Zhenguo, WANG Yujun, et al. Relationships of SPAD value with tissue structure, physiological index and internal quality of flue-cured tobacco upper leaves[J]. Acta Tabacaria Sinica, 2019, 25(05): 63-69+104.

[8] 童慶禧,張兵,鄭蘭芬,等. 高光譜遙感[M]. 北京:高等教育出版社,2006.

TONG Qingxi, ZHANG Bing, ZHENG Lanfen, et al. Hyperspectral remote sensing[M]. Beijing: Higher Education Press, 2006.

[9] 吳永清,李明,張波,等. 高光譜成像技術在谷物品質檢測中的應用進展[J]. 中國糧油學報,2021, 36 (5): 165-173.

WU Yongqing, LI Ming, ZHANG Bo, et al. Application progress of hyperspectral imaging technology in grain quality inspection[J]. Journal of the Chinese Cereals and Oils Association, 2021, 36 (5): 165-173.

[10] 李江波,饒秀勤,應義斌. 農產品外部品質無損檢測中高光譜成像技術的應用研究進展[J]. 光譜學與光譜分析,2011, 31 (8): 2021-2026.

LI Jiangbo, RAO Xiuqin, YING Yibin. Research progress of hyperspectral imaging technology in nondestructive testing of agricultural products[J]. Spectroscopy and Spectral Analysis, 2011, 31 (8): 2021-2026.

[11] 何馥嫻,蒙慶華,唐柳,等. 高光譜成像技術在水果品質檢測中的研究進展[J]. 果樹學報,2021, 38 (9): 1590-1599.

HE Fuxian, MENG Qinghua, TANG Liu, et al. Research progress of hyperspectral imaging technology in fruit quality detection [J]. Journal of Fruit Science, 2021, 38 (9): 1590-1599.

[12] 劉金秀,賀小偉,羅華平,等. 基于高光譜成像技術的小白杏成熟度判別模型[J]. 食品研究與開發,2022, 43(15): 158-165.

LIU Jinxiu, HE Xiaowei, LUO Huaping, et al. Prunus Armeniaca maturity discrimination model based on hyperspectral imaging technology[J]. Food Research and Development, 2022, 43(15): 158-165.

[13] 胡逸磊,姜洪喆,周宏平,等. 高光譜成像技術檢測油茶果成熟度[J]. 食品科學,2022, 43(16): 324-331.

HU Yilei, JIANG Hongzhe, ZHOU Hongping, et al. Detection of Camellia oleifera fruit maturity by hyperspectral imaging [J]. Food Science, 2022, 43(16): 324-331.

[14] 楊小玲,由昭紅,成芳. 高光譜成像技術檢測玉米種子成熟度[J]. 光譜學與光譜分析,2016, 36(12): 4028-4033.

YANG Xiaoling, YOU Zhaohong, CHENG Fang. Detection of corn seed maturity by hyperspectral imaging [J]. Spectroscopy and Spectral Analysis, 2016, 36(12): 4028-4033.

[15] 李智慧,梅吉帆,李輝,等. 高光譜成像的非煙物質分類識別研究[J]. 中國煙草學報,2022, 28 (3): 81-88.

LI Zhihui, MEI Jifan, LI Hui, et al. Classification and identification of non-smoking substances by hyperspectral imaging [J]. Acta Tabacaria Sinica, 2022, 28 (3): 81-88.

[16] 張慧,張文偉,張永毅,等. 基于高光譜與紋理融合的烤煙分類方法研究[J]. 中國煙草學報,2022, 28 (3): 72-80.

ZHANG Hui, ZHANG Wenwei, ZHANG Yongyi, et al. Study on classification method of flue-cured tobacco based on hyperspectral and texture fusion [J]. Acta Tabacaria Sinica, 2022, 28 (3): 72-80.

[17] 張龍,馬嘯宇,王銳亮,等. 高光譜成像技術在煙葉和雜物分類中的應用[J]. 煙草科技,2020, 53 (8): 72-78.

ZHANG Long, MA Xiaoyu, WANG Ruiliang, et al. Application of hyperspectral imaging technology in classification of tobacco leaves and sundries[J]. Tobacco Science and Technology, 2020, 53 (8): 72-78.

[18] 李鑫,湯衛榮,張永輝,等. 基于高光譜成像技術的煙葉田間成熟度判別模型[J]. 煙草科技,2022, 55 (7): 17-24.

LI Xin, TANG Weirong, ZHANG Yonghui, et al. Evaluation model of tobacco field maturity based on hyperspectral imaging technology[J]. Tobacco Science and Technology, 2022, 55 (7): 17-24.

[19] 劉輝. 貴陽煙區煙葉成熟度對其質量香韻影響[D]. 北京:中國農業科學院,2020.

LIU Hui. Effect of tobacco maturity on quality and aroma note in Guiyang tobacco area[D]. Beijing: Chinese Academy of Agricultural Sciences, 2020.

[20] Degtyarev V V, Tsavdaridis K D. Buckling and ultimate load prediction models for perforated steel beams using machine learning algorithms[J]. Journal of Building Engineering, 2022, 51: 104316.

Spectral characteristics analysis and discriminating model construction of flue-cured upper tobacco leaves with different maturity based on hyperspectral imaging technology

DENG Jianqiang1, WANG Dabin2, QIAN Yan1, YIN Zhongchun1, PENG Wuxing1, LI Fuqiang1, REN Xiaohong1*

1 Enshi Tobacco Company of Hubei Province, Enshi, Hubei, 445000, China;2 Laboratory of Quality & Safety Risk Assessment for Tobacco, Ministry of Agriculture, Tobacco Research Institute of Chinese Academy of Agricultural Sciences, Qingdao, 266101, China

The purpose of this study was to investigate the hyperspectral characteristics of upper tobacco leaves at different-maturity levels and the feasibility of intelligent discrimination.In this study, a portable hyperspectral instrument was used to collect the hyperspectral imagines of upper tobacco leaves of three different-maturity levels (pre-maturity (SS), maturity (CS) and post-maturity (GS) ) and extracted their spectral data. Their spectral characteristics were studied by using correlation analysis, principal components analysis and variation analysis, and 5 models (SVM, KNN, RF, LightGBM and XGBoost) were constructed for evaluating their discriminant performances of tobacco leaf maturity.The results showed that: (1) there was a strong correlation among the bands within the visible light (400-720 nm) or the near infrared (750-1000 nm) regions, while the correlation between the two regions was weak. (2) the 5 principal components (PC1-PC5) with eigenvalues greater than 1 almost contained all the hyperspectral information. The spectral reflectance characteristics of upper tobacco leaves with different maturity levels showed significant difference in visible light, red edge and part of near infrared region (950-1000 nm). (3) Among the 5 models, SVM has the best evaluation, with precision, recall and F1 scores for the samples in 2021 above 0.95, and for the samples in 2022 and 2021+2022 above 0.93 and 0.92 respectively.The hyperspectral data of the upper tobacco leaves exhibit multicollinearity, which has excellent dimensionality reduction effects. Moreover, there are significant differences in spectral reflectance characteristics at different maturity levels. The SVM discriminant performance has good stability across different years and can be used for determining the maturity of upper tobacco leaves .

portable hyperspectral imager; upper tobacco leaf; maturity; spectral characteristics; model construction and application

. Email:370926566@qq.com

湖北省煙草公司科技項目“基于高光譜成像的中棵煙長勢長相及上部煙成熟度判別技術研究”(027Y2021-025)

鄧建強(1984—),博士,高級農藝師,主要研究方向:植煙土壤資源利用與煙葉質量提升,Email:djq1djq2@sina.com

任曉紅(1979—),農藝師,主要研究方向:煙葉栽培與質量評價,Email:370926566@qq.com

2023-02-10;

2023-08-01

鄧建強,王大彬,乾艷,等. 基于高光譜成像技術的烤煙上部煙葉成熟度光譜特征分析及判別模型構建應用研究[J]. 中國煙草學 報,2024,30(1). DENG Jianqiang, WANG Dabin, QIAN Yan, et al. Spectral characteristics analysis and discriminating model construction of flue-cured upper tobacco leaves with different maturity based on hyperspectral imaging technology[J]. Acta Tabacaria Sinica, 2024,30(1). doi:10.16472/j.chinatobacco.2023.T0014

猜你喜歡
成熟度波段煙葉
產品制造成熟度在型號批生產風險管理中的應用
整機產品成熟度模型研究與建立
關于新形勢下煙葉生產可持續發展的思考
不同成熟度野生水茄果實的種子萌發差異研究
剛好夠吃6天的香蕉
煙葉主要真菌病害的發生與防治
M87的多波段輻射過程及其能譜擬合
日常維護對L 波段雷達的重要性
一種降低造紙法再造煙葉平滑度的方法
基于SPOT影像的最佳波段組合選取研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合