?

基于特征光譜參數的葉片和冠層尺度茶多酚含量估算

2024-03-07 01:51段丹丹劉仲華趙春江
光譜學與光譜分析 2024年3期
關鍵詞:春茶鮮葉冠層

段丹丹, 劉仲華, 趙春江, 趙 鈺, 王 凡

1. 湖南農業大學園藝學院, 湖南 長沙 410128

2. 國家農業信息化工程技術研究中心, 北京 100097

3. 北京市農林科學院智能裝備技術研究中心, 北京 100097

引 言

茶鮮葉內含物質的豐富程度, 直接影響到成品茶品質的上限。 因此從源頭開始監測茶樹生長態勢, 尤其茶鮮葉中茶多酚含量, 是茶產業發展的重要環節。 影響紅茶品質的理化成分有茶多酚、 咖啡堿及氨基酸, 茶黃素、 芳香物質等在紅茶品質的評定中也發揮著重要作用[1]。 目前茶葉品質的評定只能在茶葉采摘、 加工之后進行, 存在嚴重的滯后性, 所以利用遙感數據從源頭監測茶樹不同生長時期生長態勢, 探究不同時期的茶鮮葉內含物, 對于實時指導茶業生產、 及時實施精細化和科學化的管理等具有重要意義。

關于茶葉品質量化評估的研究主要有以下2個方面: (1)實驗室理化分析量化茶葉品質[2-3]是傳統的茶品質監測方法, 時效性差且需要大量的人力物力。 (2)無損檢測技術以高效、 便捷且成本低等優勢在茶品質監測方面得到了廣泛的關注。 利用茶光譜信息為自變量, 結合不同的估測方法快速對茶多酚、 茶氨酸、 茶葉氮磷鉀、 葉綠素含量等進行了大量的測試。 Wang等[4]利用HSI與化學計量學相結合, 預測了五個栽培品種的茶葉中的P和K含量, 預測相關系數R達到0.942 3(P)和0.916 8(K)。 Lin等[5]揭示了近紅外光譜在茶葉質量評價中的主導地位, 回歸模型在茶葉的定量分析中得到了廣泛的應用, 如酚類、 黃酮類物質、 色素、 感官評價和農藥殘留, 而分類模型則有助于區分地理產地、 品種和發酵程度。 Jia等[6]基于近紅外光譜技術建立了岳州龍井茶不同品質等級的感官品質評分、 總兒茶素和咖啡因的定量預測模型, 感官評分、 總兒茶素和咖啡因的最佳預測模型為VCPA-IRIV+SVR、 VCPA-IRIV+RF和CARS+SVR, 相對百分比偏差(RPD)分別為2.485、 2.584和2.873。 Ren等[7]采用偏最小二乘(partial least squares, PLS)算法對不同地理來源的紅茶咖啡因、 水提取物、 總多酚和游離氨基酸水平的模型進行校準成功地用于快速確定紅茶的主要化學成分和地理起源。 Wang等[8]結合高光譜成像(HSI)使用變量選擇算法預測在不同氮處理水平下茶葉中的葉綠素a(Chl a), 葉綠素b(Chl b), 總葉綠素(總Chl)和類胡蘿卜素(Car)含量。 Yamashita等[9]研究發現在1 325~1 575 nm處可用于葉片氮和葉綠素(Chl)含量的無損估計。 茶葉近紅外光譜[10]、 熒光高光譜[11]、 高光譜[12]等信息已被用于不同種類茶葉品質與等級及產地的量化判別模型。 光譜監測技術在大田作物上已經得到廣泛應用, 茶葉因其結構特性以及采摘部位與大田作物有著較大區別。 目前, 基于遙感技術在茶葉內含物質方面的研究以單個生育期的葉片作為檢測對象為主, 葉片光譜特性被廣泛應用于茶葉品質監測, 但葉片尺度遙感信息將限制大區域茶品質監測研究。 茶樹主要采茶季(春茶、 夏茶、 秋茶)茶樹冠層結構以及茶葉內含物質的含量均存在較大差異, 且對冠層尺度和葉片尺度光譜響應上具有較大差異。 不同尺度光譜特征在不同生育時期茶品質監測方面仍缺乏系統、 全面的研究。

本研究以茶鮮葉為研究對象, 基于葉片和冠層光譜特征對5個茶園不同生育時期茶鮮葉茶多酚含量進行監測, 并利用不同的深度學習算法[偏最小二乘法(partial least squares, PLS)、 隨機森林(random forest, RF)和多元線性回歸(multiple linear regression, MLR)]構建了基于光譜特征的茶鮮葉原位茶多酚估算模型, 最后用于獨立樣本驗證。

1 實驗部分

1.1 研究區概況

本實驗于2020年3月—11月在廣東省英德市茶葉生產示范基地進行。 該區域位于北緯24.24°, 東經113.79°, 平均海拔為181 m(見圖1)。 英德市處于南亞熱帶向中亞熱帶的過渡地區, 屬亞熱帶季風氣候, 夏季盛行偏南的暖濕氣流, 冬季盛行干冷的偏北風。 全年平均氣溫變化在20.10~22.00 ℃之間。 實驗品種涵蓋英紅九號、 金萱、 鴻雁十二號、 黃旦、 金牡丹、 英州一號、 梅占、 云南大葉、 黃玫瑰和軟枝烏龍共計10個品種, 均為10年樹齡。 春茶從立春開始進行春茶觀測周期, 選取清明節前一周、 谷雨前一周。 夏茶采摘期在小滿前一周、 芒種前一周。 從立秋開始, 選取秋分前一周、 寒露前一周, 每組樣本設置5個重復。 共抽取了198個樣本點, 獲取春茶共計82個樣本, 夏茶共計67個樣本, 秋茶共計49個樣本。

圖1 研究區域

1.2 茶鮮葉茶多酚含量測定

將檢測過高光譜信息的茶鮮葉, 采用國標法GB/T8305—2013測茶多酚的含量。 采用70%的甲醇水溶液在70 ℃水浴上進行提取, 福林酚試劑氧化茶多酚中—OH基團并顯藍色, 在波長765 nm處測得吸收值, 同時用沒食子酸作校正標準定量茶多酚。

1.3 光譜測定

1.3.1 冠層光譜測定

實驗包含5個茶園, 每個茶園選取約10個樣本點進行測量, 每個樣本點測量10次獲取茶鮮葉冠層光譜數據, 10次光譜的平均值作為該樣點的最終光譜曲線。 本研究光譜測量采用美國ASD的光譜儀FieldSpec4, 波段范圍為350~2 500 nm, 在350~1 000 nm光譜區的分辨率為1.40 nm, 在1 000~2 500 nm間分辨率為2 nm, 采樣間隔為1 nm。 測定選擇在天氣晴朗、 無風或風速很小的天氣條件下, 10:00—14:00進行。 每次測量前用標準白板校正, 將傳感器探頭垂直向下, 距樹冠層頂垂直高度約1 m, 傳感器視場角為25°, 如圖2(a)。

圖2 茶鮮葉冠層光譜數據獲取(a), 茶鮮葉葉片光譜數據獲取(b)

1.3.2 葉片光譜測定

在對應取樣位置測定整體冠層光譜信息之后采摘一芽二葉茶鮮葉, 在實驗室采用葉片夾和光譜儀測量葉片光譜信息[同步采摘每份樣品約200 g, 在每份樣品中取10片茶葉(約3 g)進行光譜測量]。 每個葉片樣本進行10次光譜重復測量, 將測得的葉片反射光譜異常值剔除后, 取其平均值作為該樣本的反射率, 如圖2(b)。

1.4 數據預處理

對于冠層反射光譜, 剔除水分噪音較大的1 400~1 500、 1 800~2 000以及2 300~2 500 nm之間的波段。 葉片光譜的獲取因為在控制環境下, 因此沒有進行波段刪除。 利用標準正態變量變換(standard normal variate transformation, SNV)算法主要是用來消除因固體顆粒大小不均、 物體表面散射、 光程改變等一些因素產生的對光譜的不利影響。 采用SNV對茶鮮葉葉片和冠層的光譜反射率進行預處理, 結果如圖3(a—d)所示。

圖3 基于SNV預處理的冠層和葉片光譜反射率

1.5 數據處理方法

1.5.1 特征波段篩選方法

擬運用連續投影算法(successive projections algorithm, SPA)和競爭性自適應加權采樣算法(competitive adaptive weighted sampling algorithm, CARS)篩選出有效光譜信息。 連續投影算法(SPA)作為一種變量選擇技術, 通過最小化校準數據集中的共線性優化模型構建條件。 競爭性自適應重加權采樣算法(CARS)基于頻譜的應用中用于關鍵變量篩選的新開發算法。 基于自適應加權采樣(CARS)和達爾文進化論中的“適者生存”的原理。 這兩種方法是選擇基于全光譜波長中存在的最佳特征變量的有效方法, 并展示出良好的性能[13]。 基于SPA和CARS從茶鮮葉的光譜數據中提取具有最小共線性冗余度和最大投影矢量的波段變量, 以減少變量的數量并提高模型的速度和效率。

1.5.2 建模方法

偏最小二乘回歸(partial least squares, PLS)主要研究多因變量或單因變量對多自變量的回歸建模, 最簡單的形式是因變量y與自變量x之間的線性回歸模型。

隨機森林(random forest, RF)是一個包含多個決策樹的分類器, 其輸出類別是由個別樹輸出的類別的眾數而定, 采用袋外數據集(out-of-bag data, OOB)重要性原則, 對數據進行降維。

多元線性回歸(multiple linear regression, MLR)是包括兩個或兩個以上自變量對一個因變量的回歸模型。

1.6 統計分析

所有的實驗數據隨機按照2∶1選擇出需要的校正集樣本數目。 根據茶多酚含量估算模型的構建, 選取決定系數(coefficient of determination,R2)、 均方根誤差(root mean squared error, RMSE)作為模型精度的驗證。R2反映模型建立和驗證的穩定性,R2越接近于1, 說明模型的穩定性越好、 擬合程度越高。 RMSE用來檢驗模型的誤差, RMSE越小模型估算能力越好。

2 結果與討論

2.1 不同季節茶多酚含量差異分析

如圖4所示, 通過實驗室理化分析檢測以上10種茶樹鮮葉的茶多酚含量(干重15%~20%), 不同季節茶多酚含量存在較大差異。 (1)秋茶的茶多酚含量顯著高于春茶和夏茶。 春茶茶多酚平均含量最低(15.40%), 夏茶茶多酚平均含量次之(18.37%), 秋茶茶多酚平均含量最高(20.63%)。 (2)春茶、 夏茶和秋茶茶多酚平均含量分別為8.84%~21.87%, 13.22%~23.71%和13.55%~23.36%。

圖4 不同生育時期茶多酚含量(%)

2.2 特征波段篩選

特征波段的選擇是建立茶鮮葉品質成分預測模型的關鍵, 冠層尺度光譜特征和葉片尺度光譜特征篩選結果見表1。 茶多酚的特征波段主要集中在短波近紅外波段(2 100~2 200 nm附近)、 近紅外(1 300~1 400 nm附近)、 紅波-紅邊波段及綠波段。

表1 茶多酚的特征波段篩選結果

2.3 茶多酚含量估算模型

表1葉片與冠層兩種尺度不同的波段篩選結果, 分別采用偏最小二乘回歸(PLS), 隨機森林回歸(RF)以及多元線性回歸(MLR)方法對春茶、 夏茶、 秋茶的鮮葉的茶多酚含量進行估算。 茶多酚含量估算模型結果如表2所示。

表2 茶多酚含量估算模型

表2中, 基于葉片光譜特征構建的茶多酚模型普遍高于基于冠層尺度構建的模型, 且PLS和MLR模型的精度普遍高于RF模型精度。 以春茶、 夏茶和秋茶葉片尺度運用SPA篩選的特征波段所建模型為例, MLR建模精度最高,R2分別為0.53、 0.42和0.42, RMSE分別為1.25、 1.70和1.66。 在于春茶、 夏茶和秋茶冠層光譜特征構建的茶多酚模型中CARS-MLR、 SPA-MLR和CARS-MLR模型精度最高,R2分別為0.57、 0.45和0.57, RMSE分別為1.34、 1.68和1.69。

2.4 茶多酚含量驗證模型

利用驗證集數據對所構建的模型進行驗證, 茶多酚含量驗證結果如表3所示。 基于春茶、 夏茶和秋茶葉片光譜特征的驗證模型中SPA-PLS模型、 SPA-MLR和SPA-MLR模型精度較高,R2分別為0.43、 0.36和0.38, RMSE分別為1.44、 1.96和2.49。 在春茶、 夏茶和秋茶冠層光譜特征的驗證模型中CARS-MLR模型、 SPA-MLR和CARS-MLR模型精度較高,R2分別為0.39、 0.40和0.23, RMSE分別為1.91、 1.91和2.25。

表3 茶多酚含量驗證模型

結果如圖5(a—f)所示, 展示了葉片和冠層兩個尺度, 兩種波段提取方法下三種模型的預測效果, 春、 夏、 秋茶三個季節的最優茶多酚預測模型1∶1擬合圖。

圖5 茶多酚最優模型1∶1擬合圖

采用葉片與冠層兩個尺度的光譜特征對春、 夏、 秋三個生長時期的10個品種進行茶多酚含量監測。 不同季節茶多酚含量存在明顯差異, 并呈現出從春茶到秋茶顯著遞增的趨勢。 茶多酚是光合作用等一系列生理活動的產物, 隨著光合作用累積的同化產物的增加, 茶多酚的含量也逐步增加。 同時, 春茶滋味鮮爽, 苦澀味少, 秋茶風味醇厚, 經久耐泡也從側面反映了不同季節茶多酚對茶葉風味的影響。 所篩選的茶多酚的重要光譜區域主要集中在1 300~1 400和2 100~2 200 nm附近, 主要歸因于O—H拉伸的第二泛音和第三泛音, 與王凡等[14]研究也得到了相同的結果。 該結果區別與作物在生物量、 葉綠素及葉面積指數等方面以紅波段和近紅外波段為主的敏感波段, 由于茶多酚屬于微量礦物質。 在研究過程中發現: (1)SPA已被證實為一種非常有效的變量選擇方法, 可以將變量之間的共線性降到最低。 與之相比, CARS作為一種較新的變量選擇理論, 研究證明該方法在變量選擇的過程中, 可以同時對共線性變量進行有效壓縮以及無信息變量進行有效的去除, SPA篩選出來的波段總體比CARS數量少, 說明原始波段中可能存在大量共線性變量; (2)盡管CARS可以有效壓縮共線性變量, 但壓縮后的變量仍然存在部分集中共線性; (3)較少的特征波段, 有利于降低開發在線檢測設備的成本, 更有利于儀器的開發。 SPA更適宜茶多酚的敏感波段的篩選。

基于三種建模方法(PLS、 RF、 MLR)得到的實驗結果中發現, 通過MLR進行建模精度較好, 而RF實驗結果均較差, 與陶惠林等[15]研究結果相似。 可能RF模型對小樣本數據, 雖然學習能力強, 但預測能力弱, 并且在驗證模型中表現出欠擬合的現象。 綜合模型的適用性, 以及空間尺度和時間尺度, MLR方法模型更適合茶多酚含量的估算。 相比冠層尺度的茶多酚模型, 本工作在葉片尺度構建的模型具有更高的精度。 一方面, 葉片光譜是直接對茶葉樣本進行的測定, 而冠層光譜測定范圍比樣本采集范圍更大; 另一方面, 冠層光譜受非觀測茶葉目標及土壤等因素影響。 冠層尺度的茶多酚模型的精度雖然低于葉片尺度的模型精度, 但其為大尺度進行茶葉品質監測提供了科學依據。

相比于傳統的茶葉品質的感官評審和化學檢測, 本研究進行的原位、 快速、 大面積、 無損傷性品質分析避免主觀判斷的影響。 另外, 將高光譜數據有效降維, 可降低檢測茶多酚含量儀器的開發成本。 對于茶農進行茶園精準化栽培, 茶企針對茶青品質進行標準化加工, 提高成品茶的質量具有重要意義。

3 結 論

(1)采用國標法對茶樹葉片與冠層兩個尺度春茶、 夏茶、 秋茶三個關鍵生育期的連續實驗室理化檢測。 檢測到從春茶到秋茶鮮葉茶多酚含量逐步增加的變化趨勢(春茶茶多酚含量占干重15.37%<夏茶茶多酚含量占干重18.29%<秋茶茶多酚含量占干重20.77%)。

(2)茶多酚的特征波段主要集中在2 100~2 200 nm附近、 1 300~1 400 nm附近以及紅波-紅邊波段及綠波段。

(3)在春茶、 夏茶和秋茶冠層光譜特征構建的茶多酚模型中CARS-PLS、 SPA-MLR和CARS-PLS模型精度最高, 建模集R2分別為0.56、 0.45和0.52, RMSE分別為1.15、 1.68和1.77; 驗證集R2分別為0.43、 0.40和0.41, RMSE分別為1.60、 1.91和1.91; 對春茶、 夏茶和秋茶冠層葉片光譜特征構建的茶多酚模型中SPA-PLS、 CARS-PLS和SPA-MLR模型精度最高, 建模集R2分別為0.50、 0.42和0.42, RMSE分別為1.25、 1.70和1.66; 驗證集R2分別為0.43、 0.36和0.38, RMSE分別為1.44、 1.96和2.49。

(4)綜合比較, 基于冠層的光譜數據來源構建的茶多酚預測模型精度較高, 可以有效預測茶多酚含量。

猜你喜歡
春茶鮮葉冠層
基于低空遙感的果樹冠層信息提取方法研究
基于激光雷達的樹形靶標冠層葉面積探測模型研究
安徽省淮南森林冠層輻射傳輸過程的特征
春茶不宜貪嘗鮮
春茶不宜貪嘗鮮
24味暖春茶香 1周急速瘦15斤
施氮水平對冬小麥冠層氨揮發的影響
不同嫩度茶鮮葉原料稀土元素含量的變化
氣溫對日照茶鮮葉適制性的研究
攤放對茶鮮葉生化成分的影響研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合