?

基于近紅外光譜數據的一維卷積神經網絡模型研究

2024-03-07 01:50羅彥波李翔宇陳云璨紀曉波龐永強朱立軍
光譜學與光譜分析 2024年3期
關鍵詞:池化層層數光譜

唐 杰, 羅彥波, 李翔宇, 陳云璨, 王 鵬, 盧 天, 紀曉波, 龐永強*, 朱立軍*

1. 煙葉資源科學利用重慶市重點實驗室, 重慶 400060

2. 國家煙草質量監督檢驗中心, 河南 鄭州 450001

3. 上海數之微信息科技有限公司, 上海 200444

4. 上海大學化學系, 上海 200444

引 言

近紅外光譜(near-infrared spectroscopy, NIRS)是近年來發展較為快速的分析方法之一, 用于研究物質在近紅外波段的吸收和散射特性, 可以做到快速、 無損、 綠色的檢測。 近紅外光譜可以記錄到樣品中的分子化學鍵的振動信息, 如C—H、 O—H、 N—H等, 可涵蓋絕大部分有機組成與結構信息, 十分適合用于有機樣品的無損檢測[1]。

近年來已出現不少應用在植物上的近紅外技術相關的工作, 研究內容主要涉及到植物中重要化學成分的回歸預測問題, 比如預測總植物堿、 總氮、 還原糖等的含量, 同時也涵蓋了分類問題, 譬如預測植物屬地、 植物部位等。 由于近紅外光譜的高維度特點, 上千維度的光譜數據難以直接應用到機器學習模型中, 通常需要先大幅減少數據的維度, 而針對高維光譜數據的處理方法較為有限, 因此絕大部分植物近紅外工作思路都是先求導平滑、 再降維、 最后基于降維主成分來構建機器學習模型。 其中求導與平滑步驟一般采用二階求導與Savitzky-Golay平滑, 降維方法通常是偏最小二乘法(partial linear square, PLS)或主成分分析(principle component analysis, PCA), 機器學習算法則以選用PLS回歸、 支持向量機(support vector machine, SVM)居多。 蔣宏霖等[2]采用PLS方法降維了500多個不同地區、 不同等級的煙葉樣本的近紅外光譜數據, 并用全部降維主成分構建PLS回歸模型來預測還原糖等煙葉中的5個化學成分含量, 其測試集的平均相對誤差(mean relative error, MRE)為2.76%~4.35%。 Liu等[3]利用PLS降維成分構建了SVM模型, 用于預測同種煙葉的部位, 其測試集準確率為81.67%。 羅瓊等[4]用PLS回歸模型預測煙葉的淀粉的含量; Omar等[5]用SVM預測煙葉的公司品牌。 為提升模型的預測能力, 李明等[6]用組合區間偏最小二乘法確定了三段最優光譜區間, 使得模型的變量數降低了2/3, 且預測集的均方誤差(mean squared error, MSE)從1.188降低到0.963。 蔡峰等[7]用遺傳算法(genetic algorithm, GA)篩選PCA主成分個數, 使得SVM模型的測試集相關系數從0.90提升至0.95。

由于PCA與PLS等常規降維方法的局限性, 仍然較難獲取到信息豐度較高的光譜數據, 模型預測能力也難以進一步提升。 比如, 文獻[8]模型對還原糖、 總氮、 總植物堿的測試集平均相對誤差MRE為3%~5%, 模型能力仍然還有較大的提升空間。 為探索新的建模思路, 有研究采用二維的卷積神經網絡(2-dimensional convolutional neural network, 2DCNN)預測煙葉的屬地, 測試集的分類準確率達到95%。 2DCNN的訓練成本較大, 當近紅外光譜含有1609個數據點且訓練樣本數量有400個時, 模型訓練時間需要6.85個小時。 Jiang等[9]嘗試用循環神經網絡(residual neural network, RNN)來預測4個歸屬地, 但測試集準確率僅比SVM高出7%。 Kesu等[10]探索了2DCNN對化學成分含量的建模結果, 測試集的相關系數也達到0.85~0.95。 從模型復雜度來看, 2DCNN與RNN屬于容量較大的模型, 即網絡結構中的待優化參數較多, 需要大量的訓練樣本及較大的計算成本進行訓練, 因此這兩類模型也難有出眾的表現。 從近紅外光譜是高維向量這一數據特點來考慮, 一維卷積神經網絡(1-dimensional, convolutional neural network, 1DCNN)可能更加貼合輸入數據的形式。 相比于2DCNN和RNN, 1DCNN模型本身復雜度較低, 對樣本需求量不高, 因而計算成本較低, 且無需對數據作二維矩陣變換。 相比于傳統的降維建模過程, 1DCNN無需對光譜降維處理, 也不需要對光譜區域進行優化或選擇, 而是在模型訓練過程中調整光譜數據點對應的權重系數, 從而調整每個光譜數據點的貢獻度。

本研究收集了來源于全國各地的452個同種茄科植物樣本, 以該茄科植物的近紅外光譜為輸入數據, 以茄科植物的化學成分為目標值, 分別構建1DCNN回歸模型。 針對不同1DCNN模型, 分別討論了模型重要參數對建模結果的影響情況, 為1DCNN后續研究提供建模思路上的指導。 經參數優化后, 1DCNN模型測試集的MRE為0.8%~2.3%, MSE為0.001~0.238, 相關系數為0.93~0.97, 均優于文獻的模型結果。 因此認為1DCNN在處理近紅外光譜數據(甚至其他類似的高維向量數據)上具有十分大的潛力, 希望能為類似的光譜工作提供新的思路方向和數據處理手段。

1 實驗部分

1.1 材料與儀器

樣本: 茄科植物樣本收集于各地復烤廠典型樣品, 共計452個, 分別采集其近紅外光譜。

儀器: Antaris Ⅱ近紅外光譜儀(美國Thermo公司); FD115 電熱鼓風干燥箱(德國BINDER公司); 3100粉碎磨(瑞典PERTEN公司); XSR204型電子天平(感量0.000 1 g,瑞士MettlerToledo公司); DK20消化器(意大利VELP公司); SKALAR SAN++連續流動分析儀(荷蘭SKALAR公司)。

1.2 方法

1.2.1 樣品處理與化學指標檢測

所有茄科植物樣品均采用YC/T 31—1996方法制成粉末, 并過0.250 mm(60目)分樣篩, 混勻后裝入密封袋。 采用YC/T 159—2019方法測定樣品中還原糖的含量; 采用YC/T 161—2002方法測定樣品中總氮的含量; 采用YC/T 468—2021方法測定樣品總植物堿含量。

1.2.2 近紅外光譜采集

將粉末樣品置于樣品杯中, 在近紅外光譜儀上進行漫反射采集, 掃描范圍為4 000~10 000 cm-1, 分辨率為8 cm-1, 掃描次數為64。

1.3 數據分析

數據處理過程如圖1所示, 在匯總452個茄科植物樣本的近紅外光譜數據后, 為了消除不同樣本之間的噪聲信息, 先對452條近紅外光譜作了二階求導以及Savitzky-Golay平滑處理。 按4∶1的比例隨機劃分訓練集與測試集, 分別得到362個訓練樣本與90個測試樣本。 訓練樣本用于訓練1DCNN模型, 測試樣本用于訓練好的模型評估。 不同的化學成分目標值, 如還原糖、 總氮、 總植物堿, 采用不同模型分別進行訓練。

圖1 數據處理過程

采用1DCNN構建回歸模型, 基準模型的結構如圖2所示, 包含輸入層、 一維卷積層、 池化層與全連接層。 其中, 中間卷積層通道數、 卷積層數、 池化層數、 末端卷積層通道數都將作為模型參數進行優化調整與討論。 1DCNN的結構說明:

圖2 1DCNN結構示意圖

(1)以單個樣本為例, 其通道數為1, 構成(1, 1 500)維度的張量, 輸入到1DCNN中;

(2)樣本經過n/2(n∈[2, 4, 6, 8])層的一維卷積層, 樣本通道數從1卷積至d(d∈[12, 24, 48, 64, 128]), 樣本維度從(1, 1 500)卷積至(d, 1 500);

(3)樣本經過m(m∈[0, 1])層的池化層, 樣本維度從(d, 1 500)卷積至(d, 1 500/(m+1));

(4)樣本經過剩下的n/2(n∈[2, 4, 6, 8])層的一維卷積層, 最后一層的一維卷積層的輸出通道數設定為l(l∈[1, 2, 3, 5, 7, 10]), 樣本維度從(d, 1 500/(m+1))卷積至(l, 1 500/(m+1));

(5)將(l, 1 500/(m+1))維度的樣本展開平鋪, 得到長度為l×1 500/(m+1)的向量;

(6)輸入到3層的全連接層中, 先后轉換為長度為1 024與512的向量, 最后得到標量作為輸出值;

(7)上述卷積層均配有ReLu激活函數, 前2個全連接層均配有ReLu激活函數與Dropout函數。

2 結果與討論

以還原糖為例說明構建1DCNN模型的過程。 首先考慮對模型影響較大的中間卷積層通道數以及最大池化層數。 如表1所示為不同中間卷積層通道數對1DCNN建模結果的影響, 此時控制卷積層數為6, 最大池化層數為1, 末端卷積層通道數為1, 訓練輪數為1 000。 模型性能指標采用訓練損失(Loss)、 訓練集MSE、 訓練集決定系數(R2)、 測試Loss、 測試集MSE、 測試集R2。

表1 不同中間卷積層通道數對1DCNN模型結果(還原糖)的影響情況

中間卷積層通道數直接影響著1DCNN的容量大小, 當通道數從12增加至64時, 模型的訓練Loss與測試Loss整體處于降低的趨勢, 測試集的MSE與R2分別處于降低與增大的趨勢。 而通道數從64增至128時, 此時由于網絡容量太大, 訓練與測試結果均有所下降, 此時模型擬合效果變差。 因此中間卷積層通道數應控制在64個。 如表2所示, 當最大池化層數為0時, 1DCNN基于不同中間卷積層通道數的建模結果。 模型的誤差整體大于最大池化層數為1時的建模結果, 說明添加最大池化層有助于減少噪音信息, 并減少模型誤差, 增強模型的穩定性。 綜合表1與表2的結果, 可以確定1DCNN的中間層卷積通道數與最大池化層數分別為64與1。

表2 不同中間卷積層通道數對1DCNN模型結果(還原糖)的影響情況

考慮了不同卷積層數對建模的影響(表3), 此時控制中間卷積層通道數為64, 最大池化層為1, 末端卷積層通道數為1。 當卷積層數從2分別提升至6和8時, 明顯看到模型的訓練Loss在不斷減少, 而測試Loss先降低后增加。 當卷積層數為2時, 模型處于欠擬合狀態, 而卷積層為8時, 模型處于過擬合狀態, 因此選擇卷積層為6比較合適。 卷積層數為4時, 模型可能陷入了局部優點, 難以收斂, 不作考慮。

表3 不同卷積層數對1DCNN模型結果(還原糖)的影響情況

進一步考慮末端卷積層通道數對建模的影響情況(表4), 此時控制中間卷積層通道數為64, 最大池化層為1, 卷積層數為6。 當末端卷積層通道數從1提升至20時, 訓練Loss呈現波動式的變化, 訓練集MSE主要呈現先下降后上升的趨勢, 而測試Loss、 測試集MSE主要呈現下降趨勢。 綜合考慮訓練集與測試集, 末端卷積層通道數選擇15較為合適, 此時訓練集MSE比通道數為1的情況降低了0.027, 測試集MSE降低了0.063。

表4 不同末端卷積層通道數對1DCNN模型結果(還原糖)的影響情況

根據表1—表4的模型參數對比, 確定中間卷積層通道數為64, 最大池化層為1, 卷積層數為6, 末端卷積層通道數為15。 如圖3(a)所示為1DCNN還原糖模型的訓練過程, 訓練輪數為1 000輪, 962輪時模型達到最佳。 1 000輪訓練時長約為156.45 s, 遠少于以前工作中的6.85 h。 圖3(a)中的訓練Loss與測試Loss隨著訓練輪數增大而下降, 且200輪之后就處于較小的波動狀態, 說明模型訓練較為穩定。 圖3(b)是1DCNN模型繼續訓練至2 000輪的情況, 訓練Loss略有下降, 但測試Loss基本不變, 說明1DCNN再繼續訓練可能會陷入過擬合狀態。 因此從圖3中可得出結論, 1DCNN模型在1 000輪以內基本已收斂, 且在約200輪已達到較高的準度。

圖3 1DCNN(還原糖)模型的訓練結果

采用圖3(a)中收斂的1DCNN還原糖模型, 其詳細性能評價指標如表5所示。 測試集的RMSE為0.487, 低于文獻[8, 12-13]的1.06、 0.83與0.92, 與文獻[14]的0.443持平。 測試集MRE為1.7%, 低于文獻[3, 9]的3.05%與3.37%。 其他性能評價指標決定系數(R2)為0.915、 MSE為0.238、 MAE為0.379、 相關系數CORR為0.957, 也均處于較好的水準。

表5 1DCNN的評價指標結果

采用類似的方法同樣可確定總氮與總植物堿的模型參數, 其中間卷積層通道數、 最大池化層、 卷積層數、 末端卷積層通道數分別為128、 1、 4、 5與32、 1、 4、 5。 模型的性能指標見表5, 測試集RMSE分別為0.024與0.067, 測試集MRE為0.8%與2.3%, 低于文獻中誤差。

結合三個模型的訓練結果, 1DCNN的中間卷積層通道數可設為64或128, 最大池化層應該選擇開啟, 卷積測層數可設為4/6層, 末端卷積通道數選擇5~15較為合適, 訓練輪數的上限可設定為1 000。

分別提取三個模型的一維卷積特征向量, 該向量是原始輸入光譜數據經由多個卷積與池化操作后得到, 可以視為是原始輸入近紅外光譜的轉換后數據。 向量中元素值的大小對應著該波數位置的數據點對模型的貢獻度大小。 向量結果如圖3(a)所示, 藍色、 橙色、 綠色分別對應還原糖、 總氮、 總植物堿的轉換后的近紅外光譜數據。 圖中可看出, 光譜響應值較大的譜圖區域分別為5 100~5 800、 6 750~7 500、 8 650~9 100 cm-1, 與求導平滑的近紅外光譜圖[圖4(b)]中波動較大的譜圖區域較為一致。 說明在1DCNN模型中, 傳統上認為信號較強的譜圖區域對模型貢獻度也較大。 但值得注意的是, 圖3(b)中較為平緩的譜圖區域, 如5 800~6 750、 7 500~8 650、 9 100~10 000 cm-1等, 在傳統機器學習中可能會被作為噪聲或者冗余特征去除, 但這些區域在1DCNN網絡中的仍然存在著較大的建模貢獻度, 說明這些平時被視為信息豐度較小的區域仍然隱藏有對建模有用的信息, 而這些信息較難以常規機器學習手段挖掘得到。

圖4 (a)經1DCNN轉換后的近紅外光譜; (b)求導平滑后的近紅外光譜

3 結 論

基于452個同種茄科植物的近紅外光譜, 以該植物的還原糖、 總氮、 總植物堿為目標值, 分別構建了三個1DCNN回歸模型。 經過三個模型的訓練過程, 1DCNN的中間卷積層通道數可設為64或128, 最大池化層可設為1, 卷積測層數可設為4或6層, 末端卷積通道數可設為5~15層, 訓練輪數上限可小于1 000, 可為后續基于近紅外光譜的1DCNN研究提供模型的案例參考。 三個1DCNN回歸模型的測試集的RMSE為0.024~0.487, MRE為0.8~1.7%, 均小于歷史文獻的誤差范圍, 驗證了1DCNN在近紅外光譜建??尚行?。 進一步提取了1DCNN中的卷積特征向量, 結果表明信號較弱的譜圖區域對建模結果仍然有較大的貢獻度。 相比于傳統機器學習方法, 1DCNN模型不僅可充分利用全部的近紅外光譜數據, 還具備較好的預測能力, 可以作為近紅外光譜領域內新的數據處理手段。

猜你喜歡
池化層層數光譜
基于三維Saab變換的高光譜圖像壓縮方法
填筑層數對土石壩應力變形的影響研究
上海發布藥品包裝物減量指南
卷積神經網絡模型研究分析*
基于卷積神經網絡的紙幣分類與點鈔
基于深度學習卷積神經網絡的人體行為識別研究
MoS2薄膜電子性質隨層數變化的理論研究
基于全卷積神經網絡的SAR圖像目標分類*
星載近紅外高光譜CO2遙感進展
住在哪一層
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合