?

基于電子鼻的牛肉微生物污染狀況定量預測模型的構建

2023-11-10 07:31劉淑梅張金龍張曉瑞韓方凱
食品安全導刊 2023年30期
關鍵詞:電子鼻實測值預測值

付 碩,劉淑梅,張金龍,張曉瑞,韓方凱

(1.安徽創佳安全環境科技有限公司,安徽宿州 234000;2.江蘇大學,江蘇鎮江 212013;3.宿州學院,安徽宿州 234000)

致腐菌導致食品腐敗變質,易產生有害物質,如小分子含氮化合物組胺等,直接威脅食品安全。因此,對食品中微生物污染狀況的監測,對保障膳食安全極為重要?;罹倲担═otal Viable Counts,TVC)是定量描述食品微生物污染狀況的指標。然而TVC 的常規檢測方法,即平板計數法通常需要經過48 h 的搖床培養,待平板上微生物生長、繁殖成可觀察的菌落后,再對菌落進行計數,經過換算,得到最終結果。平板計數法耗時、費力[1],無法快速反映食品微生物污染狀況,以及時調整食品保藏、銷售、加工等策略。

常見的食品快速檢測方法,如電子舌[2]、電子鼻[3]等智能仿生檢測方法以及近紅外[4]、高光譜[5]等光譜學檢測方法等,均已應用于不同種類食品保藏期間TVC 的定量預測。然而,這些方法得到的電化學傳感器或光譜學信號,受食品基質干擾嚴重[6],因此建立快速檢測方法所得到的傳感器信號與TVC之間精確度較高的定量預測模型,成為食品快速檢測方法應用于生產實際的限制性因素之一?;诖?,本研究以最常見的金屬氧化物半導體型電子鼻傳感器數據為輸入,對比采用偏最小二乘法(Partial Least Squares Regression,PLS)和快速人工神經網絡極限學習機(Extreme Learning Machine,ELM)算法構建牛肉貯藏期間TVC 快速定量預測模型的精確度,以期推進食品快速檢測技術在食品生產實際中的應用。

1 材料與方法

1.1 電子鼻數據

本研究數據來源于DEDY 等[7]于2018 年發表在《Data in Brief》的數據論文。所用的電子鼻系統是基于金屬氧化物半導體型氣敏傳感器陣列,該系統包含9 根MOS 傳感器。電子鼻試驗在密閉樣品室下持續36 h,每分鐘采集1 次傳感器信號,共計得到2 160 組電子鼻傳感器陣列數據。樣品共5 組,最終得到5×2 160 行9 列的數據矩陣用于本研究的模型構建。電子鼻試驗期間,牛肉樣品的TVC 從3 lgCFU·g-1以下(微生物污染程度輕微)增殖到近5 lgCFU·g-1(微生物污染程度嚴重)。圖1 展示出所有樣品在電子鼻測試期間傳感器數據及TVC 數值,包含原始數據及歸一化至[0,1]后的數據。

圖1 模型構建所用電子鼻傳感器陣列數據及牛肉活菌總數數據

1.2 模型構建方法及性能評價指標

研究以電子鼻傳感器所有數據為輸入,以對應樣本TVC 實測值為輸出,對比采用線性的PLS 和非線性的ELM 構建基于電子鼻技術的牛肉貯藏期間TVC 定量預測模型。選擇ELM 的主要原因是其計算速度顯著快于常見的BP-人工神經網絡算法[8]。

在模型的構建過程中,隨機選取1/3 的樣本作為測試集,其余樣本作為訓練集,且在PLS 和ELM 模型構建過程中保持一致。評估所采用的定量預測模型,本文依賴以下指標。①相關系數(r)。該系數衡量電子鼻預測的牛肉TVC 值與實際值之間的相關性,r值越接近1,證明預測的相關性越高,具體計算方法見式(1)。②預測均方根誤差(Root Mean Square Error,RMSE)也作為關鍵指標,它用于測量電子鼻預測的牛肉TVC 值與實際值的誤差程度,RMSE 越低,代表預測精度越高,反之則預測精度較差。

式中:yi和分別為樣本集(訓練集和預測集)中第i個牛肉樣本TVC 的實測值和預測值,lgCFU·g-1;為樣本集中所有牛肉樣本TVC 實測值的平均值,lgCFU·g-1[9];n為樣本數。

式中:yi和分別為預測集中第i個牛肉樣本TVC 的實測集和預測值,lgCFU·g-1;n為預測集樣本數[9]。

2 結果與分析

2.1 PLS 模型結果

PLS 用于處理多個自變量和一個或多個因變量之間的關系,在解決多重共線性和高維數據問題時優勢明顯。PLS 通過找到自變量和因變量之間的最大協方差來構建線性回歸模型,用于預測未知樣本的因變量值。

基于PLS 的基礎理念,模型預測能力受到PLS主成分數量的顯著影響。因此,在構建PLS 模型過程中,對輸入的PLS 主成分數進行優化是必要的。這一優化過程采用了“留一法”交叉驗證。這種驗證方法的核心思想是將每個樣本視為驗證集,用剩下的(N-1)個樣本來創建PLS 模型,然后運用驗證集來檢測新構建的PLS 模型,以預測值和實測值誤差的均值作為優化PLS 主成分數的指標。如果對應的RMSE 值最小,則認為當前條件下的PLS 模型是最優的。PLS 主成分篩選結果如圖2 所示。

圖2 不同PLS 主成分下訓練集預測誤差

從圖2 可以看出,當主成分因子數為8 時,PLS模型的RMSE 最低,為0.319 7 lg CFU·g-1。此條件下,PLS 模型訓練集和測試集對魚細菌總數的預測值和實測值之間的相關關系如圖3 所示,其測試集相關系數為0.937,預測RMSE 為0.324 lgCFU·g-1。

圖3 最佳PLS 主成分下模型預測值與實測值相關關系圖

2.2 ELM 模型結果

ELM 是一種新型的單隱藏層前饋神經網絡算法,具有出色的泛化性能和極快的學習速度。根據ELM理論,對于一個特定的模式識別問題,隱含層的神經元個數和傳遞函數可供篩選和優化,以獲得預測性能較優的預測模型。鑒于人工神經網絡隱含層神經元個數優化范圍尚無統一范式可供遵循,本研究采用典型的試湊法,設定范圍為[1,50],優化ELM隱含層神經元個數。在ELM 隱含層傳遞函數的篩選上,對比采用3 種典型的函數[8],公式為

圖4 顯示了在隱含層神經元個數[1,50]范圍內,3 種傳遞函數條件下,ELM 模型訓練集和測試集的相關系數。從圖4 中可以看出,當選擇Sin 函數作為傳遞函數,且隱含層神經元個數為45 的時候,ELM預測性能最佳,其訓練集相關系數為0.976,測試集相關系數為0.972。

圖4 不同隱層激活函數及節點數下對ELM 模型訓練集和測試集相關系數

最優ELM 模型的基本結構為9-45-1,包含9個電子鼻傳感器輸入變量,45 個單隱含層神經元,1個樣品TVC 預測輸出變量。模型訓練集和測試集對牛肉樣本TVC 的預測值及實測值依樣本序號排列結果如圖5 所示,此時訓練集和測試集的RMSE 分別為0.040 lgCFU·g-1和0.047 lgCFU·g-1,優于PLS 模型。

圖5 所建最優ELM 模型訓練集和測試集預測值與實測值情況

3 討論

牛肉富含水分、蛋白質、脂肪等營養成分,極易變質腐敗。微生物的生長繁殖是引發牛肉變質的主要原因。微生物生長繁殖過程中,釋放出大量的蛋白酶、脂肪氧化酶、過氧化物酶,使牛肉中的蛋白質和脂肪等營養元素分解為低分子化合物。蛋白質會被水解成肽,進而分解成氨基酸。氨基酸經過脫羧化、脫氨化、脫硫化等作用會生成相應的氨、小分子胺、有機酸等。脂質會在水解作用下生成游離脂肪酸、甘油、甘油酯和甘油二酯等。脂肪酸還可以進一步分解成酮酸或酮等[10]。這些產物中的烴類、酮類、醇類、醛類、酸類、酯類、含硫及雜環化合物等是牛肉保藏期間產生揮發性有機化合物的主要成分[11]。電子鼻傳感器可以識別食品揮發性成分,進而實現微生物污染狀況的間接預測。

從構建的PLS 模型及ELM 模型的預測性能來看,ELM 模型的訓練集和測試集相關系數分別為0.976 和0.972,高 于PLS 模 型 的0.938 和0.937,ELM 模型的訓練集和測試集的預測誤差分別為0.040 lgCFU·g-1和0.047 lgCFU·g-1,均明顯低于PLS模型的0.319 7 lgCFU·g-1和0.324 lgCFU·g-1。主要是因為電子鼻傳感器信號與預測目標TVC 值之間是非常復雜的非線性關系,這是由電子鼻傳感器特性所決定的,即傳感器非特異性,且相互之間交互敏感,對食品揮發性物質的敏感性存在一定程度的交叉。ELM 具有出色的自學習和自適應能力,獲得的結果優于線性的PLS 算法[12]。

4 結論

本文研究構建了基于MOS 型電子鼻信號處理的牛肉貯藏期間TVC 定量預測模型。結果表明,非線性的ELM 算法獲得的結果較線性的PLS 算法好,其訓練集或測試集對樣本TVC 的預測值與實測值之間的相關系數均高于0.97,預測誤差均低于或等于0.04 lgCFU·g-1。ELM 模型預測精度高,運算速度快,能夠滿足實際需求,可為牛肉質量安全控制提供借鑒。

猜你喜歡
電子鼻實測值預測值
加拿大農業部下調2021/22年度油菜籽和小麥產量預測值
±800kV直流輸電工程合成電場夏季實測值與預測值比對分析
常用高溫軸承鋼的高溫硬度實測值與計算值的對比分析
法電再次修訂2020年核發電量預測值
市售純牛奶和巴氏殺菌乳營養成分分析
電子鼻咽喉鏡在腔鏡甲狀腺手術前的應用
一種基于實測值理論計算的導航臺電磁干擾分析方法
飛到火星去“聞味兒”——神奇的電子鼻
電子鼻在烤雞香氣區分中的應用
電子鼻快速檢測煎炸油品質
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合