?

近紅外光譜技術法快速鑒別茶油摻偽

2019-12-14 14:10榮菡羅懿黃鏝淳
安徽農業科學 2019年19期
關鍵詞:近紅外光譜茶油模式識別

榮菡 羅懿 黃鏝淳

摘要 [目的]采用近紅外光譜技術法,快速鑒別茶油摻偽。[方法]基于近紅外光譜技術,比較馬氏距離聚類分析法與反向傳播神經網絡,建立茶油與摻有菜籽油、棕櫚油摻偽茶油的模式識別模型。[結果]采用馬氏距離聚類分析法建模時,參數如下:光譜一階導數處理后,結合SNV、Norris Derivative濾波方法,經主成分分析法,提取8個主成分,模型對預測集樣本的準確率達100%;采用反向傳播神經網絡建模時,參數如下:輸入向量為前8個主成分的33個吸收峰,隱含層神經元個數為15,訓練學習速度為0.1,訓練220步時,模型對預測集樣品識別準確率亦為100%。[結論]反向傳播神經網絡方法更加具有較快的運算速度和較好的收斂性,可為茶油品質評價與檢測提供一種新方法。

關鍵詞 近紅外光譜;模式識別;馬氏距離;反向傳播神經網絡;茶油;摻偽油

中圖分類號 TS227文獻標識碼 A

文章編號 0517-6611(2019)19-0204-03

Abstract [Objective]Using nearinfrared spectroscopy technology to quickly identify camellia oil adulteration.[Method]Based on near infrared spectroscopy, two pattern recognition models were developed for discriminating camellia oil and adulterated oil with rapeseed oil and palm oil, which were bulit by Mahalanobis distance discriminative model and BackPropagation (BP) network.[Result]When modeling with Mahalanos distance clustering, the parameters were as follows:first derivative spectrum combined with standard normal variate (SNV)and Norris Derivative, 8 principal components compressed from the original data processed by PCA, the models accuracy of discrimination in the prediction set was 100%. When modeling with BP neural networks, the parameters were as follows:33 absorption peaks data, 8 principal components processed by PCA were taken as inputs of the BP Network, the number of hidden neurons was 15, learning rate was 0.1, training steps were 220, the BP model was built for identification of camellia oil and adulterated oil, and the models recognition correct rate was 100%. [Conclusion]The BP network has rapider operation speed, better convergence,which provides a new method for the quality evaluation and determination of camellia oil.

Key words Near infrared spectroscopy;Pattern recognition;Mahalanobis distance;Backpropagation network;Camellia oil;Adulterated oil

茶油是維持人體新陳代謝和生命活動不可缺少的供能營養物質,為人體提供必需脂肪酸和脂溶性維生素,因其豐富的單不飽和脂肪酸,在清理血栓、調節血脂、促進神經細胞發育、抗炎性等方面的重要功效更加突出。不同的食用植物油因脂肪酸組成不同,營養價值存在較大的差異,市場售價也存在較大的差別。一些商家為謀取利潤,會在茶油中摻入玉米油、大豆油、菜籽油、棕櫚油等較低價位的植物油,降低茶油營養價值,影響消費者的健康。

目前,在茶油品質檢測技術中,主要是通過檢測其質量特征指標,比如酸價、過氧化值、脂肪酸組成等,理化檢測法和感官評價法適用于食用油品質的初步判斷;氣相色譜法和氣質聯用法等儀器分析法則需要對樣品進行甲酯化預處理且分析時間較長,對于脂肪酸組成和含量與茶油接近的植物油,很難通過脂肪酸的指標加以鑒別[1];近紅外光譜技術基于近紅外光譜信號量豐富、測量形式多樣化的特點,能夠對檢測物進行快速、無損的定性和定量檢測。在茶油品質檢測中,最常見的是化學計量學中的偏最小二乘法(PLS)、線性判別分析(LDA)、簇類獨立模式法(SIMCA)用于摻偽油的分類與摻偽量的定量檢測,這些是基于因子分析的線性體系的多元校正方法,面對摻偽量含量較低的茶油摻偽體系時,仍具有一定的局限性[2-5]。鑒于茶油組成成分的官能團與近紅外光譜信息的有效性較為復雜,由大量的基本神經元相互聯接而成的人工神經網絡在茶油摻偽這類非線性動態體系中,在信息處理、運算速度、模式識別等方面優點突出,可作為解決非線性校正問題最優方法之一[6-10]。

近紅外光譜技術具有綠色環保、無損、信號量豐富的特點,相比傳統的理化檢測費時且檢測條件受限等問題,該試驗采用近紅外光譜技術與化學計量學結合,通過試驗比較基于線性系統下的馬氏距離聚類分析法,以及基于非線性系統的反向傳播神經網絡,建立茶油與摻有菜籽油、棕櫚油摻偽茶油的模式識別模型,以期為茶油摻偽快速檢測甚至大批量在線檢測與評價茶油品質提供新思路。

1 材料與方法

1.1 儀器與試劑

儀器:傅里葉變換拓展近紅外光譜儀及近紅外光纖探頭(美國,Thermo Nicole公司)。軟件:OMNIC7.0、TQ7.0、Matlab2017a。

食用油:市面購得茶油、菜籽油、棕櫚油3類油品,每種油至少采購4個不同品牌作為建模樣品,經純度鑒定均為100%純正油品。

1.2 摻偽油配制

摻有菜籽油、棕櫚油的摻偽油,摻偽油含量濃度為10%~40%的梯度進行配制,共100個摻偽油樣品。

1.3 采集譜圖

茶油與摻偽油全部樣品共180個,分為訓練校正集樣品150個、預測集樣品30個。樣品充分混合均勻,放置于專業近紅外光譜測試室的適宜條件下,進行光譜采集。

石英杯裝約占容積1/4的樣品,保證樣品液面高于5 cm,將近紅外光譜光纖插入樣品中,每個樣品采集6次譜圖,取其平均光譜參與建模,掃描條件:PbS檢測器,白光光源,增益為1.0,動鏡速度為0.632 9,掃描范圍4 200~10 000 cm-1,掃描次數為72次,分辨率為8 cm-1。

樣品譜圖如圖1所示。從譜圖可知,茶油與摻偽油譜圖無明顯差異,因此難以用常規檢驗的方法加以區分。

1.4 主成分分析-馬氏距離法構建茶油與摻偽油的定性判別模型

樣品光譜矩陣通過主成分分析進行降維處理,用各光譜的主成分得分計算馬氏距離。根據主成分得分向量描述的2個樣本i,j 間的馬氏距離計算公式如下:

它是一種基于類模型基礎上有監督的模式識別方法,該法依據如下:同一類樣本因具有相似的特征,在一定的特征空間內,屬于同一類的樣本會聚集在某一特定的空間區域內;而對于不同類的樣本,則分布在不同的區域[11-12]。因此在訓練中要建立每一類不同油品的類模型。驗證集和預測集樣本,通過計算到各類模型的馬氏距離值,判別該樣本的種類歸屬。

1.5 反向傳播神經網絡構建茶油與摻偽油的定性識別模型

反向傳播算法(back-propagation,BP)神經網絡,一般具有輸入層、中間層(隱含層)和輸出層3層網絡結構,通常采用誤差逆傳播算法。常用BP網絡的傳遞函數主要有Sigmoid型的對數、正切函數或線性函數等。使用Matlab2017a軟件,網絡傳遞函數確定為‘tansig和‘purelin,訓練函數為‘trainscg,予以建模。由于誤差逆傳播算法在網絡訓練中可自行調整權重,網絡模型能夠提高輸入模式響應的準確率,因此BP網絡面對復雜的非線性系統時,亦能具備出色的建模能力。

2 結果與分析

2.1 主成分分析法提取主成分

采用主成分分析(PCA)法對樣品原始光譜數據進行壓縮處理后,能夠在最大程度代表樣品信息的基礎上,將光譜數據降維,有效降低網絡輸入向量的規模并剔除噪音。樣品光譜數據經PCA處理后主成分得分如表1所示。由表1可知,當提取8個主成分時,累積貢獻率信度得分達99.985%,幾乎可涵蓋樣品所有信息。

2.2 光譜數據預處理

光譜數據的數學預處理能夠使基線漂移、光程的變化對光譜響應所產生的影響降到最低。常用到的數學預處理方法一般有一階微分、二階微分、Savitzky-Golay濾波平滑、Norris Derivative濾波平滑、多元散射校正(MSC)以及矢量歸一化(SNV)等。

從不同的光譜預處理方法建模時模型對校正集、預測集樣品的判別準確率(表2)可以看出,光譜經一階導數處理結合SNV、Norris Derivative濾波平滑方法時,模型對校正集和預測集的判別準確率均為100%,可將茶油與摻偽油完全鑒別開來。

2.3 馬氏距離法構建不同種類摻偽油的判別模型

在全波段范圍內,經過一階導數處理結合SNV和Norris Derivative濾波,采用馬氏距離聚類分析建立不同摻偽茶油的判別模型,如圖2所示。從圖中可以看出,3種不同的油品明顯聚集在3個區域,模型對校正集判別準確率為100%,其中圖中坐標Distance 1、2、3分別表示到純正茶油、摻有菜籽油的摻偽油、摻有棕櫚油的摻偽油的馬氏距離。

2.4 BP神經網絡參數的選擇

BP神經網絡包括3層網絡結構,即輸入層、隱含層和輸出層。網絡的優劣除了與網絡結構有關,還與傳遞函數有密切關系。根據網絡的樣本容量與識別需要,試驗中采用雙曲正切函數(hyperbolic tangent function,HTF)和對數函數(logarithmic function,LF)作為隱含層傳遞函數。

隱含層神經元數的選取是影響網絡模型容錯性和學習訓練的重要因素。隱含層神經元數目太多會導致學習時間過長,誤差較大;隱含層節神經元數太少則網絡訓練效果不好,或者無法識別樣本信息。面對復雜的樣品體系,往往沒有確定的定律來確定隱含層神經元的個數,更多時候,網絡隱含層神經單元數的選取需要根據設計者的經驗和多次試驗來確定最佳隱含層神經元數。設計循環隱含層數目在5~20,以試驗預測誤差和預測來判斷BP網絡模型的優劣性。試驗證明,當隱含層神經元個數為15的時候,網絡的預測誤差最小。

此外,訓練次數亦是構建BP神經網絡的重要參數之一,訓練次數過多會造成網絡的過擬合,導致預測結果偏差較大;訓練次數過少則使網絡難以收斂,達不到訓練要求。該試驗中,樣本經PCA法壓縮主成分后,在最大程度代表樣品信息的基礎上,光譜矩陣數據量較少,可有效減少網絡訓練的負荷。在網絡學習前設置最大訓練步數1 000,試驗證明,網絡訓練220步左右即可達到預先設定的學習誤差0.000 1(圖3)。

2.5 構建BP神經網絡模型識別不同種類的摻偽油

采用PCA法提取的前8個主成分、33個吸收峰數據作為BP網絡的輸入向量,以曲正切函數和對數函數作為隱含層傳遞函數,隱含層神經元個數為15,訓練目標設定為0.000 1,訓練學習速度為0.1,訓練220步時,構建的BP神經網絡可將摻有菜籽油、棕櫚油的摻偽茶油和純正茶油同時識別出來。模型對預測集識別結果如表3所示,以1.000代表摻有菜籽油的摻偽油樣本的網絡輸出;2.000代表摻有棕櫚油的摻偽油樣本的網絡輸出;3.000代表純正茶油樣本的網絡輸出,可以看出BP模型對預測集樣品的識別準確率誤差較小,模型的預測能力良好。

3 結論與討論

基于近紅外光譜技術,經PCA法壓縮并提取主成分,分別采用馬氏距離聚類分析和BP神經網絡建立了摻有菜籽油、棕櫚油的摻偽油與純正茶油的判別分析模型。從模型結果來看,2種不同的模型面對摻偽油含量較低的濃度下,對預測集樣品的判別準確率均為100%,結果令人滿意。

馬氏距離聚類分析作為類模型基礎上的模式識別方法,一般需要借助化學計量學的手段,經過光譜數據預處理后,方可建立判別模型。這是因為采用PCA法可從自變量矩陣和因變量矩陣中提取主成分,能夠有效降維,明顯地改善了數據結果的可靠性和準確度。然而,摻偽油體系中各組分的含量和光譜吸光度之間存在著非線性關系,采用BP神經網絡建模時,能夠凸顯預測模型數據矩陣響應快速、運算便捷、預測準確的優勢。特別是經PCA處理后,得到樣品光譜吸光度、組分含量的主成分、權重值,能夠為網絡建模時、確定隱含層神經元數量此類重要參數時,提供重要的參考依據。同時,網絡訓練時,可減少迭代次數,跳出局部最少的弊端。

2種模型在訓練中發現,BP網絡模式識別結果比馬氏距離聚類分析更迅速。說明BP網絡作為一種無教師學習的神經網絡,面對更加復雜多元的摻偽體系,突出了自學習、自組織、自適應和容錯能力的優勢,且運算快速,模型精度較高。

參考文獻

[1] 張東生,金青哲,王興國,等.基于脂肪酸組成甄別油茶籽油摻偽的研究[J].中國糧油學報,2015,30(1):124-128.

[2] 蘇東林,張菊華,李高陽,等.近紅外光譜結合化學計量學在茶籽調和油品質檢測中的應用研究進展[J].中國食品學報,2018,18(7):332-338.

[3] 張菊華,朱向榮,尚雪波,等.近紅外光譜結合偏最小二乘法用于純茶油中摻雜菜籽油和大豆油的定量分析[J].食品工業科技,2012,33(3):334-336.

[4] 孫通,吳宜青,李曉珍,等.基于近紅外光譜和子窗口重排分析的山茶油摻假檢測[J].光學學報,2015,35(6):350-357.

[5] YUAN J J,WANG C Z,CHEN H X,et al.Identification and detection of adulterated Camellia oleifera Abel.oils by near infrared transmittance spectroscopy[J].International journal of food properties,2016,19(2):300-313.

[6] LI S F,ZHU X R,ZHANG J H,et al.Authentication of pure camellia oil by using near infrared spectroscopy and pattern recognition techniques[J].Journal of food science,2012,77(4):374-380.

[7] 鄭艷艷,吳雪輝.摻偽茶油的化學模式識別方法研究[J].食品工業科技,2014,35(7):115-118.

[8] 李宗朋,王健,張曉磊,等.基于近紅外光譜技術的沙棘籽油鑒偽方法研究[J].中國油脂,2014,39(2):57-62.

[9] 蔡立晶,蔡立娟,李文勇,等.基于近紅外透射光譜及神經網絡的大豆油質量分析[J].湖北農業科學,2015,54(1):175-177.

[10] 苗靜,曹玉珍,楊仁杰,等.基于二維相關近紅外譜參數化及BP神經網絡的摻雜牛奶鑒別[J].光譜學與光譜分析,2013,33(11):3032-3035.

[11] 榮菡.基于近紅外光譜的模式識別技術用于鮮乳摻假檢測的研究[D].南昌:南昌大學,2008.

[12] 劉波平.近紅外光譜技術在多組分檢測及模式識別中的應用研究[D].南京:南京理工大學,2011.

猜你喜歡
近紅外光譜茶油模式識別
林安娜 茶油飄香 綠色扶貧
茶油飄香
淺談模式識別在圖像識別中的應用
第四屆亞洲模式識別會議
山里茶油郎
茶油總DNA提取技術及擴增適用性
第3屆亞洲模式識別會議
電氣設備的故障診斷與模式識別
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合