?

三維熒光結合化學計量學識別石油污染物的研究進展*

2024-03-13 06:54宋一帆
安全、健康和環境 2024年2期
關鍵詞:油品校正線性

宋一帆

(中石化安全工程研究院有限公司,山東青島 266104)

0 前言

三維熒光光譜技術是一種能夠同時獲取熒光強度隨激發波長和發射波長變化關系的熒光技術,其數據信息量大的優勢使其有望實現對復雜有機體系中熒光物質的快速識別與分析。石油作為現階段的重要能源,在開采、加工、運輸過程中極易通過跑、冒、滴、漏等途徑進入海水、河流、土壤中,造成嚴重的環境污染[1],因此迫切需要開發污染油種的分析測定技術和鑒別方法實現對油種的快速檢測與識別。石油是由脂肪烴、脂環烴和芳香烴等多種組分組成的混合物[2],其含有的芳香烴能夠產生熒光響應,因而可通過三維熒光光譜法開展對石油體系的研究工作。但石油中的芳香烴種類繁雜,導致其熒光光譜出現嚴重的光譜重疊現象,難以實現對特定組分的定性和定量分析[3]?;瘜W計量學方法因為能夠實現以“數學分離”代替“化學分離”[4]而被廣泛用于處理復雜的三維熒光光譜數據,實現對石油組分的識別和定性定量分析。

本文介紹了近年來三維熒光光譜技術和化學計量學法相結合進行石油類污染物種類識別的研究進展,著重描述了主成分分析、三線性分解算法、數字圖像處理、高階校正算法等化學計量學算法的原理、優缺點及優化過程,并提出三維熒光光譜數據解析方向算法的展望。

1 主成分分析

1.1 方法原理

主成分分析是一種掌握主要矛盾的統計分析方法,在保證數據信息損失最小的前提下,通過線性變換,以少數新的綜合變量取代原有的多維變量[5],以達到將高維向量映射到維數較低的特征空間的目的。其數據處理過程是將原變量進行轉換,使數據降維,所得的新變量為主成分,是原變量的線性組合,相互之間呈正交關系,互不相關[6]。然而,主成分分析類算法在分析三維熒光光譜數據時,仍然只提供對于數據的定性表征,它僅具有抽象的數學意義,幾乎不包含化學信息[7]。

1.2 應用

近年來,主成分分析法被廣泛應用于解析復雜礦物油樣品的三維熒光光譜數據[8],其與可拓神經網絡算法聯用可實現對同一類型油及其風化衍生物、單一油品、混合油品的識別[9]。

尹曉楠,等[10]將三維熒光光譜法與主成分分析算法相結合應用于海面溢油源的識別。將獲取的不同風化時間的光譜轉化為矢量數據并計算特征峰強度比值,運用主成分分析法提取矢量數據的特征因子,綜合使用特征峰比值、主成分分析的主成分因子實現對海面溢油源風化程度的判定。劉玉樂,等[11]采用主成分聚類分析法解析3種不同型號汽油(90#、93#和97#)的三維熒光特性,發現不同標號汽油的熒光數據經處理后分別處于不同的象限,結果表明該方法可定性識別汽油的種類。

尚云鵬,等[12]提出可拓神經網絡結合主成分分析法對單一油品樣本(柴油、煤油、汽油)的三維熒光光譜進行分類識別。運用主成分分析法對三維熒光光譜數據降維處理并將提取的統計平均值、標準差等多個特征參數進行可拓神經網絡分類識別,結果表明可拓神經網絡算法分析經主成分分析降維處理后的數據時,識別的效率和準確率均顯著高于其直接分析油品的三維熒光光譜數據。張立國,等[13]更是結合主成分分析法和可拓神經網絡算法實現了混合油品(汽油、柴油)的種類鑒別和濃度測量。

孔德明,等[14]對比了運用主成分分析和稀疏主成分分析方法對所得不同種類油品(柴油、航空煤油、汽油、潤滑油)的三維熒光光譜數據進行特征提取后進行分類識別的準確率。研究發現,稀疏主成分分析法得到的提取信息進行油品分類時可以明顯提高模型識別的準確率,表明優化后的算法所提取的特征參量更具代表性,能夠有效減少非必要數據的影響。

2 三線性分解算法

2.1 方法原理

對于三維數據的分析可以采用三線性分解算法,三線性分解算法的顯著優勢是分解結果的“唯一性”以及“二階優勢”,即當預測樣品中含有校正樣品不存在的干擾組分時仍然可以對感興趣組分進行準確分辨[15]。常用于三維熒光光譜數據分析的三線性分解算法有平行因子分析(PARAFAC)、交替懲罰三線性分解(APTLD)和自加權交替三線性分解算法(SWATLD),其中最為典型的是平行因子分析。平行因子分析是一種基于交替最小二乘原理實現多維數據矩陣分解的算法[16]。該算法對多維數據分解的過程見式(1)。

(1)

式中:i——激發波長的個數,1,2,……,I;

j——發射波長的個數,1,2,……,J;

k——實驗樣本的個數,1,2,……,K;

xijk——三維響應矩陣X中的元素;

ain——相對激發矩陣AI×N中的元素;

bjn——相對發射矩陣BJ×N中的元素;

ckn——相對濃度矩陣CK×N中的元素;

eijk——殘差矩陣EI×J×K中的元素;

N——矩陣AI×N,BJ×N,CK×N的列數[17]。

在三維熒光分析中,PARAFAC模型有實際的化學意義,實驗樣本測得的熒光光譜數據組成I×J×K型的三維響應矩陣X。當用三線性算法分解三維熒光數據矩陣時,需先采用對半分析、殘差分析、核一致分析等方法確定擬合三維熒光數據矩陣的三線性模型時所需要的最小因子數后,再對三維熒光數據矩陣進行分解[18]。

2.2 應用

將平行因子分析法用于解析泄漏石油的熒光激發發射矩陣,運用核一致法和殘差分析法對組分數進行估計,可以識別出石油污染物中典型的包括苯、甲苯、萘、蒽、菲等在內的石油組分[19-23],因而被廣泛應用于跟蹤、監測石油類污染物的演變。此外,該方法與模式識別算法相結合,可用于石油污染物種類識別。

周艷蕾,等[24]將平行因子算法應用于海上溢油油品(原油、燃料油)三維熒光光譜數據的解析,獲得油品熒光成分組成,通過聚類分析算法構建熒光標準譜庫后與非負最小二乘法聯用實現油品種類的快速識別。

考慮到三維熒光光譜法具有便攜、快速的優點因而將其用作油品的初步篩選以作為氣相色譜質譜法(GC-MS)的補充,MIRNAGHI,等[25]利用平行因子算法建立了包含輕質、中質、重質原油,燃料油,瀝青和柴油在內的100多個油樣的三維熒光指紋模型并對上述油品進行分類,其分類結果用GC-MS得到了驗證,證明平行因子結合三維熒光的方法可以作為常規GC-MS指紋識別的補充。

孔德明,等[26]利用平行因子算法處理包括柴油、航空煤油、汽油、潤滑油在內的單一油品樣本的三維熒光數據矩陣,運用主成分判別分析(PCA-LDA)算法、K最近鄰(KNN)算法以及偏最小二乘判別分析(PLS-DA)算法分別建立的分類模型對待測樣本進行識別且識別準確率分別高達90%,85%和94%,表明三維熒光光譜技術結合平行因子分析算法和模式識別方法可快速識別礦物油種類。但是上述方法中的模式識別算法僅對平行因子校正方法解析得到的濃度得分矩陣進行分類,并沒有利用具有定性意義的載荷矩陣,即只利用樣本所含化學成分的相對含量差異對樣本進行了分類,并沒有從樣本所含化學成分本身實現對樣本的定性。因此,崔耀耀,等[27]提出建立同時考慮樣本化學成分相對含量以及化學成分本身差異的分類模型。利用平行因子分析算法重構去除異常光譜的剩余光譜,重構光譜同時包含濃度得分矩陣和載荷矩陣,通過偏最小二乘判別分析(PLS-DA)建立基于重構三維熒光光譜的分類模型。結果表明,相較于以未重構的三維熒光光譜建立的模型對單一油品樣本(汽油、柴油、航空煤油、潤滑油)的識別準確率分別為100%,50%,60%和20%,基于重構三維熒光光譜的分類模型對4種油品的識別準確率均高達100%。

陳曉玉,等[28]將三維熒光偏導數光譜與平行因子算法結合,提出了一種混合油品(航空煤油、潤滑油)組分準確檢測的方法。證明在混合油品三維熒光光譜三線性較差的情況下,利用平行因子算法對Savitzky-Golay求導得到的三維熒光偏導數光譜的進行解析,能夠顯著提高解析譜和標準譜的擬合效果,提高組分定性檢測的準確率。陳至坤,等[29]利用交替迭代最小二乘法原理改進平行因子算法,彌補其存在的迭代收斂速度慢,對組分數敏感的缺陷。用改進后的平行因子算法分析混合油品(煤油、柴油、汽油)的三維熒光光譜數據,結果表明改進后的算法分解得到的激發發射光譜圖效果更好,組分識別更準確。

平行因子分析是采用交替最小二乘原理的迭代類型三維樹陣分解算法,該算法能夠在干擾存在下對特定組分進行定量測量,但其僅在正確估計組分數的情況下才能得到精確的解。自加權交替三線性分解算法則對組分數不敏感,穩定性高。因此,程朋飛,等[30]采用自加權交替三線性分解算法對汽油、柴油混合溶液的三維熒光光譜數據進行分解,發現采用該算法定量分析預測所得的油品濃度準確率高,表明其對混合油類物質有較高的分辨能力??椎旅?等[31]利用交替懲罰三線性分解算法(APTLD)解析混合油液樣本(航空煤油、潤滑油)的三維熒光光譜數據所得油品的熒光光譜與油品本身真實的熒光光譜相似度高,表明該算法可實現對混合油液中油品成分的準確識別。

3 數字圖像識別

3.1 方法原理

近年來,數字圖像識別方法已被應用于處理通過三維熒光技術、高效液相色譜耦合二極管陣列檢測技術(HPLC-DAD)[32]等獲取的高維數據。圖像的基本屬性是形狀,因此利用包括Zernike矩、Geometric矩、Legendre矩、Tchebichef矩等構成形狀的像素來提取灰度圖像的特征信息可以描述具有復雜邊界的形狀。以Zernike矩為例,Zernike矩的優點包括穩定性、抗魯棒性、運算速度快等[33]。以f(x,y)為數字圖像的密度分布函數,Zernike矩(Znm)的表達式如式(2)~(4):

其中:x2+y2≤1

(2)

(3)

(4)

式中:n——非負整數;

m——正整數或負整數;

Vnm*——共軛復數;

Vnm(ρ,θ)——計算Zernike矩的變換核,將歸一化的像素坐標映射到極坐標下;

k——0~(n-|m|)/2之間的整數變量;

θ——0~2π之間的角度;

Rnm(ρ)——(ρ,θ)極坐標下的Zernike徑向多項式。

3.2 應用

同種礦物油在不同溶劑中的三維熒光光譜峰的峰位置、熒光強度均會出現一定程度的改變,這增加了礦物油種類鑒別的難度??紤]到組分種類及含量相近的油樣光譜特征相似度高,光譜形狀的變化規律隨組分及含量的改變也較為明顯,因此,常采用數字圖像識別算法獲取油品的三維熒光光譜數字圖像特征用于油類樣本的分類識別。

楊子臣[34]將單一油品(機油、柴油、汽油)的三維熒光譜圖解釋為一個目標在不同場景下的圖片,利用Scale Invaritant Feature Transform(SIFT)算法解析不同油品對應的圖片,提取礦物油三維光譜指紋圖特征,構建不同油品的SIFT特征集合。在所設置的閾值范圍內,將未知油品的指紋圖與各個SIFT特征集合相匹配,成功實現對單一油品種類的鑒別。

孔德明,等[35]提出了一種基于三維熒光光譜和數字圖像識別的混合礦物油品種類識別方法。利用求導及灰度化預處理將熒光光譜儀獲得的樣本的三維熒光光譜數據轉化為三維熒光導數光譜灰度圖,利用Zernike矩提取灰度圖的形狀、紋理、顏色等數字圖像特征,通過Fisher判別分析建立的混合礦物油樣本分類模型能夠對混合油樣本進行分類和識別,實現對樣本的定性分析,通過逐步回歸建立的混合油樣本各組分定量模型的線性關系顯著,相關性R大于0.99,能夠實現對樣本中特定組分的準確定量。

4 高階校正算法

4.1 方法原理

高階校正算法通過引入新維度的信息來構建高維數據矩陣,能夠包含更加完整的數據特征信息,理論上,對于多種物質混合組成復雜體系中感興趣組分的定性定量結果也應更準確[36]。以交替懲罰四線性分解(APQLD)模型為例,該模型是在三線性分解模型的基礎上將其擴展為四維得到的。在三維熒光光譜數據分析中,在選定的激發和發射波長范圍內,利用熒光光譜儀測量一個樣本的熒光光譜數據,得到階數為I×J的二維光譜矩陣,其中,I為激發波長掃描個數,J為發射波長掃描個數,在所設定的L個實驗條件下,對同一樣本進行測量,得到階數為I×J×L的三維光譜矩陣,最后將K個樣品的三維光譜矩陣疊加,即可得到階數為I×J×L×K的四維光譜矩陣X。利用四線性分解算法對四維光譜矩陣進行分解,表達式見式(5):

(5)

式中:xijlk——四維響應矩陣X中的元素;

ain——相對激發矩陣中的元素;

bjn——相對發射矩陣中的元素;

cln——相對濃度矩陣中的元素;

dkn——第四矩陣中的元素;

eijlk——殘差矩陣中的元素。

4.2 應用

三維熒光光譜數據通常用主成分分析、三線性分解、圖像識別等二階校正算法進行處理,二階校正算法可以在有未知干擾物存在的情況下對感興趣組分進行定性、定量分析。但對于多種類混合的油類污染物,其光譜重疊嚴重,而高階校正算法除具有“二階優勢”外,還具有更高的選擇性和靈敏性,可以更好地解析高共線性和背景干擾的重疊光譜。

楊哲,等[37]提出在三維熒光光譜中增加一維溫度信息構造激發波長-發射波長-溫度-樣品的四維熒光光譜數據陣列,利用四維平行因子算法(4-PARAFAC)和交替懲罰四線性分解(APQLD)算法進行三階校正分析。結果表明采用三階校正算法解析增加溫度維度的四維熒光光譜能顯著提高混合油品樣本(柴油、汽油、機油)中單一油品種類的識別和濃度的精確檢測。

王玉田,等[38,39]通過Savitzky-Golay多項式將三維熒光光譜法得到三維數組疊加而成的五維數組,然后運用展開偏最小二乘法/殘差四線性分析 (U-PLS/RQL) 四階校正算法解析五維數據并建立校正模型,結果表明盡管平行因子法和展開偏最小二乘法均能實現對混合油品(汽油、煤油、柴油)樣本中單一油品組分的識別和濃度預測,但偏最小二乘具有四階算法的優越性,分析結果更準確。

5 其他校正算法

PARAFAC基于嚴格意義上的最小二乘原則,具有抗噪聲強、模型穩定、微小預期誤差等優點,可以實現三維數據陣列的最佳擬合,但該算法收斂速度較慢,對組分數敏感。ATLD算法通過提取對角主元和切尾奇異值求解廣義逆,極大提高了收斂速度并降低了對組分數的敏感度,從而實現三線性分解。然而,取對角元時易使ATLD方法對噪聲敏感。SWATLD算法既繼承了對組分數不敏感、收斂速度快等優點,又降低了噪聲水平的影響。但是在抗共線程度方面,SWATLD算法在抵抗共線性程度方面的能力較ATLD略有降低。

基于此,CHEN,等[40]為了實現二階校正算法的優勢互補,提出了三線性迭代方法的組合算法(Algorithm Combination Methodology,ACM),將PARAFAC、ATLD和SWATLD算法組合在一起來對混合礦物油(柴油、汽油、煤油)樣品的三維熒光光譜數據進行解析,結果表明,該組合算法能實現對油品種類的識別。

MARYAM,等[41]首次運用快速、無損的傅里葉變換近紅外光譜和三維熒光光譜技術表征潤滑油,結合偏最小二乘判別算法提取光譜特征來識別潤滑油的種類,并將分類識別結果應用于評價潤滑油的使用效率。TIAN,等[42]運用奇異值算法提取油品樣本(汽油、煤油、潤滑油、原油)三維熒光光譜數據的統計特征(平均值、標準差、重心等),結合聚類分析法成功實現對上述油品樣本的識別且準確率高達90%。和采用主成分分析算法提取石油樣本的三維熒光譜圖特征相比,二維線性判別分析(2D-LDA)算法在數據處理過程中能夠保證同類樣本盡可能接近的同時不同類樣本盡可能分離,因而使得經2D-LDA降維后的數據更易被區分??椎旅?等[43]采用2D-LDA法提取包括柴油、汽油、航空煤油、潤滑油在內的4種不同油品樣本的光譜特征,利用K最近鄰(KNN)算法根據結合了發射和激發光譜特征的數據建立分類模型,結果表明該模型對樣本分類的準確率為100%,顯著優于采用PCA進行特征提取時85%的識別準確率。姜聰聰[44]利用小波變換方法將樣本(原油、燃料油)的三維熒光光譜分解為多個反應不同信息的小波函數,選取其中與待測組分有關的小波函數作為特征變量進行Bayes判別分析,成功實現原油、燃料油的識別。LV,等[45]利用小波神經網絡算法(WNN)在EEMs的基礎上,得到礦物油的種類與奇異值特征向量之間的映射關系。實驗結果表明,小波神經網絡能夠實現對不同礦物油的識別,識別正確率達到95%。

BRO,等[46]基于三線性分解和偏最小二乘法提出二階校正算法-三維偏最小二乘法(three-way Partial Least Squares,tri-PLS),王玉田,等[47]利用該方法解析混合油品(柴油、汽油、煤油)樣本的三維熒光光譜數據,并對混合樣本中各組分的油品濃度進行了預測。結果表明相較于平行因子二階校正算法,tri-PLS的建模效果和預測精度均有顯著提高。DIVYA,等[48]運用N-way partial least squares regression(N-PLS)解析柴油-煤油混合溶液的三維熒光光譜數據,結果表明,相較于平行因子算法和展開偏最小二乘回歸(unfold PLS),N-PLS由于同時考慮了光譜信息和濃度信息而具有最高的識別準確率。

6 方法對比

主成分分析算法在分析數據時提取關鍵特征變量替代多維變量的過程中會損失一些成分信息,使其難以用于灰色體系中成分含量的測量。面對當下日益復雜的分析體系,三線性分解算法等二階及更高階校正算法可以實現未知干擾共存下,對感興趣組分的定性分析,因此其在油品泄漏領域的應用趨勢顯著提升。但對于處理不嚴格服從三線性、多重共線性類數據時,現有解析算法普遍存在收斂速度慢、結果偏差大等缺陷。4類化學計量學算法對比如表1所示。

表1 4類化學計量學算法對比

7 展望

鑒于以上分析,后續三維熒光與化學計量學結合應用于石油類污染物識別的工作應圍繞以下方面開展:

a) 繼續開發新型高階校正算法,滿足高階數據分析需求,確保能夠實現對于豐富的高維數據快速、準確解析。

b) 持續開發針對油品泄漏監檢測的新方法、新技術,包括且不局限與光譜法、色譜法,與化學計量法結合實現油品精準識別。

c) 進一步優化包括線性分解等在內的經典二階校正算法,提高經其解析后數據的可靠性、穩定性和特異性,便于其與模式識別算法結合以建立油品識別模型。

猜你喜歡
油品校正線性
漸近線性Klein-Gordon-Maxwell系統正解的存在性
高端油品怎么賣
油品運輸市場一年走勢圖
SP/GF-6規格分析及油品性能要求
線性回歸方程的求解與應用
劉光第《南旋記》校正
二階線性微分方程的解法
一類具有校正隔離率隨機SIQS模型的絕滅性與分布
機內校正
油品組成對廢橡膠改性瀝青性能的影響
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合