尚宇瀚 孟憲雙 白樺 馬強
(中國檢驗檢疫科學研究院,北京 100176)
隨著國民經濟的持續快速發展,人民生活水平和住房條件不斷提高,家具消費需求呈逐年增長趨勢。名貴木材制品如高值木家具憑借其優良的質地和精湛的工藝,備受消費者青睞,在當前耐用消費品市場中占有重要地位。然而,在經濟利益驅使下,在高值木家具市場中不時出現以假充真、以次充好等欺詐行為,不僅侵犯了消費者合法權益,而且擾亂了行業秩序。因此,高值木家具市場對快速準確鑒別的需求日益增長。
目前,較為常用的木材種類鑒別方法為感官檢驗結合光學顯微鏡觀察[1],這類方法對木材取樣與處理要求較高,過程繁瑣,并且高度依賴檢測人員個人經驗,主觀性較強。為解決上述問題,研究人員結合木材切面微觀構造圖像與計算機圖像識別技術建立木材種類識別方法,獲得了較為理想的識別率[2-5]。然而,這些方法仍需木材切片取樣,所獲樣品信息較為有限。自20 世紀50 年代起,包括應力波法、震動法、超聲波法和計算機斷層掃描法等無損檢測方法開始用于木材的鑒定[6],這些方法無需破壞性采樣,可準確獲取木材密度、力學性能和內部結構等信息,在無損檢測木材表面或內部缺陷、結構材腐朽情況以及評價木制品開裂與老化等方面優勢明顯,但無法獲得木材的化學成分組成信息。相比之下,紅外光譜[7-9]、核磁共振波譜[10]或色譜-質譜聯用[11-13]等技術在分析不同木材樣品的化學組成方面具有突出優勢。由于不同種屬、不同生長階段和不同地理來源的木材樣品通常具有特征性的化學組成,上述鑒別方法可以達到較理想的鑒別效果,但大多需要經過復雜的樣品制備與耗時的色譜分離過程,并且有機溶劑用量較大,越來越難以滿足日益提升的木材種類快速鑒別的需求。
相較于傳統檢測技術,直接質譜分析具有無需樣品制備或僅需簡單處理、操作簡便、檢測效率高和綠色環保等優勢。近年來,Espinoza 研究組[14-15]和殷亞方研究組[16-17]將實時直接分析(Direct analysis in real time,DART)與四極桿-靜電場軌道阱高分辨質譜(Quadrupole-Orbitrap high-resolution mass spectrometry,Q-Orbitrap HRMS)相結合,通過加熱的亞穩態氦氣或氬氣對樣品表面直接進行解吸附電離,并經高分辨質譜檢測和多元統計分析,開發了木材種類快速鑒別方法。上述方法對樣品形貌無嚴格要求,在木材表面普適性好,但仍需將樣品送至實驗室,依賴臺式大型儀器設備,難以實現現場快速檢測。小型便攜式質譜(Miniature mass spectrometry,Mini MS)[18]小巧輕便,并且對工作環境要求不高,在現場快速檢測中展現出巨大的應用潛力,但尚未見其在木材種類鑒別中的研究報道。
本研究分別采用納升電噴霧-小型便攜式質譜(nanoESI-Mini MS)、納升電噴霧-靜電場軌道阱高分辨質譜(nanoESI-HRMS)和超高效液相色譜-靜電場軌道阱高分辨質譜(UHPLC-HRMS),經樣品制備、質譜分析及多元統計分析后,建立了正交偏最小二乘判別分析(Orthogonal partial least squares-discriminant analysis,OPLS-DA)模型。其中,nanoESI-Mini MS 方法的Y變量累積解釋率(R2Y,0.961)略低于nanoESI-HRMS 方法(0.994)和UHPLC-HRMS 方法(0.983),預測相關性(Q2)均大于0.79,并且模型不過擬合,說明模型的解釋性和可預測性較強,均能較好區分黃檀屬與紫檀屬木材樣品。本研究提出的小型便攜式質譜結合多元統計分析可用于木材種類鑒別,有望在高值木家具真偽鑒別方面發揮重要作用。
Miniβ小型便攜式質譜儀,配有不連續大氣壓接口和線性離子阱質量分析器(北京清譜科技有限公司);Q Exactive 靜電場軌道阱高分辨質譜儀(美國Thermo Scientific 公司);UltiMate 3000 超高效液相色譜儀(美國Thermo Scientific 公司);Milli-Q 超純水機(美國Millipore 公司);KQ-600 型超聲波清洗器(江蘇省昆山市超聲儀器有限公司);AB204-S 電子天平(美國METTLER TOLEDO 公司);P-1000 型微電極拉制儀(美國Sutter 公司)。
豆科(Fabaceae)木材樣品(黃檀屬9 種、紫檀屬6 種,經國家木材與木制品性能質量檢驗檢測中心鑒定),具體信息見電子版文后支持信息表S1。甲醇(質譜級,美國Fisher 公司);甲酸(質譜級,美國Sigma公司);硼硅酸鹽玻璃毛細管(美國World Precision Instruments 公司);0.45 μm 尼龍微孔濾膜(美國Pall公司)。實驗用水為超純水(18.2 MΩ·cm)。
1.2.1 噴霧毛細管的制備
將硼硅酸鹽玻璃毛細管水平固定于微電極拉制儀的拉力臂上,加熱并拉伸毛細管中間部分,直至玻璃融化并被拉斷,得到兩個前端尖銳的噴霧毛細管。采用定量移液器向噴霧毛細管中注入樣品溶液,將鉑絲電極插入毛細管中施加電壓,可在毛細管尖端形成電噴霧,供質譜儀檢測。
1.2.2 樣品前處理
nanoESI-Mini MS 和nanoESI-HRMS 分析 用刀片刮取少量木材樣品置于2 mL 聚乙烯離心管中,加入100 μL 甲醇,振搖1 min,用移液器移取10 μL 提取液并注入至噴霧毛細管中。每種木材樣品平行取樣3 次。
UHPLC-HRMS 分析 稱取0.5 g(精確到0.001 g)木材樣品,置于25 mL 具塞比色管中,加入10 mL 甲醇,在室溫下超聲提取30 min。待冷卻至室溫,將提取液轉移至15 mL 具塞聚四氟乙烯塑料離心管中,8000 r/min 離心5 min。取1 mL 上清液,采用0.45 μm 尼龍微孔濾膜過濾后,轉移至2 mL 進樣瓶中。每種木材樣品平行取樣3 次。
1.2.3 nanoESI-Mini MS和nanoESI-HRMS分析條件
nanoESI-Mini MS 正離子模式,噴霧電壓2.0 kV,掃描范圍m/z80~1200,碰撞誘導解離振幅2.7。nanoESI-HRMS 正離子模式,噴霧電壓2.0 kV,離子傳輸管溫度320 ℃,掃描范圍m/z80~1200,歸一化碰撞能量57,質譜數據采集時間窗口40 ms,選取時間窗口內所有質譜數據疊加作為樣品的質譜指紋圖譜,質譜掃描模式為一級質譜全掃描–數據依賴的二級質譜掃描。
1.2.4 UHPLC-HRMS分析條件
色譜柱:Waters ACQUITY BEH Phenyl(100 mm × 2.1 mm,1.7 μm);流動相A 為0.1%甲酸溶液,B 為甲醇;梯度洗脫(0~2 min,5% B;2~5 min,5%~35% B;5~7 min,35% B;7~7.1 min,35%~65% B;7.1~10 min,65%B;10~10.1 min,65%~95% B;10.1~13 min,95% B;13~13.1 min,95%~5%B;13.1~15 min,5%B);流速0.3 mL/min;進樣量2.0 μL;柱溫35 ℃;正離子模式,噴霧電壓3.5 kV,離子透鏡電壓50 V,離子傳輸管溫度320 ℃,輔助氣溫度320 ℃,鞘氣和輔助氣流速(N2)分別為40 和10 arb。質譜掃描模式為一級質譜全掃描-數據依賴的二級質譜掃描,掃描范圍m/z80~1200。
1.2.5 數據處理與多元統計分析
采用Python 3.10.4 環境下編譯的腳本對所得質譜數據進行信號強度歸一化、尋找峰值、質量數對齊與空值填充。其中,質量數對齊通過以下步驟完成:(1)以質量數作為窗口中心,質量容忍度最小值的1/2 作為窗口寬度,建立一系列m/z窗口并構成列表;(2)將質譜數據中各質量數與m/z窗口范圍比較,將落入窗口的m/z及對應信號強度寫入列表,當同時存在多個信號強度時,保留其中最大值;(3)合并所有樣品的m/z列表,移除其中全部為空值的列,形成輸出矩陣。具體實驗設置為:以小型便攜式質譜的全掃描質譜圖進行OPLS-DA 分析,窗口中心列表設為首項80、尾項1201 和公差為1 的等差數列,窗口寬度為±0.5,質量數精確到小數點后1 位數字;以靜電場軌道阱高分辨質譜的全掃描質譜圖進行OPLSDA 分析,窗口中心列表為首項80.00、尾項1200.01 和公差為0.01 的等差數列,窗口寬度為±0.005,質量數精確到小數點后3 位數字。
采用SIMCA 14.1 軟件(瑞典Umetrics 公司)對處理后的木材樣品質譜數據進行主成分分析(Principal component analysis,PCA)與OPLS-DA 分析。在進行分析之前,對原始數據進行帕累托縮放處理(以標準偏差的平方根作為縮放因子)以實現數據標準化。
采用不同質量分辨率的質譜儀采集15 種豆科木材樣品質譜數據,所得nanoESI-MiniMS 譜圖見圖1A。黃檀屬與紫檀屬木材樣品譜圖之間存在差異性m/z,可以采用多元統計分析方法進行分類。以刀狀黑黃檀為例,對nanoESI-Mini MS、nanoESI-HRMS 和UHPLC-HRMS 所得譜圖進行比較,如圖1B 所示,3 種質譜圖之間特征m/z大部分可以互相吻合,但對應離子信號強度存在差別。
圖1 15 種豆科木材樣品的納升電噴霧-小型便攜式質譜(nanoESI-Mini MS)譜圖(A)與刀狀黑黃檀樣品的nanoESI-Mini MS、nanoESI-高分辨質譜(HRMS)和超高效液相色譜(UHPLC)-HRMS 譜圖(B)Fig.1 Mass spectra of (A) 15 kinds of Fabaceae wood samples obtained by nanoelectrospray-miniature mass spectrometry (nanoESI-Mini MS) and (B) Dalbergia cultrate obtained by nanoESI-Mini MS,nanoESI-high resolution mass spectrometry (HRMS),and Ultra high performance liquid chromatography (UHPLC)-HRMS,respectively
基于木材樣品質譜數據分別建立PCA 模型,用于推測基于相同數據建立的OPLS-DA 模型的可靠性。由表1 可見,建立的3 種PCA 模型中,只有模型ⅠA 的累積解釋率R2X(cum)大于0.4(0.614),表明此模型可靠。預測相關性方面,基于HRMS 數據的兩種模型(ⅡA 和ⅢA)的Q2(cum)均低于0.1,表明其預測能力不理想??紤]到3 種模型所用的質譜數據來自相同的樣品,可認為模型ⅡA 和ⅢA 的累積解釋率與預測能力較低是由于質譜數據中噪聲(包括質譜背景信號、溶劑背景等導致的噪聲以及質量分辨率升高帶來的冗余維度等)較大導致的。
表1 3種方法質譜數據擬合的主成分分析(PCA)模型比較Table 1 Comparison of the fitted principal component analysis (PCA) models for MS data fitting by three methods
圖2 為基于不同來源質譜數據的PCA 模型得分散點圖,圖中橫、縱坐標分別代表第一和第二主成分得分值??梢钥闯?,黃檀屬或紫檀屬木材樣品的數據點分布相對集中,其分布區域在模型ⅠA(圖2A)與ⅡA(圖2B)圖中有較大程度重疊,而在模型ⅢA(圖2C)圖中重疊程度較低。值得注意的是,模型ⅢA對第二主成分的累積解釋率R2X[2]僅為0.0967,解釋不充分,得分散點圖中屬于黃檀屬或紫檀屬的數據點群質心距離過近,分類效果不夠理想。此外,模型ⅠA 圖中有數個離群點位于Hotteling′sT2=95%橢圓外,表明此數據組中存在強異常值。當數據組中存在較多噪音時,PCA 模型的組間分離度將隨之降低,進而導致相應的OPLS-DA 模型在統計學上不可靠(過擬合)。在這種情況下,盡管OPLS-DA 模型仍可用于揭示組間分離情況,但所得結果須經過嚴格的交叉驗證,才能確保其有效性[19]。
圖2 PCA 模型得分散點圖(綠-黃檀屬;藍-紫檀屬):(A)nanoESI-Mini MS;(B)nanoESI-HRMS;(C)UHPLC-HRMSFig.2 Score scatter plots of PCA models(Green-Dalbergia spp.,Blue-Pterocarpus spp.):(A)nanoESI-Mini MS;(B) nanoESI-HRMS;(C) UHPLC-HRMS
分別采用基于不同來源質譜數據擬合的OPLS-DA 模型對15 種木材樣品進行分類,并比較離子化方式和質譜儀質量分辨率等因素對鑒別結果的影響,相關OPLS-DA 模型解釋率數據列于表2。對于OPLSDA 模型,R2X(cum)代表其所能解釋的X預測性與正交性變異之和。在模型建立過程中,被選為X自變量的m/z數據量龐大,將導致模型中預測性變異(與Y相關的X變異)以及正交性變異(與Y不相關的X變異)數值均偏低,噪聲偏高。本研究中,nanoESI-Mini MS 和nanoESI-HRMS 質譜數據的OPLS-DA 模型(ⅠB 和ⅡB)的R2X(cum)分別為0.313 和0.339??紤]到在質譜數據處理過程中,Mini MS 質量數因有效數字位數較少,其X變量數少于HRMS 數據,噪聲相對較低,可以認為在R2X(cum)相近的情況下,模型ⅠB 質量更好。相比之下,模型ⅢB 受超高效液相色譜溶劑背景與精確質量數有效數字共同影響,噪聲更高,R2X(cum)僅為0.258,解釋能力遜于另外兩種模型。R2Y(cum)代表模型所解釋的Y的總變化量,本研究中3 種模型的R2Y(cum)分別為0.961、0.994 和0.983,對Y變量的解釋均較充分,分類效果較好。Q2(cum)代表模型預測的良好程度,由表2 可見,nanoESI-HRMS 和UHPLC-HRMS 質譜數據的OPLS-DA 模型(ⅡB 和ⅢB)的Q2(cum)均大于0.950,表明其預測能力良好。模型IB 的Q2(cum)值雖然相對較低(0.799),但大于0.5,表明此模型仍具有較好的預測能力,可以滿足不同屬木材樣品鑒別要求。
表2 3種方法的質譜數據擬合的正交偏最小二乘判別分析(OPLS-DA)模型比較Table 2 Comparison of the fitted orthogonal partial least squares-discriminant analysis (OPLS-DA) models based on MS data from three methods
圖3 展示了不同來源質譜數據擬合的OPLS-DA 模型的得分散點圖與對應的置換檢驗結果。由得分散點圖(圖3A~3C)可見,3 種模型均可實現對不同屬木材樣品數據點的良好區分。同時,為了識別離群值,對不同來源質譜數據進行Hotteling′sT2檢測。結果表明,在模型ⅠB 和ⅡB 中未發現離群值,而在模型ⅢB 中存在中等離群值(P5 和P6)。通過置換分析對3 種OPLS-DA 模型的可靠性進行評估(圖3D~3F),所有置換后的R2均小于或接近0.6,Q2均小于0,并且所有R2與Q2均小于右側原始值,表明3 種模型的擬合均有效,不存在過擬合情況。圖4 展示了3 種OPLS-DA 模型的S-plot 圖,圖中X軸與Y軸分別代表變量與OPLS-DA 模型預測成分的協方差載荷(p[1])及相關系數(p(corr)[1]),紅色高亮代表VIP 值大于1 的變量。相關系數絕對值大于0.05 的變量通常被認為對分類具有統計意義,考慮到本研究的各組數據中變量較多,選取協方差絕對值大于0.1 的變量作為黃檀屬和紫檀屬木材樣品的差異性質量數。結果表明,在不同來源數據擬合的OPLS-DA 模型中,對分類貢獻較大的質量數不盡相同,但m/z255(255.09、255.10 和255.11)和m/z285(285.08 和285.11)在所有模型中均為重要變量。
圖3 OPLS-DA 模型的得分散點圖與置換檢驗結果(綠-黃檀屬;藍-紫檀屬):(A、D)nanoESI-Mini MS;(B、E)nanoESI-HRMS;(C、F)UHPLC-HRMSFig.3 Score scatter plots and permutation test results of OPLS-DA models (Green-Dalbergia spp.,Blue-Pterocarpus spp.): (A,D) nanoESI-Mini MS;(B,E) nanoESI-HRMS;(C,F) UHPLC-HRMS
圖4 OPLS-DA 模型的S-plot 圖(紅色圓圈代表VIP>1 的變量):(A)nanoESI-Mini MS;(B)nanoESIHRMS;(C)UHPLC-HRMSFig.4 S-plots of OPLS-DA models(Red circles represent variables with VIP values >1):(A)nanoESI-Mini MS;(B) nanoESI-HRMS;(C) UHPLC-HRMS
基于木材樣品質譜數據,進一步擬合OPLS-DA 模型,并對黃檀屬9 種木材樣品生物學種類進行區分。如圖5 所示,在nanoESI-Mini MS 和nanoESI-HRMS 質譜數據的OPLS-DA 模型的得分散點圖(圖5A和5B)中,代表黃檀屬不同種木材樣品的數據點各自成簇,nanoESI-HRMS 模型的簇間分離度略優于nanoESI-Mini MS 模型。在UHPLC-HRMS 質譜數據的OPLS-DA 模型中,屬于刀狀黑黃檀(D1~D3)與盧氏黑黃檀(D10~D12)的簇相互重疊,分離效果不理想。通過置換分析對3 種OPLS-DA 模型的可靠性進行了評估,由圖5D~5F 可見,所有R2與Q2均小于右側原始值,表明3 種模型不存在過擬合。此結果表明,在對同屬少量木材樣品進行種類區分時,nanoESI-Mini MS 和nanoESI-HRMS 的OPLS-DA 模型表現優于UHPLC-HRMS 模型。
圖5 黃檀屬樣品OPLS-DA 模型的得分散點圖與置換檢驗結果:(A、D)nanoESI-Mini MS;(B、E)nanoESI-HRMS;(C、F)UHPLC-HRMSFig.5 Score scatter plots and permutation test results of OPLS-DA models for classification of Dalbergia spp.:(A,D) nanoESI-Mini MS;(B,E) nanoESI-HRMS;(C,F) UHPLC-HRMS
參考文獻[20-21]的方法,選取刀狀黑黃檀(Dalbergia cultrata)樣品中黃檀素(Dalbergin)作為目標化合物進行二級質譜分析,結果如圖6 所示。由全掃描質譜圖(圖6A 和6B)可見,難以通過精確質量數確定對應化合物的元素組成。然而,當選取m/z269.0(269.08070)進行二級質譜分析時,HRMS 與MiniMS 質譜圖可以相互印證(圖6C)。其中,碎片離子m/z254 來自黃檀素分子7-甲氧基脫甲基產生的[M+H–CH3]+,m/z238 為7-甲氧基脫落產生的[M+H–CH3O]+,m/z225 為己內酯環脫羧產生的[M+H–CO2]+,m/z212為己內酯環碎裂產生的[M+H–C2HO2]+,m/z192 為4-苯基脫落產生的[M+H–C6H5]+,而m/z181 則來自黃檀素分子同時發生7-甲氧基脫落與己內酯環碎裂。上述結果表明,二級質譜產生的碎片離子與母離子結構相關性較好,具有二級質譜分析功能的小型便攜式質譜也可實現對木材樣品中特定化合物的結構分析。
圖6 對刀狀黑黃檀樣品中黃檀素的一級質譜全掃描和二級質譜分析:(A)采用nanoESI-Mini MS 和nanoESI-HRMS 采集全掃描譜圖;(B)圖6A 中m/z 250~270 局部放大質譜圖;(C)m/z 269 的二級質譜分析Fig.6 Full-scan MS and MS/MS analysis of dalbergin in Dalbergiacultrata sample:(A)Full-scan MS spectrum obtained by nanoESI-Mini MS and nanoESI-HRMS;(B) Partial enlargement of full-scan MS spectrum at m/z 250–270 in Fig.6A;(C) MS/MS analysis of m/z 269
通過小型便攜式質譜結合多元統計分析實現了黃檀屬與紫檀屬共15 種木材樣品的高效鑒別,并在模型質量、差異性因子和鑒別效果等方面與高分辨質譜所采集數據進行了比較。結果表明,盡管納升電噴霧直接質譜分析方法與色譜-質譜方法相比缺少色譜分離維度,并且小型便攜式質譜的質量分辨率低于高分辨質譜,但基于納升電噴霧-小型便攜式質譜數據建立的多元統計分析方法仍可滿足木材樣品的鑒別需求,具有良好的應用前景。
支持信息
Supporting information
表S1 15 種豆科木材樣品種屬信息與數據編號Table S1 Species information and data numbers of 15 kinds of Fabaceae wood samples