?

升麻的1H—NMR指紋圖譜—模式識別研究

2013-04-22 02:28沈莉,趙燕燕,謝洪平,劉萬卉
中國中藥雜志 2013年2期
關鍵詞:升麻三萜模式識別

沈莉,趙燕燕,謝洪平,劉萬卉

[摘要] 目的:建立一種基于1H-NMR指紋圖譜-模式識別的不同品種升麻的鑒別方法。方法:以1H-NMR技術測定升麻中三萜皂苷類特征提取物的信息,并轉化為數據矩陣,采用化學模式識別方法中的主成分分析(PCA)及判別偏最小二乘(DPLS)法進行識別分析。結果:1H-NMR指紋圖譜-模式識別能夠有效地鑒別不同品種的升麻樣本。結論:1H-NMR指紋圖譜-模式識別是一種有效的藥材分類鑒別方法,可以作為藥材質量控制的手段之一。

[關鍵詞] 升麻;1H-NMR指紋圖譜;模式識別;主成分分析;判別偏最小二乘;三萜皂苷

升麻是典型的多基源藥材,我國境內有升麻屬植物8種,僅作為正品升麻而被2010年版《中國藥典》所收載的就有3種,包括升麻Cimicifuga foetida L.(西升麻)、大三葉升麻C. heracleifolia Kom.(關升麻)和興安升麻C. dahurica (Turcz.) Maxim.(北升麻)[1]。

化學研究表明,升麻屬植物的主要成分為9, 19-環菠蘿蜜烷型四環三萜及其苷類,迄今為止,已從各種升麻中分離得到近200種三萜皂苷類化合物[2-3],以西升麻為原料的三萜總皂苷提取物制劑已成功在國內上市,用于女性圍絕經期綜合征的治療[4-5]。在其原料藥材質量評價和控制過程中不可避免地要涉及升麻品種鑒別的問題,由于西升麻中不含或幾乎不含阿魏酸和異阿魏酸[6-7],采用2010年版《中國藥典》方法顯然不能滿足其品種鑒別的要求。本研究以升麻中的三萜皂苷類化合物為對象,首次采用1H-NMR指紋圖譜結合模式識別的方法對升麻進行研究,以1H-NMR為識別變量,運用多種數據分析方法建立了不同品種升麻的識別模型,為升麻的品種鑒別和質量評價提供了一種行之有效的控制手段。

1 材料

升麻藥材(表1)均采自甘肅隴南地區及四川九寨地區,大三葉升麻和興安升麻均購自產地。所有藥材均經煙臺大學藥學院生藥教研室趙燕燕副教授鑒定。

Bruker AV400型核磁共振波譜儀,QYJ直切式切片機,SF-300高速粉碎機,SK1200H超聲清洗機,LP5-2A型低速離心機,HSC-24A型氮吹儀,FDU-1100型冷凍干燥機。氘代吡啶(CIL公司),甲醇(分析純,天津四友生物醫學技術有限公司)。

2 方法

2.1 甲醇提取物的制備

藥材稱重后用切片機進行切片,篩去泥土和須根,用高速粉碎機將藥材粉碎,經充分研磨后過65目篩,取適量樣品置于烘箱中,75 ℃下烘3 h后稱取1.0 g干燥粉末置于50 mL塑料離心管中,加入20 mL 70%甲醇,超聲提取30 min后以3 000 r·min-1離心10 min,取上清液在氮吹儀中揮干甲醇,加入適量蒸餾水,混勻后冷凍干燥,凍干粉末置于干燥器中避光保存。

2.2 1H-NMR測定及圖譜處理

準確稱取升麻甲醇提取物凍干粉末20 mg置于5 mm核磁管中,加入0.5 mL氘代吡啶溶解后進行1H-NMR測試。測試用脈沖序列為noesypr1d,譜寬為8 000 Hz,掃描次數128次,采樣時間為4.09 s,弛豫時間為10 s,混合時間為0.6 s,溫度為25 ℃,在δ 6.04處壓制水峰。

通過核磁共振譜儀自帶的XWIN-NMR3.5軟件進行傅里葉變換,氘代吡啶在1H-NMR譜中呈現3個溶劑峰,將中間的溶劑峰定標為δ 7.57,手動調整相位后保存。將此FID文件導入MestReNova軟件,調整基線后,將最低場的溶劑峰(δ 8.77~8.67)峰面積定為1,從δ 6.95到δ 0.00以0.01為間隔進行積分,產生695個數據點。

2.3 模式識別方法

模式識別是化學計量學研究中十分重要的內容,通過對復雜的化學量測數據的分析而揭示物質的隱含性質。本研究綜合運用了多種模式識別方法對1H-NMR指紋圖譜所提供的數據進行分析研究。所有模式識別分析均通過Matlab 7.0軟件完成。

2.3.1 主成分分析(principal component analysis,PCA) 主成分分析是最為常用的一種數據壓縮方法,以最優化方法濃縮及綜合測量矩陣中的信息,減少數據集維數的同時保留數據集中對方差貢獻最大的特征。主成分分析產生2個矩陣,得分矩陣和載荷矩陣。得分矩陣的行和列分別代表主成分(PCs)和不同的樣品,通過得分矩陣的前2或3個主成分作圖,可以獲得直觀的二維或三維聚類圖,從而方便地對不同類別進行判定。載荷矩陣的每1列對應1個主成分,其中的每1數值均代表該主成分與原始變量的相關。對每1列作圖,即獲得該主成分的載荷圖,可以在一定程度上反映引起聚類的相關化學成分[8]。

2.3.2 判別偏最小二乘法(discriminant partial least square,DPLS) 判別偏最小二乘法是一種基于偏最小二乘回歸(partial least square regression,PLSR)的穩健的判別分析方法,是一種有監督的模式識別方法,特別適合于解釋變量數多且存在多重共線性,樣本觀測數少且干擾噪聲大的情況。采用DPLS法對樣本的1H-NMR譜進行分析時,該法可以同時對氫譜矩陣和類別矩陣進行分解,加強類別信息在氫譜分解時的作用,以提取出與樣本類別最相關的波譜信息,即最大化提取不同類別波譜之間的差異,因此PLS方法通??梢缘玫奖萈CA方法更優的分類和判別結果[9]。

3 結果與討論

3.1 升麻1H-NMR指紋圖譜的建立

由典型的西升麻、關升麻和北升麻樣品的1H-NMR譜圖(圖1)可知三者具有高度的相似性,譜峰主要分布在δ 0.0~6.4,以環菠蘿蜜烷型三萜皂苷及糖類化合物的信號為主[10]。其中δ 0.85為19位環丙烷亞甲基中一個質子的特征信號,δ 0.8~1.5為三萜母環上角甲基的共振信號,δ 1.0~3.2則為三萜母環上亞甲基和次甲基質子的吸收峰,δ 3.5~5.2還有三萜母環上部分化學位移靠近低場的質子以及羥基質子的信號,δ 5.2~5.7則為某些三萜皂苷環上雙鍵的烯氫質子信號。糖類化合物的質子信號則出現在δ 4.0~6.4,其中δ 4.1~5.3為糖環上質子信號,δ 6.2處的雙峰為糖端基質子的信號。而在δ 6.4~9.0低場區域,扣除吡啶的溶劑峰,其余多為某些酚酸類或色酮類化合物中部分芳氫質子信號。

譜圖同時也展示了3種升麻因化學成分組成差異以及主要類似成分間相對含量不同而產生的某些化學位移及信號強弱的差別。與西升麻相比,關升麻和北升麻的1H-NMR譜圖中皂苷類化合物的信號強度明顯較低,而糖類、酚酸類及色酮類化合物的信號強度則略高。顯然,關升麻和北升麻中三萜皂苷類物質的含量低于西升麻,而糖類、酚酸類及色酮類化合物的含量則相對較高。

3.2 西升麻與關升麻、北升麻的鑒別

為便于討論,本研究將所有樣本分為2類,第一類為西升麻樣本,第二類為東北升麻樣本,包括關升麻和北升麻。

3.2.1 主成分分析(PCA) PCA方法是一種簡單而行之有效的數據壓縮方法,本研究首先采用此法對所有樣本的1H-NMR數據進行分析。結果表明,前3個主成分的累積貢獻率達到87.2%,說明這3個主成分已經可以對85%以上的原變量信息進行解釋,故選取這3個主成分進行得分圖和載荷圖的分析。

前3個主成分共同表征而成的三維PCA得分圖(圖2),可以清楚地看到西升麻和東北升麻各自聚集成一類,2類樣本之間界限清晰,無相互重疊。說明2類升麻之間確實存在差異,而PCA方法可以利用這種差異對其進行區分。從PC1/PC2,PC1/PC3所作的二維得分圖(圖3),考察這3個主成分對于樣本區分的意義。圖3顯示,西升麻與東北升麻在PC1水平上的區別最為顯著:前者全部聚集在PC1得分值較小或為負值的區域,而后者則分散在PC1得分值相對較大的區域。與之相類似,西升麻的PC3得分值也相對較小,但由于東北升麻在PC3水平上的分布范圍較廣,故無法與西升麻產生明顯的區別。無論是西升麻還是東北升麻,其PC2得分值均在較大范圍內分散分布,沒有明顯的聚集。由此可見,PC1是西升麻與東北升麻分類的富信息變量,而PC2和PC3對該分類沒有顯著的差異,僅僅依賴PC1或PC1/PC2和PC1/PC3均不能獲得理想的分類效果。因此,本研究采用PC1/PC2/PC3作為西升麻與東北升麻的分類識別變量,可獲得理想的分類效果。

通過對PC1和PC2的載荷分析,可以考察引起2類升麻樣本之間區分的因素。主成分的載荷圖中,負峰意味著對主成分分類圖中得分為負的貢獻大,反之,正峰則對主成分中得分為正的貢獻大。

分別對PC1和PC2做載荷分析,可獲得與1H-NMR譜圖類似的載荷圖(圖4),能夠將這些變量與相關的化學位移值一一對應起來,從而更為方便地觀察引起PCA分類的相關化學成分。圖4顯示,δ 0.5~3.0的變量在縱軸上的投影均為負值,該化學位移區間對應升麻中三萜皂苷苷元質子的出峰區域,表明皂苷類化合物的貢獻使PC1得分為負值。其中在縱軸上的投影值最大的變量所對應的化學位移為δ 0.75~0.88及δ 1.05~1.40,前者對應19位亞甲基其中一個質子的信號,后者為三萜母核上多個角甲基質子的信號。而δ 4.0~5.2的變量在縱軸上的投影則均為正峰,但強度較弱,表明糖類化合物的貢獻使PC1得分為正值,但對PC1影響較小。載荷正值較大的變量主要來自化學位移為δ 4.05~5.15,而載荷負值較大的變量來自化學位移為δ 1.25~1.35,3.6~3.9,5.35~5.55等,根據化學位移區間所對應的化合物類別,可知糖類化合物的貢獻使PC2得分為正,而皂苷類化合物的貢獻使PC2得分為負。

由此可見,皂苷類成分是引起PCA分類的主要化學成分,即西升麻與東北升麻之間的差異主要體現在所含皂苷類化合物的量上。與東北升麻相比,西升麻大多處于PC1為負的區域,表明其三萜皂苷類成分的含量較高而糖類化合物的含量略低,這與3種升麻的1H-NMR譜圖對比結果一致。

對于關升麻和北升麻而言,比較其1H-NMR圖譜可以發現,二者之間的相似性遠遠高于其與西升麻的相似性。PCA分類研究也證實了這一點:圖3顯示,無論是在PC1,PC2還是PC3水平上,2種升麻樣本均交叉錯落分布,二者之間存在明顯的重疊。顯然,關升麻和北升麻之間不存在顯著差異。

3.2.2 判別偏最小二乘(DPLS)分析 判別偏最小二乘(DPLS)法是一種有監督的模式識別方法,不僅可以獲得優于PCA方法的分類結果,還可預測未知樣本的類別。本研究通過DPLS方法建立不同品種升麻的判別模型,從而實現西升麻與東北升麻的快速檢測。

每一類升麻樣本都被隨機地分為2個集合,即校正集和預測集。西升麻的校正集中有25個樣本,預測集中有13個樣本;東北升麻則分為20個校正集樣本和10個預測集樣本。首先將校正集樣本作為標準樣本,應用偏最小二乘回歸方法建立校正模型,然后將未參與建模的剩余樣本作為預測樣本,將其1H-NMR數據代入模型中進行分析。

分析結果顯示,以PC1和PC2所作的得分圖(圖5)對2類樣本具有良好的區分效果。所有的西升麻樣本都團聚在一個較小的區域之內,分布較為集中,相比之下,由于將關升麻和北升麻合并作為一類樣本進行分析,所以該類樣本的離散性相對較大,分布范圍也較廣。這一結果說明西升麻樣本之間的差異較小,預示其質量較為穩定;而關升麻和北升麻組成的一類樣本之間的差異則較大,表明它們之間的質量差異較大。

以圖5中所繪虛線為界,西升麻和東北升麻明顯地被區分為2類,彼此間能夠很好地分離且不存在類間重疊,表明所建立的識別模型具有良好的分離度。同時,每一類的預測集樣本都能夠準確地落在校正集的分布范圍之內,也不存在明顯的過擬合現象,表明該模型能夠準確判斷升麻類別,對預測集樣本的正確識別率為100%,并且具有良好的穩健性,從而保證了該方法對于未知升麻品種判別的重復性。

4 結論

升麻屬植物中普遍含有三萜皂苷、酚酸及色酮類化合物,然而不同品種升麻中這些成分的組成及含量存在較大差異,研究表明,西升麻中三萜化合物的含量明顯高于關升麻和北升麻[11-12]。因此,以三萜皂苷類化合物為主要有效成分,臨床用于圍絕經期綜合征等內分泌系統疾病治療時,關升麻和北升麻不能代替西升麻。為確保藥物臨床安全有效,必須嚴格控制原料藥材的質量,有關升麻品種的有效鑒別也就顯得尤為重要。升麻中三萜皂苷類化合物的1H-NMR指紋圖譜能夠提供大量豐富的信息,以此為基礎進行升麻的品種鑒別和質量控制無疑更為真實可靠。

本研究以1H-NMR為識別變量,運用PCA和DPLS方法對不同品種的升麻樣品進行分析,均可實現西升麻與東北升麻(包括關升麻和北升麻)的分類。PCA得分及載荷分析表明,西升麻樣本和東北升麻樣本之間有明顯區別(在PC1水平上),三萜皂苷類化合物是引起這一區分的主要化學成分,此類化合物在西升麻中的含量較高,而在東北升麻中所含糖類等成分的量則較高。通過DPLS方法則可建立穩健的識別模型,該模型具有良好的分離度和穩定性,預測準確率可達100%,能夠實現西升麻樣本和東北升麻樣本之間的快速、準確分類。

以三萜皂苷類化合物為對象的1H-NMR指紋圖譜-模式識別方法是基于藥材特征性總成分的分析方法,其結果能夠更為真實地反映藥材的內在品質,實現不同品種升麻的有效、快速鑒別,是較現有藥典方法更為科學、準確的鑒別方法。

[參考文獻]

[1] 中國藥典. 一部[S]. 2010: 68.

[2] 林玉萍,邱明華,李忠榮. 升麻屬植物的化學成分與生物活性研究[J]. 天然產物研究與開發, 2002, 14 (6) : 58.

[3] 鞠建華,楊峻山. 升麻族植物三萜皂甙的研究進展[J]. 中國中藥雜志, 1999, 24 (9): 517.

[4] 張丹,徐克惠,段秀蓉. 希明婷片治療婦女圍絕經期綜合征的臨床觀察[J]. 現代婦產科進展,2006, 15(12): 934.

[5] 薛賽琴,姜坤,張瓊. 希明婷片治療女性更年期綜合征364例[J]. 中國中西醫結合雜志,2006, 62 (10): 891.

[6] 潘瑞樂,陳迪華,沈連剛,等. 高效液相色譜法測定中藥升麻中阿魏酸和異阿魏酸的含量[J]. 藥物分析雜志, 2000, 20 (6): 396.

[7] 司丹丹,李清,陳曉輝,等. RP-HPLC法同時測定升麻中3種有機酸的含量[J]. 沈陽藥科大學學報, 2007, 24 (12): 727.

[8] 袁洪福,陸婉珍. 現代光譜分析中常用的化學計量學方法[J]. 現代科學儀器, 1998, 5: 6.

[9] 王惠文,吳載斌,孟潔. 偏最小二乘回歸的線性與非線性方法[M]. 北京: 國防工業出版社, 2006: 98.

[10] 鞠建華,劉東,楊峻山. 天然環菠蘿蜜烷型三萜皂苷類化合物的波譜學規律的探討[J]. 波譜學雜志,2001, 18 (1): 79.

[11] 潘瑞樂,陳迪華,斯建勇,等. 反相高效液相色譜法測定不同品種升麻中27-脫氧升麻亭的含量[J]. 中南藥學, 2007, 5 (3): 206.

[12] 姚梅芬,王岳峰,李展,等. 反相高效液相色譜法測定升麻藥材中升麻苷H-1的含量[J]. 天然產物研究與開發, 2011, 23: 696.

Classification of Cimicifuga species based on 1H-NMR fingerprint

combined with pattern recognition technique

SHEN Li1, ZHAO Yan-yan2, XIE Hong-ping3, LIU Wan-hui2*

(1. School of Medicine and Pharmacy, Ocean University of China, Qingdao 266003, China;

2. School of Pharmacy, Yantai University, Yantai 264005, China;

3. College of Pharmaceutical Sciences, Soochow University, Suzhou 215123, China)

[Abstract] The metabolomic analysis of three Cimicifuga species was performed using 1H-NMR spectroscopy and pattern recognition (PR) techniques. A broad range of metabolites could be detected by 1H-NMR spectroscopy without any chromatographic separation. The analysis using principal component analysis (PCA) and discriminant partial least square (DPLS) of the 1H-NMR spectrum showed a clear discrimination between C. foetida and the other two species. The major metabolites responsible for the discrimination were triterpenoid saponins and saccharides. These results indicated that the combination of 1H-NMR and PR provides a useful tool for chemotaxonomic analysis and authentification of Cimicifuga species, and could used for the quality control of plant materials.

[Key words] Cimicifuga; 1H-NMR fingerprint; pattern recognition; principal component analysis (PCA); discriminant partial least square (DPLS); triterpenoid saponin

doi:10.4268/cjcmm20130215

[責任編輯 孔晶晶]

猜你喜歡
升麻三萜模式識別
升麻的品種考證
澤瀉原三萜、降三萜和倍半萜的分離及其抗炎活性研究
升麻之思辨及臨床應用?
升麻蜜制工藝的優化
淺談模式識別在圖像識別中的應用
第四屆亞洲模式識別會議
佩氏靈芝中三個新三萜
茯苓皮總三萜滴丸制備工藝的優化
第3屆亞洲模式識別會議
升麻解毒湯治療慢性鼻竇炎25例
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合