?

氨基甲酸乙酯水解酶的家族生物信息學分析

2022-04-01 08:56李若熙楊麗娟
生物信息學 2022年1期
關鍵詞:水解酶信號肽氨基酸

張 獻,彭 濤,張 耀,李若熙,楊麗娟

(釀酒生物技術及應用四川省重點實驗室(四川輕化工大學),四川 宜賓 644000)

氨基甲酸乙酯(Ethyl carbamate 或Urethane,簡稱EC),存在于多種發酵食品和酒精飲料中,是一種具有致癌性的物質[1-2]。2007年,EC被國際癌癥研究機構IARC(the International Agency for Rescarch on Cancer)歸類為2A類致癌物質[3]。日本、加拿大等[4-5]國家對酒精飲料中EC含量有著嚴格的限量標準。目前消除EC有多種方法,包括對發酵工藝的優化、物理吸附、代謝工程改造酵母以及生物酶法消除等,其中用生物酶法來消除EC被認為是最為理想的一種方法[6]。關于消除EC的生物酶研究中,用于EC消除的酶有兩種,一種是酸性脲酶(Acid urease);另外一種就是氨基甲酸乙酯水解酶(Urethane hydrolase或urethanase)。1990年,Kobashi[7]等日本學者從小鼠腸道中的Citrobactersp.中第一次發現EC水解酶,證實其能夠降解EC。2006年,Akutsu-ShigenoY[8]等從馬紅球菌(RhodococcusequistrainTB-60)中得到了EC水解酶,并實現了該酶的異源表達。李京京[9]等從小鼠的胃中篩選出一株具有EC降解能力的賴氨酸芽孢桿菌LysinibacillusfusiformisSC02,并通過對其蛋白質的N段測序,獲得了該酶的氨基酸序列。EC水解酶存在于多種微生物中,并且不同微生物的EC水解酶的酶學性質差異較大,普遍存在對乙醇和酸的耐受力差、對底物的親和力低的問題[8, 10]。2016年,劉曉慧[11]等人通過計算機輔助以及定向改造技術對來自于賴氨酸芽孢桿菌LysinibacillusfusiformisSC02的EC水解酶進行改造,提高了該酶的溫度穩定性,但其對乙醇的耐受力并未有所提升。此外,EC水解酶的氨基酸序列未得到有效解析。2019年,Masaki[12]等日本學者在假絲酵母Candidaparapsilosis得到了EC水解酶,并獲得了該酶的基因序列。目前,已報道的EC水解酶均屬于酰胺酶家族,從EC分子的結構上來看,酯酶家族部分酶也能夠對其進行水解,但是還未見有酯酶降解EC的報道[6](見圖1)。EC水解酶存在的這些問題限制了EC水解酶的發展與應用。若采用基因工程以及蛋白質工程的手段,對EC水解酶進行分析優化等研究,解決其存在的問題,可進一步推進EC水解酶在食品中的應用。

圖1 氨基甲酸乙酯水解機制[6]Fig.1 Hydrolysis mechanism of urethane[6]

本研究采用生物信息學的方法對EC水解酶進行分析,結合ProtParam、ProtScale、SignalP 5.0 Server、NetPhos 2.0 Server等生物信息學軟件,對微生物的EC水解酶氨基酸序列分別進行理化性質、序列分子進化、親水或疏水性、二級結構、功能域、信號肽以及蛋白的磷酸化等方面進行分析和預測,為下一步EC水解酶的酶分子改造、基因工程菌的構建、表達等奠定基礎。

1 材料與方法

1.1 數據來源

試驗中的EC水解酶(UH)序列均來自美國國家生物信息中心(NCBI)(https://www.ncbi.nlm.nih.gov/)中已收錄的完整的氨基酸序列,分別來自于馬紅球菌、賴氨酸芽孢桿菌以及假絲酵母(見表1)。

表1 氨基酸序列基本信息Table 1 Basic information of amino acid sequence

1.2 方法

采用Expasy網站提供的ProtParam工具對EC水解酶的氨基酸序列進行理化性質分析;親疏水性特征使用Expasy網站的ProtScale工具進行分析;使用在線工具NPSA server中的SOPMA進行微EC水解酶的氨基酸序列二級結構分析和預測[13];使用CDD和SMART[14]對EC水解酶保守結構的分析;EC水解酶信號肽的分析和預測采用工具SignalP 5.0 server;運用TMHMM 2.0 Server進行EC水解酶的跨膜結構域的分析和預測;NetPhosK 3.1 Server進行EC水解酶的氨基酸序列磷酸化位點分析;使用SWISS-MODEL[15]和I-TASSER對EC水解酶進行3D建模,以及使用SAVES[16]對模型進行評價。利用Clustal Omega[17]進行氨基酸的多序列比對分析,并用ESPript3.0進行序列對比的結果顯示。在線分析工具網址(見表2)。

表2 生物學在線分析工具網址Table 2 Websites of online biology analysis tools

2 結果與分析

2.1 EC水解酶蛋白序列理化性質分析

使用ProtParam工具分析3條完整的EC水解酶蛋白序列(見表3)。結果顯示,目前在NCBI上所能檢索到的EC水解酶氨基酸序列中,氨基酸數量在472-551之間,氨基酸數量最大的是假絲酵母,為551 aa,分子量為61.74 kDa左右。理論等電點(pI)范圍在5.03~5.71之間,最大的為Candidaparapsilosis。三個蛋白的負電荷氨基酸殘基總數(Asp + Glu)都大于正電荷氨基酸殘基總數(Arg + Lys)。同時對三個EC水解酶的氨基酸殘基組成也進行了分析(見表4)。發現3個EC水解酶蛋白共有的且含量豐富的主要氨基酸為丙氨酸(Ala)、甘氨酸(Gly)、亮氨酸(Leu)。在蛋白質穩定性方面,RhodococcusequistrainTB-60的EC水解酶不穩定指數為34.70,顯示為較穩定蛋白,其余兩種蛋白為不穩定蛋白。此外,脂肪系數的結果顯示,3個蛋白均表現為親水性。

表3 EC水解酶的氨基酸序列理化性質Table 3 Physicochemical properties of amino acid sequence of urethane hydrolase

表4 EC水解酶家族成員氨基酸組成成分分析Table 4 Analysis of amino acid composition of members of urethane hydrolase family %

2.2 EC水解酶氨基酸序列的親水性/疏水性

經過ProtScale對EC水解酶氨基酸序列進行親水性/疏水性預測。Hphob. /Kyte & Doolittle量表規定疏水性越強的氨基酸標度值越高,當蛋白質的氨基酸標度值大于0時為疏水,小于0時為親水。

在親疏性分析中,馬紅球菌RhodococcusequistrainTB-60的多肽鏈中465位Trp的值為-2.156,親水性最強,第283位Cys的值為2.089,疏水性最強(見圖2a);賴氨酸芽孢桿菌LysinibacillusfusiformisSC02的多肽鏈中第463位Asn的值是-3.344,是最低分,親水性最強,第229位Leu值是1.978,為最高分,疏水性最強(見圖2b);假絲酵母Candidaparapsilosis的多肽鏈中第324位Pro的值為-3.244,親水性最強,第453位Val的值為2.156,疏水性最強(見圖2c);且在親疏水性分析中三種微生物的EC水解酶都屬于親水性蛋白。

2.3 EC水解酶的信號肽及跨膜區預測

利用SignalP 5.0 server對三株菌的EC水解酶的氨基酸序列進行信號肽分析,都表示EC水解酶的氨基酸序列不含有信號肽(見圖3)。

利用在線工具TMHMM 2.0 Server對三株菌的EC水解酶的跨膜區進行分析及預測,3株菌的EC水解酶在膜內的概率為0,在膜外的概率為100%(見圖4),說明EC水解酶不存在跨膜結構域。

2.4 EC水解酶的磷酸化位點預測

磷酸化作為蛋白質翻譯后的修飾之一,在細胞的信號轉導中起著重要的作用[18]。蛋白質的磷酸化主要集中在肽鏈中具有游離羥基的酪氨酸、絲氨酸、蘇氨酸殘基上,這些殘基本身不帶電荷,當磷酸化作用后,便具有了電荷,從而使結構發生變化,進一步引起蛋白質活性的變化。通過在線軟件NetPhosK 3.1 Server對EC水解酶的氨基酸序列進行預測。EC水解酶氨基酸序列磷酸化位點(見表5)。RhodococcusequistrainTB-60的EC水解酶中含有15個絲氨酸位點、10個蘇氨酸位點、6個酪氨酸位點;LysinibacillusfusiformisSC02的EC水解酶中含有23個絲氨酸位點、11個蘇氨酸位點、7個酪氨酸位點;Candidaparapsilosis的EC水解酶中含有30個絲氨酸位點、16個蘇氨酸位點、12個酪氨酸位點。

表5 EC水解酶氨基酸序列磷酸化位點統計Table 5 Statistics of phosphorylation sites of amino acid sequence of urethane hydrolase

2.5 二級結構分析

蛋白的二級結構一般由α-螺旋、β-鏈、β-轉角和無規則卷曲等結構原件組成[19]。通過SOPMA在線工具對3株菌的EC水解酶的二級結構進行預測,結果(見圖5)。RhodococcusequistrainTB-60的EC水解酶中α-螺旋占41.53%,延伸鏈占7.63%,β-轉角占3.39%,無規則卷曲占47.46%;LysinibacillusfusiformisSC02的EC水解酶中α-螺旋占48.09%,延伸鏈占10.59%,β-轉角占3.6%,無規則卷曲占37.71%;Candidaparapsilosis的EC水解酶中α-螺旋占39.34%,延伸鏈占11.07%,β-轉角占3.45%,無規則卷曲占46.10%。

2.6 保守結構域分析

通過CDD和SMART對EC水解酶的保守結構域分析得出,來自于三種不同菌的EC水解酶都含有與酰胺酶家族相同的Amidase結構域(見圖6)。

2.7 蛋白質三級結構的預測與評價

2.7.1 蛋白質三級結構

在NCBI上檢索到的完整的EC水解酶的氨基酸序列有3條。利用NCBI上的blastp功能在蛋白質PDB數據庫中分別獲得與現存的EC水解酶序列相似度最高的氨基酸序列。RhodococcusequistrainTB-60的EC水解酶氨基酸序列與BacteriumCSBL00001的芳基?;0访?PBD:4YJ1_A)同源性最高,為33.81%。LysinibacillusfusiformisSC02的EC水解酶氨基酸序列與PseudomonasaeruginosaPAO1的谷氨酰胺基轉移酶A亞基(PDB:4WJ3_A)同源性最高,為39.47%。Candidaparapsilosis的EC水解酶氨基酸序列與Rattusnorvegicus的脂肪酸酰胺水解酶(PBD: 1MT5_A)同源性最高,為27.98%。由于使用SWISS-MODEL進行建模時,同源序列要大于30%,故對Candidaparapsilosis的EC水解酶進行建模時,使用I-TASSER。預測得到的三維結構中(見圖7a、7b、7c),α-螺旋用紅色表示,β-折疊用黃色表示,綠色為無規則卷曲,總體來看,EC水解酶的三維結構均以α-螺旋以及無規則卷曲為主,這預測結果與二級結構預測相對應。

2.7.2 蛋白質三維模型的評價

使用在線軟件SAVES中的Verify_3D以及拉氏構象圖對模型進行評價。RhodococcusequistrainTB-60的EC水解酶的Verify_3D評分為87.80%;LysinibacillusfusiformisSC02的EC水解酶的Verify_3D評分為89.44%;Candidaparapsilosis的EC水解酶的Verify_3D評分為84.39%。

拉氏構象圖簡稱拉氏圖(Ramachandran Plot),其作用是體現出氨基酸殘基在拉氏圖中的區域分布。拉氏構象圖分為四個區,紅色區域是最合適區域,該區域內氨基酸數目越多,則表示該蛋白模型的骨架結構越合理;黃色區域是允許區域;淺黃色區域是最大允許區;而白色區域是不允許區,該區域氨基酸的構象是不合理的。從圖7a、7b、7c可知使用SWISS-MODEL以及I-TASSER所建的EC水解酶模型,處于允許區的氨基酸殘基都大于90%,并且不允許區都小于5%。

2.8 蛋白質多序列比對分析

利用在線軟件Clustal Omega中的多序列比對功能對3個EC水解酶與BacteriumCSBL00001的芳基?;0访傅陌被嵝蛄羞M行比對(見圖8)。三個EC水解酶的序列相似度為29.17%。來自于真菌Candidaparapsilosis的EC水解酶氨基酸序列與兩個來源于細菌的相似度較低,與RhodococcusequistrainTB-60序列相似度為14.49%,與LysinibacillusfusiformisSC02序列相似度為15.22%,而來源于細菌的兩菌株氨基酸序列相似度為31.3%。從圖中可見位于160位左右的氨基酸殘基保守性較強,特別是GGSSGG,這些氨基酸殘基在酰胺酶進化過程中具有較強的保守性。

圖8 EC水解酶的多序列比對結果Fig.8 Results of multiple sequence alignment of urethane hydrolase

3 討 論

EC作為2A類致癌物質,廣泛存在于酒精飲料等發酵食品中。應用微生物酶法去消除EC具有直接、高效的特點。EC水解酶有三個完整的氨基酸序列得以鑒定,且所發現的EC水解酶在酸性或者乙醇存在條件下不穩定,不能在酒精飲料中得到廣泛的應用。如果能利用分子生物學的手段對EC水解酶進行改造,使其能被應用于食品生產過程中,降低食品中EC的濃度,具有重要意義。

生物信息學作為一門交叉學科,利用數學、計算機科學、生命科學技術理論和工具,在生物科學領域的信息獲取、加工、儲存、分析等方面發揮著重要的作用。本研究利用生物信息學相關方法,在NCBI中查找到三條完整編碼EC水解酶的基因序列,對其編碼的氨基酸序列組成、基本理化性質進行分析,通過軟件預測蛋白的親疏水性、信號肽、跨膜域,更進一步預測了蛋白的二級以及三維結構。結果表明,三個蛋白序列都具有與酰胺酶家族相同的Amidase保守結構域,證明了目前已公布的EC水解酶都是酰胺酶,與劉慶濤所說的一致[6]。使用計算機進行分析蛋白質的穩定性時,蛋白質的不穩定系數是一個重要的表征。不穩定指數是對蛋白質在實驗中的穩定性評估,當蛋白質的不穩定系數大于40時,推測該蛋白質為不穩定蛋白,當小于40時為穩定蛋白[20]。氨基酸序列理化性質分析表明,除RhodococcusequistrainTB-60的EC水解酶為較穩定蛋白,其余兩種蛋白均表現為不穩定蛋白。在蛋白質中,氨基酸之間的親/疏水性相互作用是形成其三級結構最重要作用力之一,親疏水作用可以驅使蛋白質進行折疊,有利于蛋白質三級結構的穩定。親疏水性預測結果顯示,三個EC水解酶蛋白均屬于親水性蛋白。對蛋白的信號肽以及跨膜域分析表明,三株菌的EC水解酶都不含有跨膜域以及信號肽。蛋白質二級結構預測發現,EC水解酶都以α-螺旋、無規則卷曲為主。蛋白質空間結構預測,對其結構與功能的研究具有較為重要意義[21]。本研究通過同源建模的方式得到了EC水解酶的三維結構,除對Candidaparapsilosis的EC水解酶進行建模時,使用I-TASSER,其余兩種均使用SWISS-MODEL進行建模。三維結構模型的合理性通過Verify_3D以及Ramachandran Plot進行驗證。Verify_3D用于評估模型的三維結構與氨基酸一級序列結構的相容性,檢測氨基酸側鏈構象的合理性,SAVES獲得的評分≥80%,表明側鏈構象合理[22]。三個蛋白的三維結構的Verify_3D評分都大于80%,說明側鏈構象合理。在Ramachandran Plot中,模型評價要求處于允許區的氨基酸大于90%,如果二面角中有高于90%的都位于一般允許區,則可表明其空間結構具有一定的穩定性[23-24]。三個蛋白質三維結構模型中處于允許區的氨基酸均大于90%,表明模型中所有氨基酸均形成了一個合理的二面角穩定構型。

4 結 論

1) EC水解酶基因編碼472~551 aa,分子量在50~62 kD之間,理論等電點(pI)在5左右,均為酸性親水性蛋白;

2) 目前EC水解酶無跨膜區和信號肽;

3) 二級結構預測結果顯示EC水解酶的氨基酸都以α螺旋以及無規則卷曲為主,螺旋與折疊排列有序;

4) 目前發現的EC水解酶均屬于酰胺酶家族;

5) 對EC水解酶進行三維模型的構建,預測結果質量評估均較好,并使用同源比對的方法,分析出EC水解酶高保守氨基酸殘基。利用生物信息學相關軟件對EC水解酶蛋白進行預測和分析,為挖掘新的EC水解酶、進一步研究EC與EC水解酶結合位點以及對EC水解酶的改造提供了理論依據。

猜你喜歡
水解酶信號肽氨基酸
信號肽篩選優化提高耐熱α-環糊精酶在枯草芽胞桿菌中的表達
毛白楊木葡聚糖內轉糖苷酶/水解酶PtoXTH35原核可溶性表達方法研究
月桂酰丙氨基酸鈉的抑菌性能研究
基于外泌蛋白質組的釀酒酵母信號肽元件的分析及鑒定
基于主成分分析優化參數預測水解酶的亞類
全基因組預測褐環乳牛肝菌的分泌蛋白
HPLC法同時測定阿膠強骨口服液中4種氨基酸
基于生物加工的PET功能修飾的進展
腦卒中后中樞性疼痛相關血漿氨基酸篩選
嗜冷菌的嗜冷機制及其對乳品質量影響研究進展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合