?

大麻PEBP基因家族鑒定及生物信息學分析

2022-12-05 02:47徐洪國王志剛徐偉慧葛宵啟祁宏英
福建農業學報 2022年8期
關鍵詞:大麻元件蛋白質

陳 晗,徐洪國,2,王志剛,2,徐偉慧,2,葛宵啟,祁宏英,2

(1.齊齊哈爾大學生命科學與農林學院,黑龍江 齊齊哈爾 161006;2.寒區麻及制品教育部工程研究中心,黑龍江 齊齊哈爾 161006)

0 引言

【研究意義】在生物進化中,磷脂酰乙醇胺結合蛋白(Phosphatidylethanolamine-binding Protein, PEBP)是一種十分保守的蛋白質,廣泛存在于細菌、動物和植物中。PEBP是一種編碼蛋白,對植物生長發育起重要調控作用[1]。PEBP基因家族的成員不僅是植物營養階段向生殖階段過渡的關鍵調節因子,而且控制芽的生長和花的結構之間的形態轉換以及多種信號通路的調節[2-4]。分析大麻PEBP基因,研究該基因在大麻中的生物功能,為調控大麻生長發育及開花奠定基礎?!厩叭搜芯窟M展】PEBP基因在許多物種中備受關注,例如大豆[5]、棉花[6]、茶樹[7]、甜橙[8]、水稻[9]等,而在大麻中僅有關于FT(FloweringLocus T)同源基因的研究[10]。模式植物擬南芥的開花途徑主要包括光周期促進途徑、春化促進途徑、自主開花途徑以及赤霉素途徑[11],而PEBP基因屬于光周期促進途徑中主要的控制基因[12]。在擬南芥中,PEBP基因共有3個亞家族成員,其中FT、TSF(Twin Sister of FT)屬于FT-LIKE,TFL1(Terminal Flower1)、BFT(Brother of FTandTFL1)、ATC(Arabidopsis thaliana CENRADIALIS homologue)屬于TFL1-LIKE,MFT(Mother of FT and TFL1)屬于MFT-LIKE亞家族[1]。FT基因也稱為成花素,主要在葉片中進行表達,同亞家族的TSF基因的過表達同樣可以促進開花[13-16]。FT與同源基因TERMINAL FLOWER1(TFL1)具有拮抗作用,它與TSF在花序分生組織成分的確定中對TFL1起拮抗作用[17-19]。FT和TFL1之間的平衡通過將分生組織從隨機生長轉換為定向生長來調節植物結構,它們除開花時間和植物結構中的作用外,FT與TFL1基因參與植物發育的各個方面,如種子萌發和塊莖形成[20-21]。而MFT在種子中表達,并響應ABA而上調[22-26]。大麻(Cannabis sativa)又稱火麻、線麻,是大麻科(Cannabinaceae)大麻屬(Cannabis)一年生草本植物,原產于中亞地區,是我國傳統的經濟作物,具有悠久的栽培歷史[27]。大麻中含有大量精神類物質,如四氫大麻(THC),具有致幻作用,根據THC含量大麻可分為3類,其中工業大麻(THC<0.3%)為低毒作物[28]?!颈狙芯壳腥朦c】隨著工業大麻應用范圍的不斷擴大、市場潛力劇增,工業大麻在分子育種、遺傳育種等方面的發展刻不容緩。高CBD、低THC含量的大麻品種缺乏、育種難度大,導致工業大麻發展緩慢。而調控工業大麻的花期可有效地改善工業大麻育種期限,增加產量提高經濟效益?!緮M解決問題】植物開花是由多因素控制,主要包括植物生長環境(光照、水分、氣體、養分等)與植物內源激素(茉莉酸、水楊酸、赤霉素)。在植物生長環境中光照是主要因素,大麻屬于喜光、短日照植物,光照的改變不僅調控花期還影響大麻植株形態、大麻素的合成以及次級代謝產物的合成[29]。PEBP基因包括了種子的花芽分化與休眠、促進開花與抑制開花的三個亞族??刂崎_花期可以控制植物的生長和產量。本研究選取工業大麻PEBP基因家族進行生物信息學分析,為進一步明確其功能奠定基礎。

1 材料與方法

1.1 大麻CsPEBP基因家族成員鑒定

從擬南芥TAIR數據庫(https://www.arabidopsis.org/)中搜索編碼PEBP家族基因蛋白的6個序列,以ATFT(AT1G65480)、ATTSF(AT4G20370)、ATTFL1(AT5G03840)、ATBFT(AT5G62040)、ATATC(AT2G 27550)、ATMFT(AT1G18100)作為參考序列篩選大麻目的基因。使用NCBI(https://www.ncbi.nlm.nih.gov/)下載大麻(GCA_900 626 175.2)全基因組及注釋文件[30],利用TBtools軟件進行Blast序列比對、并提取候選基因序列,將篩選出的候選基因序列上傳至Pfam(http://pfam.xfam.org/)進行結構域比對[31],保留包含其結構域的基因。

1.2 大麻CsPEBPs基因motif預測、亞細胞定位及理化性質分析

利用在線工具MEME(https://meme-suite.org/meme/tools/meme)預測大麻CsPEBPs基因的保守結構域[32],設置motif數量為10。利用在線工具Cell-PLoc 2.0(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)預測大麻PEBP基因蛋白的亞細胞定位[33]。利用Expasy(https://web.expasy.org/protparam/)分析大麻PEBP基因的理化性質,其中包括氨基酸數量、等電點、分子質量、不穩定指數、脂溶指數、總平均疏水指數等。

1.3 大麻CsPEBPs基因結構、染色體定位及系統進化分析

利用TBtools分析大麻CsPEBPs基因結構,顯示其UTR(外顯子)及CDS(內含子)區,并使用TBtools定位基因在染色體上的位置實現可視化。利用 MEGA7.0軟件對大麻CsPEBPs基因進行多序列比對,并使用鄰近算法(NJ,neighbor-joining)構建系統發生樹[34]。

1.4 大麻CsPEBP蛋白二、三級結構預測

利用在線軟件SOPMA(https://www.expasy.org/)預測大麻CsPEBPs基因二級結構[35],并分析其α-螺旋、β-折疊、延伸鏈、無規則卷曲在整體結構中的比例。

利用在線軟件SWISS-MODEL(https://swissmodel.expasy.org/)的同源建模預測大麻CsPEBPs蛋白的三級結構[36],并與二級結構預測結果進行比較。

2 結果與分析

2.1 大麻CsPEBP家族基因的挖掘及motif預測、亞細胞定位及理化性質分析

通過基因家族分析,從大麻基因組中共篩選出12個PEBP家族基因,經Pfam結構域篩選,12個大麻PEBP家族基因均含有PBP(PF01161)結構域。編碼基因含有172~190個氨基酸,平均每條序列含有177個氨基酸,等電點為6.09~9.41,蛋白質相對分子質量在19 019.01~21 595.23 Da,其中CsPEBP5不穩定指數高達56.79,屬于極不穩定蛋白,總平均疏水指數均小于0,說明大麻CsPEBPs基因為親水蛋白(表1)。12個CsPEBPs基因亞細胞定位基本分布在細胞核與細胞質中。

表1 大麻CsPEBPs基因的理化性質分析Table 1 Physicochemical properties of C.sativa CsPEBPs

利用MEME進行motif分析,其結構用TBtools進行可視化。如圖1,12個大麻CsPEBPs基因均含有motif1~5,且排序方式一致,說明大麻CsPEBPs基因具有一定的保守性。其主要區別是蛋白質N-端motif的類型有差異,CsPEBP8、CsPEBP9均含有motif6,CsPEBP3、CsPEBP10均含有motif7,CsPEBP4、CsPEBP12均含有motif8,CsPEBP4含有兩個motif10,僅有CsPEBP11含有motif 9。

圖1 大麻CsPEBPs基因motif預測Fig.1 Prediction motifs of C.sativa CsPEBPs

2.2 大麻CsPEBP家族基因結構、染色體定位及系統分析

12個大麻CsPEBPs基因的內含子、外顯子如圖2所示。篩選的全部基因中均含有2個外顯子,除CsPEBP2、CsPEBP3外,其他基因均含有4個內含子。主要差別位于非編碼區長度,說明CsPEBPs基因在結構上具有高度的保守性。

圖2 大麻CsPEBPs基因結構Fig.2 Structure of C.sativa CsPEBPs

如圖3所示,大麻CsPEBPs基因主要位于7條染色體上,分別是染色體1、3、5、6、7、8、X,且分布不均。3號染色體與X染色體上均含有3個大麻CsPEBPs基因。5號染色體上含有2個基因,其余染色體上只含有1個基因。由圖4預測CsPEBP8與CsPEBP9、CsPEBP10、CsPEBP11為等位基因,需要進行多序列比對、順式作用元件分析、二級結構預測、三級結構預測印證猜想。

圖3 大麻CsPEBPs基因在染色體上的定位Fig.3 Mapping of C.sativa CsPEBPs on chromosome

為確定大麻CsPEBPs基因在進化上的保守性,使用MEGA7.0進行多序列比對,并使用鄰近算法(NJ,neighbor-joining)構建系統發生樹。根據擬南芥PEBP家族的分類方法,大麻CsPEBPs基因也進行了分類(圖4)。FT-LKE亞家族中含有4個大麻CsPEBPs基因(CsPEBP1、CsPEBP2、CsPEBP4、Cs-PEBP7),TFL1-LKE亞家族中含有5個大麻CsPEBPs基因(CsPEBP3、CsPEBP6、CsPEBP10、CsPEBP11、CsPEBP12),MFT-LIKE亞家族中含有3個大麻Cs-PEBPs基因(CsPEBP5、CsPEBP8、CsPEBP9)。其中CsPEBP8、CsPEBP9基因序列相似性為100%。

圖4 大麻與擬南芥、水稻PEBP基因家族系統進化樹Fig.4 Phylogenetic trees of PEBP family of hemp, rice, and arabidopsis

2.3 大麻CsPEBP家族基因啟動子順式作用元件分析

本研究使用TBtools分析和可視化大麻CsPEBPs基因上游2 000 bp的啟動子順式作用元件(圖5)。大麻CsPEBPs基因順式作用元件主要是光反應順式調節元件、脫落酸反應順式作用元件、茉莉酸響應元件、厭氧誘導順式作用元件。其中12個大麻CsPEBPs基因均含有光反應順式調節元件,共183個。大麻CsPEBPs基因中分生組織表達調控順式作用元件、干旱誘導順式作用元件、低溫響應元件、晝夜節律調控順式作用元件均含有3個。

圖5 大麻CsPEBPs基因啟動子區順式作用元件Fig.5 Cis-acting elements in the promoter region of C.sativa CsPEBPs genes

2.4 大麻CsPEBPs蛋白質二級結構預測

利用SOPMA在線軟件預測12個大麻CsPEBPs蛋白質的二級結構預測。從表2可知,大麻CsPEBPs蛋白質含有高達57.47%的無規則卷曲,而β-折疊占比最高,為7.30%,由此可知大麻CsPEBPs蛋白質二級結構主要是由無規則卷曲構成,α-螺旋、β-折疊、延伸鏈分散于整個蛋白質中。由圖6可知,12個大麻CsPEBPs蛋白質在二級結構上無明顯差異。

圖6 大麻CsPEBPs蛋白的二級結構在線預測結果Fig.6 Online prediction of secondary structure of CsPEBPprotein

表2 大麻CsPEBPs蛋白質的二級結構預測Table 2 Predicted secondary structure of CsPEBP protein (%)

2.5 大麻CsPEBPs蛋白質三級結構預測

利用在線軟件SWISS-MODEL(https://swissmodel.expasy.org/)中的同源建模預測蛋白質三維空間結構。如圖7所示,蛋白質三級結構主要是由無規則卷曲構成與蛋白質二級結構預測結果一致。

圖7 大麻CsPEBPs蛋白的三級結構空間構象Fig.7 A spatial conformation of tertiary structure of CsPEBP protein

3 討論與結論

PEBP基因家族廣泛存在于細菌、動物和植物中,PEBP家族包含在整個植物界中作為開花時間的關鍵調節劑的蛋白質,它們還調節生長和植物結構[37]。本研究運用生物信息學等方法,從已報道的大麻全基因組中鑒定出12個PEBPs基因,經研究發現單子葉植物中的PEBPs基因數量多于雙子葉植物[24]。通過對大麻CsPEBPs基因的理化性質分析,僅有CsPEBP5、CsPEBP7等電點小于7,說明該基因具有編碼堿性蛋白質的可能,這與染井吉野櫻的PEBP分析結果一致[38];12個大麻PEBPs基因均為親水性蛋白,此結果從小麥FT基因[39]中得到印證;通過亞細胞定位得知CsPEBPs分布在細胞質與細胞核中,與金花茶[40]、辣椒[41]定位結果一致。從基因結構來看,12個大麻CsPEBPs基因均具備PEBP結構域,均含有2個外顯子、4個內顯子,說明PEBP基因在進化上具有高度的保守性,大麻CsPEBPs基因的保守基序分析結果也印證了該結論。

經過與擬南芥、水稻的PEBP蛋白構建系統發育樹,將12個基因分為3個亞家族;FT-LKE亞家族中含有4個大麻CsPEBP基因,TFL1-LKE亞家族中含有5個大麻CsPEBPs基因,MFT-LIKE亞家族中含有3個大麻CsPEBPs基因。經啟動子順式作用元件分析,大麻PEBPs基因家族含有光反應順式調節元件、脫落酸反應順式作用元件、茉莉酸響應元件、厭氧誘導順式作用元件等順式作用元件,當大麻受到相關環境脅迫時,PEBP基因可能會對大麻生長發育產生一定影響。蛋白質中結構中有規則的重復的構象稱為蛋白質的二級結構[42],其中包括α-螺旋、β-折疊、β-轉角、無規則卷曲以及一些特殊結構(π-螺旋,PPII螺旋)[42-43]。蛋白質三級結構是在二級結構的基礎上不斷地盤繞折疊而形成特定的構象,是多肽鏈的三維空間結構,可以依據已知的蛋白質三級結構推測位置蛋白質結構并預測其功能[44-45]。大麻CsPEBPs蛋白的二級結構預測結果與三級結構預測結果一致。并從三級預測結構中發現同一亞族的基因擁有相似的三級結構。根據以上分析結果,CsPEBP8與CsPEBP9基因相似度為100%、二級結構與三級結構預測結果一致、保守基序相同,但順式作用元件分析結果略有不同,說明這兩個基因具有相似的形態結構并執行相同的生理功能。

本研究通過對大麻PEBPs蛋白的全基因組鑒定,對PEBP基因家族進行生物信息學分析,包括序列的理化性質、保守基序、基因結構、系統進化分析、順式作用元件分析等。研究結果為PEBP基因家族調控大麻的生長發育及開花奠定基礎。

猜你喜歡
大麻元件蛋白質
蛋白質自由
人工智能與蛋白質結構
大麻二酚在醫學上的應用前景
科技在線
如何讀懂色環電阻
反滲透膜元件失效的原因分析及對策
大麻是個啥?
大麻促進骨折痊愈
寶馬i3高電壓元件介紹(上)
Protel?。梗梗螅寰W絡表裝載中糾錯探索
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合