?

NaHCO3脅迫下吉爾吉斯白樺MADS基因家族生物信息學及表達分析

2020-07-06 03:31劉偉瑩張雨晴王丹玉李佳妮楊成君
江蘇農業科學 2020年10期
關鍵詞:吉爾吉斯基序白樺

劉偉瑩 張雨晴 王丹玉 李佳妮 楊成君

摘要:為了探索MADS基因家族的耐鹽脅迫功能,從以吉爾吉斯白樺(Betula kirghisorum)23號為試驗材料測得的轉錄組文庫中篩選出28個吉爾吉斯白樺的MADS-box基因序列對其編碼蛋白的基本理化性質、亞細胞定位、二級結構、跨膜結構和信號肽、基因結構、保守基序、蛋白系統進化等方面進行初步生物信息學分析,并在NaHCO3脅迫下對其表達情況進行分析。結果顯示,除蛋白BkMADS1和BkMADS20外,其余均為親水性蛋白;在28個吉爾吉斯白樺MADS蛋白中有19個定位在細胞核中;蛋白BkMADS7和BkMADS12的二級結構組成以無規則卷曲為主,其余蛋白則以α-螺旋為主;所有蛋白均沒有信號肽,即全為非分泌性蛋白。此外,進化分析結果表明,MADS盒為MADS-box轉錄因子高度保守的結構域,大多數吉爾吉斯白樺MADS蛋白為Ⅱ型。在0.6% NaHCO3脅迫下,15個BkMADS基因上調表達,13個BkMADS個基因下調表達。

關鍵詞:吉爾吉斯白樺;MADS基因家族;MADS-box轉錄因子;轉錄組文庫;非分泌性蛋白;生物信息學;NaHNO3脅迫;基因表達

中圖分類號:Q943.2;R857.3;S792.153.01 ?文獻標志碼: A ?文章編號:1002-1302(2020)10-0085-09

收稿日期:2019-04-27

基金項目:東北林業大學大學生創新訓練項目(編號:201810225478)。

作者簡介:劉偉瑩(1999—),女,黑龍江巴彥人,主要從事森林植物資源學研究研究。E-mail:247335605@qq.com。

通信作者:楊成君,碩士,副教授,主要從事森林植物資源學研究。E-mail:nxyycj@sina.cn。

MADS基因家族是目前研究最廣泛的植物轉錄因子之一,具有多種生物功能,廣泛參與調控植物生長發育的多個過程和逆境應答。1990年,MADS-box 轉錄因子首先在金魚草中被發現[1],它是一類序列特異的轉錄調控因子,主要在激活或抑制基因的轉錄反應過程中起作用[2]。MADS-box基因編碼的蛋白即為MADS-box轉錄因子,是MADS基因功能的直接行使者,通常以同源或異源二聚體的形式使其保守結構域與特定的DNA序列結合,從而調控基因的表達[3-4]。MADS-box轉錄因子主要由MADS盒、K盒、I區、C末端、N末端5個部分組成。MADS盒是由約57個氨基酸組成的高度保守結構域,主要與DNA結合,有時也形成二聚體或與輔助因子結合[4-7];K盒由約70個氨基酸組成,是MADS-box轉錄因子的特征序列,也是發生二聚體化的結構單元;I區位于MADS盒和K盒之間,是由31~35個氨基酸組成的非保守區域,該區域內含有較多的親水殘基,它們的作用是幫助二聚體化的轉錄因子與DNA結合形成復合體;C末端位于K盒的下游,是由約30個氨基酸組成的非保守區域,該區域內富含疏水殘基;N末端位于MADS盒的上游,是富含堿性氨基酸的親水結構域[4,8]。

MADS由4種蛋白因子基因[MCM1)(mini chromosome maintenance 1)、AGAMOUS、DEFICIENS和SRF(serum response factor]的首寫字母構成[8]。其中,MCM1是釀酒酵母(Saccharomyces cerevisiae)特異性基因的轉錄控制中心,可以參與調節細胞周期和細胞的生長代謝過程;AGAMOUS(AG)和DEFICIENS(DEF)分別是擬南芥(Arabidopsis thaliana)和金魚草(Antirrhinum majus)花器官特征基因的產物;SRF是人類(Homo sapiens)的血清應答因子,涉及原癌基因的協同轉錄[3,5]。這4種蛋白因子基因的共同特點是都有1個MADS盒[9]。MADS-box基因家族中所有的基因都擁有一個長度約為180 bp、能夠編碼MADS-box結構域的高度保守核苷酸序列,因此被稱為MADS-box基因[10]。

MADS-box基因廣泛存在于動物、植物和真菌中,其序列十分保守,因此功能特異性強。MADS-box蛋白在真核生物的生長發育過程中發揮著重要作用,特別是在顯花植物的花器官分化、開花時間的調節以及相關的果實發育與成熟等方面[11-13]。MADS-box蛋白在植物花發育過程中的調控功能根據器官決定因子可以歸納為花器官發育的ABCDE模型,其中A、E功能基因調控萼片的發育,A、B、E功能基因調控花瓣的發育,B、C、E功能基因調控雄蕊的發育,C、E功能基因調控心皮的發育,C、D、E功能基因調控胚珠的發育,A、C功能基因則相互拮抗[14-16]。在果實成熟過程的調控方面,陳翠翠等在番茄中發現了2個與果實成熟過程密切相關的MADS-box基因,并將其分別命名為LeMADS-RIN和LeMADS-MC,前者調控果實的成熟過程,而后者則在萼片的發育和花序的決定方面發揮作用[2,17]。此外,研究表明,擬南芥在受精后的裂片分化過程中需要FUL基因,該基因的過量表達可抑制裂片區域的木質化,且該基因負調控SHP基因,如果它發生突變,則會導致果實不能正常開裂[2,18]。MADS-box基因的特異性作用與植物所處的內外環境因素密切相關[19]。NO-3作為信號分子,可以刺激擬南芥側根的伸長生長,該刺激作用主要依賴于MADS基因家族中ANR1基因的表達[19-20]。MADS-box基因不僅在分化期的花器官原基中表達,在植物的其他部位也有表達[21],可調控根的生長以及根瘤的形成、調節葉序的發生和轉變、影響春化、調節頂端分生組織的分化、調節胚珠的發育、調控光合作用和營養代謝等多個過程[22]。

1 材料與方法

1.1 試驗材料

從以吉爾吉斯白樺(Betula kirghisorum)23號為試驗材料測得的轉錄組文庫中篩選出吉爾吉斯白樺的MADS-box基因序列,利用在線軟件ORF Finder(http://www.ncbi.nlm.nih.gov/gorf/gorf.html)查找出相應的編碼序列,并將其翻譯為氨基酸序列。

1.2 試驗方法

1.2.1 吉爾吉斯白樺MADS蛋白的理化性質和亞細胞定位分析 利用在線軟件ProtParam tool(http://web.expasy.org/prot param/)測定MADS蛋白的理化參數(氨基酸數目、分子量、理論等電點、脂肪族氨基酸指數、疏水性)。通過軟件The WoLF PSORT(http://www.genscript.com/psort/wolf_psort.html)對MADS蛋白進行亞細胞定位。

1.2.2 吉爾吉斯白樺MADS蛋白的二級結構預測 運用常用的生物信息學在線軟件SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)預測MADS蛋白的二級結構。

1.2.3 吉爾吉斯白樺MADS蛋白跨膜結構域和信號肽的預測 采用在線軟件TMPred(http://www.ch.embnet.org/software/TMPRED_form.html)對吉爾吉斯白樺的MADS蛋白進行跨膜結構域預測;采用在線軟件SignalP 4.1(http://www.cbs.dtu.dk/ services/SignalP/)預測MADS蛋白中是否含有信號肽。

1.2.4 吉爾吉斯白樺MADS基因結構的預測 根據所得到的吉爾吉斯白樺MADS基因序列和編碼序列,用基因結構顯示服務器GSDS2.0(http://gsds.cbi.pku.edu.cn/)分析MADS基因的結構。

1.2.5 吉爾吉斯白樺MADS蛋白的多重序列對比和保守基序(motif)識別 運用Clustalx v1.83軟件對吉爾吉斯白樺的MADS蛋白進行多重序列對比分析。利用在線軟件MEME(http://meme-suite.org/tools/meme)分析吉爾吉斯白樺MADS蛋白的氨基酸序列保守基序,參數設置如下:同一基序在1條系列中出現0次或1次,基序最大發現值為5,長度范圍為70個氨基酸殘基,其他參數為默認值。

1.2.6 吉爾吉斯白樺MADS蛋白系統的進化分析 本試驗結合擬南芥對吉爾吉斯白樺的MADS蛋白系統進行進化分析。從JGI Phytozome v11.0(https://phytozome.jgi.doe.gov/pz/portal.html)數據庫中下載得到擬南芥MADS蛋白的氨基酸序列,利用MEGA 5.1軟件中的鄰位相接法(NJ)[自舉值(bootstrap)(1 000次重復)]構建吉爾吉斯白樺和擬南芥MADS蛋白的系統進化樹,進而對吉爾吉斯白樺的MADS蛋白系統進行進化分析和分類。

1.2.7 NaHCO3脅迫下吉爾吉斯白樺MADS基因家族的表達分析 以采用0.6% NaHCO3溶液鹽脅迫48 h的吉爾吉斯白樺葉片為試驗材料,經檢測計算得到log2(RPKMBk/RPKMCK)值[RPKM表示每100百萬讀長(reads)中來自于某基因每1 000堿基長度的讀長數;Bk是吉爾吉斯白樺拉丁文的縮寫,CK是對照],通過柱形圖對鹽脅迫下吉爾吉斯白樺葉片中MADS基因家族的表達進行分析。

2 結果與分析

2.1 吉爾吉斯白樺MADS蛋白的理化性質和亞細胞定位分析

本試驗從吉爾吉斯白樺23號的轉錄組文庫中共得到28個MADS-box基因序列,從表1可以看出,這28個基因的序列長度和所編碼的氨基酸數目均存在著較大的差異。氨基酸數目在38~352個范圍內;BkMADS12的氨基酸數目和分子量最大,分別為352個和39 899.1 u; BkMADS7的氨基酸數目最少,分子量最小,分別為38個和4 443.2 u。28個MADS蛋白的等電點變化范圍較大, 在4~12之間均有分布,其中有10個蛋白的等電點在9~10之間;BkMADS4的等電點最高,為11.57;BkMADS1的等電點最低,為4.63。除BkMADS1和BkMADS2外,其他所有蛋白的脂肪族氨基酸指數都小于100,說明大多數吉爾吉斯白樺的MADS蛋白為親水性蛋白。28個吉爾吉斯白樺MADS蛋白的疏水性平均值(GRAVY)預測結果有正有負,其中除BkMADS1和BkMADS20外,其余蛋白的疏水性平均值均為負。

本試驗利用The WoLF PSORT軟件對吉爾吉斯白樺的28個MADS蛋白進行亞細胞定位預測,預測結果以得分的形式表現出來,分值越高,表示預測結果的準確性越大。但該軟件具有一定的局限性,只能預測以甲硫氨酸(蛋氨酸,M)開頭的氨基酸序列,因此本試驗中氨基酸序列以亮氨酸(L)開頭的BkMADS1、BkMADS2、BkMADS7、BkMADS10、BkMADS18、BkMADS23、BkMADS24蛋白則無法用該軟件進行亞細胞定位。從亞細胞定位的預測結果(表2)可以看出,BkMADS3、BkMADS4、BkMADS5、BkMADS6、BkMADS8、BkMADS9、BkMADS11、BkMADS12、BkMADS13、BkMADS14、BkMADS15、BkMADS16、BkMADS17、BkMADS19、BkMADS21、BkMADS22、BkMADS25、BkMADS27、BkMADS28在細胞核(nucleus)中的預測分值最大;BkMADS26在細胞質(cytoplasm)、細胞質與細胞核之間空間的預測分值相同;而BkMADS20在細胞質和細胞核之間空間位置的預測分值最大。

2.2 吉爾吉斯白樺MADS蛋白的二級結構預測

蛋白質的二級結構是指它的多肽鏈中有規則重復的構象,主要形式包括α-螺旋(α-helix)、β-折疊(β-sheet)、β-轉角(β-turn)和無規則卷曲(random coil)。目前預測蛋白質二級結構的方法逐漸增多,其中基于對準的自優化預測(self optimized prediction method from alignment,SOPMA)方法的輸出形式比較直觀,因此本試驗采用SOPMA方法對吉爾吉斯白樺MADS蛋白的二級結構進行預測。SOPMA采用5種方法對蛋白的二級結構進行預測,然后將結果進行優化組合,最后匯集整理成一個一致的預測結果。蛋白二級結構的預測采用四態定義,即α-螺旋、β-折疊、β-轉角和無規則卷曲。吉爾吉斯白樺MADS蛋白的二級結構預測結果(表3)表明,在BkMADS7、BkMADS12蛋白的二級結構中所占比例最大的是無規則卷曲,而在其余蛋白的二級結構中α-螺旋所占比例總體最大;大多數蛋白的二級結構組成百分比表現為α-螺旋>無規則卷曲>β-折疊>β-轉角,而在BkMADS3蛋白中沒有出現β-折疊,在BkMADS13蛋白中α-螺旋和β-折疊所占比例相同,在BkMADS20蛋白中β-轉角和無規則卷曲所占比例相同。

2.3 吉爾吉斯白樺MADS蛋白跨膜結構域和信號肽的預測

蛋白質典型的跨膜螺旋區域主要由20~30個疏水性氨基酸(如亮氨酸、異亮氨酸、纈氨酸、甲硫氨酸、甘氨酸、丙氨酸等)組成。從表4可以看出,在28個吉爾吉斯白樺MADS蛋白中有16個具有跨膜螺旋結構,而在這16個具有跨膜結構蛋白中有11個具有1個內部向外螺旋和1個外部向內螺旋結構;在BkMADS8、BkMADS9、BkMADS17、BkMADS22蛋白中僅僅具有1個內部向外螺旋結構,而不具有外部向內螺旋結構;在BkMADS10蛋白中具有2個內部向外螺旋和1個外部向內螺旋結構,是這28個蛋白中結構較特殊的一種蛋白。

信號肽(signal peptide)常常位于分泌蛋白的N端,一般由15~30個氨基酸構成,其中包含6~15個帶正電荷的非極性氨基酸,可以用于判斷一個蛋白質是否為分泌蛋白,且與蛋白質在細胞內的定位有關。通過軟件SignalP ?4.1得出的信號肽預測結果表明,吉爾吉斯白樺的28個MADS基因編碼的蛋白均沒有信號肽序列,說明吉爾吉斯白樺的28個MADS蛋白均為非分泌性蛋白。

2.4 吉爾吉斯白樺MADS基因結構的預測

吉爾吉斯白樺MADS基因結構的預測結果如圖1所示,由于本試驗沒有得到吉爾吉斯白樺28個MDAS基因的基因組數據,只有其轉錄組數據,因此在預測基因結構時只能預測到外顯子的位置,即非翻譯區位置,無法顯示出內含子的情況。

2.5 吉爾吉斯白樺MADS蛋白的多重序列對比和保守基序識別

利用Clustalx v1.83軟件對吉爾吉斯白樺MADS蛋白的氨基酸序列進行多重對比分析,結果(圖2)表明, 28個吉爾吉斯白樺MADS基因家族基

因的MADS-box結構域高度保守。利用MEME在線軟件分析28個吉爾吉斯白樺MADS蛋白的氨基酸保守基序,結果(圖3)表明,MADS蛋白包含5個保守元件, 其中基序1含有57個氨基酸,且大多數吉爾吉斯白樺MADS蛋白的氨基酸序列中均含有該基序,所以推測其是轉錄因子MADS-box的典型結構MADS盒;在MADS盒之后的是Ⅰ區,包含基序5,最佳匹配序列是SSSSMQKVIERY;Ⅰ區之后是K區,包含基序2;而BkMADS5、BkMADS6、BkMADS15、BkMADS28蛋白所含有的基序3、4則為未知基序。本試驗中,由于得到的BkMADS1、BkMADS2、BkMADS7、BkMADS20、BkMADS21、BkMADS26基因序列長度較短,未能識別出其保守氨基酸的基元序列;圖3顯示,基因BkMADS3、BkMADS4、BkMADS5、BkMADS6、BkMADS18中不含有保守結構域MADS盒, 可能不屬于MADS基因家族,同時由于本試驗缺乏基因組數據,無法準確地判斷其分類,因此在以下分析中不再對基因BkMADS1、BkMADS2、BkMADS3、BkMADS4、BkMADS5、BkMADS6、BkMADS7、BkMADS18、BkMADS20、BkMADS21、BkMADS26進行研究。

2.6 吉爾吉斯白樺MADS蛋白系統的進化分析

利用進化樹分析軟件MEGA5.1對吉爾吉斯白樺MADS蛋白和74個擬南芥AGL型MADS蛋白進行系統進化樹構建,并依據Parenicová等對擬南芥AGL型MADS蛋白的分類[23]進行進化關系分析和分類。結果(圖4)顯示,在所研究的17個吉爾吉斯白樺MADS蛋白中有10個(BkMADS8、BkMADS11、BkMADS13、BkMADS15、BkMADS16、BkMADS17、BkMADS22、BkMADS25、BkMADS27、BkMADS28)屬于Ⅱ型,7個(BkMADS9、BkMADS10、BkMADS12、BkMADS14、BkMADS19、BkMADS23、BkMADS24)屬于Ⅰ型。由于本試驗只有轉錄組數據,缺少基因組數據,因此無法進一步地對Ⅰ型中的MADS蛋白進行分類。

2.7 NaHCO3脅迫下吉爾吉斯白樺MADS基因家族的表達分析

從圖5可以看出,在鹽脅迫下,吉爾吉斯白樺葉片中有15個BkMADS基因上調表達,而13個BkMADS基因的表達受到抑制,呈現下調表達趨勢,其中BkMADS5、BkMADS11、BkMADS13的上調表達趨勢明顯,BkMADS26、BkMADS18、BkMADS23、BkMADS28的表達被明顯抑制。在鹽脅迫下,各BkMADS基因的表達情況存在明顯差異,因此須要進一步研究它們的表達特性。

3 結論

本研究通過分析吉爾吉斯白樺葉片中MADS基因家族的轉錄組數據獲得28個具有完整ORF的MADS-box轉錄因子,并利用轉錄組數據分析其所編碼蛋白的理化性質、亞細胞定位、二級結構、跨膜結構和信號肽、基因結構、保守結構域特征、系統進化分類以及在鹽脅迫下的表達特性。結果表明,28個吉爾吉斯白樺MADS-box基因所編碼的氨基酸數目在30~360個范圍內;等電點在4~12之間均有分布;大多數MADS-box蛋白為親水性蛋白,亞細胞定位在細胞核中,且α-螺旋在二級結構的預測結果中所占比例最大;所有的MADS-box蛋白均為非分泌性蛋白;采用MEME軟件對氨基酸保守基序進行識別分析,得到17個有意義的MADS-box基因,主要可以分為兩大類,其中大多數屬于Ⅱ型;在鹽脅迫下,15個BkMADS基因上調表達,13個BkMADS基因下調表達。表明在吉爾吉斯白樺的MADS基因家族中一部分基因具有一定的耐鹽性。

參考文獻:

[1]馬忠強. MADS轉錄因子對植物發育的重要作用[J]. 種子世界,2014(5):24-26.

[2]陳翠翠,馬元武,馮永君,等. MADS-box家族蛋白在植物開花、結實及根瘤形成中的多功能調節作用[J]. 華北農學報,2008,23(增刊2):74-77.

[3]侯傳明. 山核桃MADS轉錄因子的H2Y分析和活性組織表達水平檢測[D]. 杭州:浙江農林大學,2014.

[4]胡麗芳,金志強,徐碧玉. MADS-box基因對花的發育及開花早晚的影響[J]. 生命科學研究,2004,8(4):7-12.

[5]Shore P,Sharrocks A D. The MADS-box family of transcription factors[J]. European Journal Biochemistry,1995,229(1):1-13.

[6]Krizek B A,Meyerowitz E M. Mapping the protein regions responsible for the functional specificities of the Arabidopsis MADS domain organ-identity proteins[J]. Proceeding of the National Acad Sciences,1996,93(9):4063-4070.

[7]Jack T,Brockman L L,Meyerowitz E M. The homeotic gene APETALA 3 of Arabidopisis thaliana encodes a MADS-box and is expressed in petals and stamens[J]. Cell,1992,68(4):683-697.

[8]Schwarz-Sommer Z,Huijser P,Nacken W,et al. Genetic control of flower development by homeotic genes in Antirrhinum majus[J]. Science,1990,250(4983):931-936.

[9]Zachgo S,Saedler H,Schwarz-Sommer Z. Pollen-specific expression of DEFH125,a MADS-box transcription factor in Antirrhnum with unusual features[J]. The Plant Journal,1997,11(5):1043-1050.

[10]崔榮峰,孟 征. 花同源異型MADS-box基因在被子植物中的功能保守性和多樣性[J]. 植物學通報,2007,24(1):31-41.

[11]Messenguy F,Dubois E. Role of MADS-box proteins and their cofactors in combinatorial control of gene expression and cell development[J]. Gene,2003,316:1-21.

[12]Irish V F. The evolution of floral homeotic gene function[J]. Bioessays,2003,25(7):637-645.

[13]李元元,王 魯,蘇振剛,等. MADS-box基因控制植物成花的分子機理[J]. 基因組學與應用生物學,2010,29(6):1122-1132.

[14]Kaufmann K,Melzer R,Theissen G. MIKC-type MADS-domain proteins:structural modularity,protein interactions and network evolution in land plants[J]. Gene,2005,347(2):183-198.

[15]Theissen G,Saedler H. Floral quartets[J]. Nature,2001,409:469-471.

[16]徐啟江,關錄飛,吳笑女,等. 草原龍膽MADS-box基因的克隆及表達分析[J]. 植物學通報,2008,25(4):415-429.

[17]Vrebalov J,Ruezinsky D,Padmanabhan V,et al. A MADS-box gene necessary for fruit ripening at the tomato ripening-inhibitor (rin) locus[J]. Science,2002,296(5566):343-346.

[18]胡麗芳,金志強,徐碧玉. MADS-box基因在果實發育、成熟過程中的作用[J]. 分子植物育種,2005,3(3):415-420.

[19]馬 輝,張智俊,羅淑萍. 植物MADS-box基因研究進展[J]. 生物技術通報,2006(6):14-18.

[20]Zhang H M,Brian G,Forde. An Arabidopsis MADS-box gene that controls nutrient-induced changes in root architecture[J]. Science,1998,279(16):407-409.

[21]李 娟,薛慶中. 擬南芥及水稻轉錄因子MADS密碼子的偏好性比較[J]. 浙江大學學報(農業與生命科學版),2005,31(5):513-517.

[22]劉菊華,徐碧玉,張 靜,等. MADS-box轉錄因子的相互作用及對果實發育和成熟的調控[J]. 遺傳,2010,32(9):893-902.

[23]Parenicová L,de Folter S,Kieffer M,et al. Molecular and phylogenetic analyses of the complete MADS-box transcription factor family in Arabidopsis:new openings to the MADS world[J]. The Plant Cell,2003,15(7):1538-1551.

猜你喜歡
吉爾吉斯基序白樺
EPIYA 基序與幽門螺桿菌感染相關胃病關系的研究進展
帶TRS基序突變的新型冠狀病毒威脅更大
芥藍Aux/IAA家族基因生物信息學與表達分析
俄羅斯見聞:浴血白樺
基于金釵石斛EST的短串聯重復序列的挖掘
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合