?

蓖麻MYB轉錄因子家族的鑒定和生物信息學分析

2024-02-05 05:57莫海英李智昊蔡國磊吉巧琳曹亞璞楊海英
關鍵詞:蓖麻基序擬南芥

莫海英,李智昊,蔡國磊,陳 鑫,吉巧琳,曹亞璞,楊海英,杜 剛

(1.云南民族大學 民族醫藥學院,云南 昆明 650000;2.云南民族大學 化學與環境學院,云南 昆明 650000)

轉錄因子(transcription factors,TFs)又稱反式作用因子,是與真核生物基因的順式作用元件結合并調控下游基因表達的一類蛋白分子,以響應內源性或外源性的刺激,激活或抑制靶基因的表達,從而控制生化和生理過程;依據轉錄因子的DNA結合域的差異,轉錄因子又分為許多基因家族[1].其中MYB轉錄因子家族是真核生物中最通用的 TF家族之一;癌基因v-MYB是在禽成髓細胞病毒中發現的第一個MYB轉錄因子[2].MYB轉錄因子是包含53個氨基酸殘基的保守結構域,其中的3個色氨酸殘基通過空間位置的排布,形成一個螺旋-轉角-螺旋(helix-turn-helix,HTH)折疊[3],可在特異識別位點與DNA的大溝結合[4];依據MYB結合域數量的差異,MYB家族被分為四個亞家族,分別是1R-MYB、R2R3-MYB、3R-MYB和4R-MYB[5].1R-MYB是一類調控染色體結構穩定性與細胞形態建成的端粒結合蛋白[6].R2R3-MYB蛋白是植物中分布最廣泛的一類MYB轉錄因子,在植物生長發育的各個過程發揮重要作用,例如調控次生代謝物質的生物合成、參與各種逆境脅迫響應、響應植物的激素應答等[7].3R-MYB蛋白廣泛分布于動物以及真菌細胞中,在植物細胞中的含量相對較少,主要參與細胞周期和細胞分化,同時也參與部分逆境脅迫響應[8].4R-MYB目前僅在擬南芥、楊樹、葡萄中有少量的發現,但其功能尚不明確[9].MYB蛋白廣泛分布于植物體內,參與植物初級和次級代謝、生長發育、生理時鐘調控、細胞周期發育、生物和非生物脅迫應答、植物防御等生物學過程的調控[10],例如之前的研究從金魚草、棉花、大豆、擬南芥、蘋果和白菜等植物中鑒定得到功能各異的 MYB轉錄因子[11],金魚草中AmMYB308L 可抑制植物次生代謝途徑中重要可溶性酚酸的合成[12];紅沙梨中 PyMYB10 和 PyMYB10.1 通過與PybHLH形成三元復合體調控花青素的生物合成[13].

蓖麻(RicinuscommunisL.),別名有蓖麻籽、大麻子、紅蓖、老麻子、紅麻等,為被子植物門大戟科蓖麻屬一年生或多年生草本植物[14],其經濟價值主要體現在蓖麻籽油在生物能源、聚合物、精細化工產業中的利用,此外蓖麻還具有其他經濟價值如蓖麻毒素提取用于醫藥農藥、餅粨用于飼料化肥、葉片養蠶等[15].蓖麻的生長適應性極強,從熱帶到溫帶地區均有分布,耐鹽堿、耐瘠薄,在耕作粗放、自然條件差、污染較嚴重的條件下也能正常生長,蓖麻在環境綠化、防風固沙、防治水土流失、修復重金屬污染土壤方面展現出其生態效益.蓖麻基因組測序于 2010年初步完成,全基因組序列大約 350 Mb[16],但關于蓖麻MYB 轉錄因子家族功能研究少部分文獻報道了在蓖麻的耐鹽脅迫中MYB轉錄因子表達下調[17],尚未對蓖麻植物的MYB轉錄因子進行系統分析,因此本研究通過蓖麻MYB基因家族的全基因組和轉錄組分析,以此與模式植物擬南芥的MYB蛋白進行基序、聚類分析、功能注釋分析、系統進化以及理化性質分析,并對不同逆境脅迫下蓖麻中MYB表達量差異進行研究,該研究為蓖麻植物MYB基因的功能研究提供了新的思路.

1 材料與方法

1.1 材料

采用的蓖麻基因組數據來源于JGI官網(Joint GenomeInstitute,https://phytozome.jgi.doe.gov/pz/portal.html,美國能源部聯合基因組研究所的植物比較基因組學門戶網站),MYB蛋白的預測基于蓖麻基因組數據庫,水稻、玉米和擬南芥的MYB 轉錄因子家族氨基酸序列分別來源于NCBI數據庫(National Center for Biotechnology Information,http://www.biosino.org/pages/ncbi-1.htm,美國國家生物技術信息中心),和擬南芥信息資源數據庫(PlantTFDB,http://planttfdb.gao-lab.org/).

1.2 蓖麻MYB轉錄因子的鑒定

玉米、水稻和擬南芥的MYB轉錄因子序列通過軟件clustalw)進行比對,依據clustalw的比對結果采用hmmer軟件(可以快速確定兩組序列之間的相似程度)構建MYB轉錄因子的hmm模型,結合蓖麻基因組數據庫檢索結果,篩選evalue小于1x10-3的基因片段,提取相對應的氨基酸序列,最后取三大數據庫CDD(Conserved Domain Database,https://www.ncbi.nlm.nih.gov/cdd/,保守結構域數據庫)、PFAM(Protein families,http://pfam.xfam.org/,蛋白結構域數據庫)、SMART(Simple Modular Architecture Research Tool,http://smart.embl.de/,識別蛋白保守結構域)進行結構域確認,作為蓖麻MYB轉錄因子.

1.3 蓖麻 MYB 轉錄因子蛋白基序分析鑒定

通過The MEME Suite5.3.3(https://meme-suite.org/meme/,用于研究Motif的組合工具套,Motif是指在一組序列中重復出現的相似的序列模式)程序對蓖麻MYB家族蛋白的基序進行分析,設定基序寬度的最大值為 50、最小值為6,基序數量為10,其余參數均為默認值,提取所選轉錄因子于基因組的位置信息,使用軟件TBtools(批量序列處理和交互式數據可視化)繪制圖像.

1.4 蓖麻MYB 轉錄因子蛋白的結構分析

通過bioperl對提取出篩選好的蓖麻MYB轉錄因子家族蛋白序列進行理化性質分析.同時利用SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html,蛋白質二級結構預測軟件)對蛋白二級結構特征進行預測.

1.5 蓖麻 MYB 轉錄因子的GO注釋分析

通過軟件PANNZER2(http://ekhidna2.biocenter.helsinki.fi/sanspanz/,預測功能描述(DE)和GO類),對已篩選確定的蓖麻MYB轉錄因子進行功能注釋.

1.6 蓖麻 MYB 轉錄因子與擬南芥 MYB 轉錄因子系統進化樹的構建

對來源于PlantTFDB數據庫的完整擬南芥MYB轉錄因子蛋白序列進行進化分析;采用MEGA7軟件內置的ClustalW程序對蓖麻MYB家族蛋白序列以及下載的擬南芥MYB轉錄因子蛋白序列進行比對分析,采用鄰接法(重復次數為1000次)構建系統發育樹.

1.7 蓖麻MYB轉錄因子蛋白的轉錄組表達差異分析

從NCBI數據庫中下載蓖麻的轉錄組數據,熱脅迫轉錄組數據(HS-1:SRR17894243,HS-2:SRR17894242,HS-3:SRR17894241,CK-1:SRR17894246,CK-2:SRR17894245,CK-3:SRR17894244),鹽脅迫轉錄組數據(USZ-1:SRR17069850,USZ-2:SRR17069859,USZ-3:SRR17069858,SSZ-1:SRR17069856,SSZ-2:SRR17069855,SSZ-1:SRR17069854).

使用trim_galore v0.6.7去除3′端接頭和過濾平均質量分數低于堿基質量值30(quality score of 30,Q30)的讀長(reads);使用STAR version=2.7.10a軟件與蓖麻參考基因組(https://phytozome-next.jgi.doe.gov/info/Rcommunis_v0_1)進行比對.使用featureCounts 2.0.1進行定量.

2 結果與分析

2.1 蓖麻MYB 家族成員的獲得

從蓖麻基因組數據中共挖掘出32條MYB基因序列,基因片段大小為164~676 bp.片段最短 164 bp(29701.m000580),編碼54個氨基酸,最長 676 bp(29737.m001227),編碼225個氨基酸,片段平均長度為 378 bp(見附件表2).

2.2 蓖麻 MYB 轉錄因子基序分析

32個蓖麻MYB轉錄因子家族的10個基序,研究發現32個蓖麻轉錄因子蛋白均具有基序1和2結構,結合MEME和smart結構域在線分析,發現在32個MYB轉錄因子中同時存在基序1、2和3時蛋白質中具有2個MYB結構域,不具有基序3時只有1個MYB結構域,基序3可能是一種典型的MYB基因結構域(圖1).

圖1 蓖麻MYB轉錄因子基序分析

即預測的32個蓖麻MYB基因家族主要是1R-MYB和2R-MYB基因亞家族.即在32個蓖麻轉錄因子蛋白中具有1R-MYB結構域(圖2)的分別為28582.m000318、29701.m000580、30170.m013948、29780.m001368、29842.m003572、27757.m000022、29814.m000747、30174.m008957、29737.m001227、29848.m004559、29751.m001898、30180.m001019、29790.m000831、28883.m000751、29807.m000474、29676.m001636、29780.m001324、30226.m001993、27973.m000086、30068.m002645,具有2R-MYB結構域的分別為28582.m000317、28582.m000316、29805.m001544、30169.m006598、29637.m000753、29680.m001711、29813.m001501、29950.m001149、29827.m002675、29805.m001543、29904.m002952、30017.m0003(表1).

圖2 蓖麻中MYB基因在smart里的結構域

表1 蓖麻中MYB基因在smart里鑒定的結構域

2.3 蓖麻MYB家族蛋白理化性質分析

理化性質結果(見附件表2),此次研究中32個MYB家族蛋白平均相對分子質量為 42 132,最小值為29701.m000580編碼蛋白的18734.7,最大值為29737.m001227編碼蛋白的74390.5.等電點(pI)平均值為7.39,最小值為30174.m008957編碼蛋白的4.8,最大值為30226.m001993編碼蛋白的9.88,其中pI大于7的MYB家族蛋白有18個,大于pI小于7的14個,證明大部分蓖麻MYB家族蛋白表現為偏堿性.依據MYB家族蛋白結構特征預測結果,32個MYB蛋白主要由無規卷曲(58.0%)、α螺旋(29.9%)、延伸鏈(8.4%)和β轉角(3.4%)組成.

2.4 蓖麻MYB轉錄因子的GO注釋分析

GO注釋結果表明,蓖麻32條MYB轉錄因子序列中有31條均被注釋到生物過程、分子功能和細胞組分,并被進一步富集為26個功能類別(圖3).其中生物過程主要富集在生物過程調節,生物調節,細胞過程和代謝過程;分子功能集中富集在結合調控上,細胞組分主要富集在細胞,細胞部分和細胞器調控上.可推測,蓖麻MYB 轉錄因子通過結合到 DNA 區域發揮相應的調控功能,主要涉及植物的細胞過程、發育過程和物質代謝等過程(圖3).

圖3 蓖麻轉錄因子功能注釋

2.5 蓖麻MYB蛋白進化分析

在PlantTFDB數據庫中下載擬南芥所有的MYB家族蛋白氨基酸序列(共168個),將上述篩選出的蓖麻MYB家族蛋白和下載到的擬南芥MYB家族蛋白利用軟件MEGA7構建進化樹.根據聚類結果(圖4),可將蓖麻MYB轉錄因子分為2個亞家族,其中綠色標記的一類亞家族成員22個(28582.m000317—30017.m000317:28582.m000317、28582.m000318、27757.m000022、29814.m000747、29842.m003572、29676.m001636、29780.m001324、28883.m000751、29807.m000474、29737.m001227、29848.m004559、29751.m001898、30180.m001019、29637.m000753、29680.m001711、30169.m006598、29805.m001544、29950.m001149、29827.m002675、29813.m001501、29904.m002952、30017.m000317),第二類亞家族成員10個結果(30068.m002645—29780.m001368:29780.m001368、30174.m008975、30226.m001993、29805.m001543、29790.m000831、27973.m000086、28582.m000316、29701.m000580、30170.m013948、30068.m002646),并且被聚類到相同分支的蛋白具有相似的功能,根據表3可以看出,第一類亞家族中擬南芥的MYB蛋白AT1G49010.1、AT5G08520.1、AT5G04760.1基因與脫落酸介導的鹽脅迫耐受的重要調節因子,是脫落酸(ABA)信號轉導所必需的,因此蓖麻中的MYB轉錄因子(28582.m000317-30017.m000317分支)可能是鹽脅迫耐受的重要調節因子.

圖4 蓖麻MYB家族蛋白與擬南芥MYB家族蛋白進化樹

表3 蓖麻MYB轉錄因子與擬南芥MYB蛋白同源性功能比較

2.6 不同脅迫下MYB基因的轉錄組分析

2.6.1 鹽脅迫下MYB基因的轉錄組分析

根據蛋白表達熱圖結果,32 個MYB蛋白的轉錄組在鹽脅迫和正常情況下的表達量存在明顯的差異;從圖中可以看出23個MYB蛋白(占全部MYB蛋白的71.88%)在鹽脅迫的處理下表達上調;其中有16個屬于第一類亞家族成員(占第一類亞家族蛋白72.73%),分別為28582.m000318、27757.m000022、29814.m000747、29842.m003572、29676.m001636、28883.m000751、29807.m000474、29848.m004559、29637.m000753、29680.m001711、30169.m006598、29805.m001544、29827.m002675、29813.m001501、29904.m002952、30017.m000317,表明蓖麻在鹽脅迫下MYB蛋白表達上調,因此蓖麻中的MYB轉錄因子可能是鹽脅迫耐受的重要調節因子(圖5).

2.6.2 熱脅迫下 MYB基因的轉錄組分析

根據蛋白表達熱圖結果,在熱脅迫下,19個MYB基因表達量下調,13個MYB基因表達量上調,其中4個MYB蛋白表達上調(29780.m1324、28582.m000318、29751.m001898和29780.m001368)具有相關性,這4個上調基因被聚類到一起,表明它們具有相似的表達模式,而3個MYB蛋白表達下調(29813.m001501、29950.m001149和30169.m006598)具有相似的表達模式,因此MYB基因在熱脅迫下對蓖麻的生長有影響(圖11).

CK代表正常情況下的蓖麻,HS代表熱脅迫下的蓖麻,進行了3次重復實驗;顏色鍵位于右上角,表示MYB基因表達情況圖6 MYB基因在熱脅迫和正常情況下的表達熱圖

3 結語

MYB是目前研究植物中數量最多的轉錄因子家族之一,現已在多種植物中被鑒定出來,例如:擬南芥、水稻、玉米和大豆[25].本研究在基因組水平上利用PlantTFbcat和BLAST在線軟件對蓖麻MYB轉錄因子進行了鑒定和篩選.

本研究從蓖麻的基因組數據中共鑒定到32個MYB轉錄因子,在MEME分析中發現所有的MYB轉錄因子中都具有基序1和基序2結構,當序列中只含有基序1和2時發現只有一個MYB結構域,當同時含有1、2和3時具有2個結構域,說明基序1和2是與1R-MYB亞基因家族的保守性相關的,也與2R-MYB亞基因家族的保守性有關,基序3只與2R-MYB亞基因家族的保守性有關,極有可能基序3就是蓖麻MYB轉錄因子中R3的保守結構域,因此具有2個保守結構域MYB轉錄因子可能是R2R3-MYB轉錄因子.此外,根據MYB轉錄因子理化性質分析,MYB轉錄蛋白大多偏堿性,大部分是無規則卷曲和α螺旋.

蓖麻MYB蛋白進化分析,蓖麻的MYB蛋白主要和擬南芥的MYB蛋白家族聚在2個大的分支上,因此蓖麻中MYB蛋白主要分為2個亞家族,值得注意的是,第一類亞家族中28582.m000317-30017.m317000蛋白(22個)的功能可能是鹽脅迫耐受的重要調節因子;并且第一類亞家族的MYB蛋白具有2個保守結構域,因此為R2R3-MYB結構域,R2R3-MYB轉錄因子可能對藥用植物的次生代謝過程起到調控轉錄的作用.

鹽脅迫下蓖麻MYB蛋白的轉錄組分析,前人研究了不同的鹽反應基因和組蛋白甲基化開關位點,并發現關鍵鹽反應調控因子RADIALIS-LIKE SANT (RSM1)的轉錄可能受到雙價H3K4me3-H3K27me3修飾的調控[26],本研究蓖麻在鹽脅迫下大部分MYB蛋白表達上調,因此蓖麻中的MYB轉錄因子可能是鹽脅迫耐受的重要調節因子;在熱脅迫處理下,前人研究針對熱脅迫下和恢復過程中蓖麻幼苗的脂質組學和轉錄組學進行了綜合分析,并鑒定了大量熱響應脂質分子和基因,發現三?;视?TAGs)的合成可以顯著地被熱應激誘導并儲存在細胞質中,但在恢復過程中它們會減少[27],本文對其轉錄組公共數據再分析發現,在熱脅迫下,13個MYB基因表達量上調,其中4個MYB蛋白表達上調(29780.m1324、28582.m000318、29751.m001898和29780.m001368)具有相關性,這4個上調基因被聚類到一起,表明它們具有相似的表達模式,因此MYB基因在熱脅迫下對蓖麻的生長有影響.

因此,通過對蓖麻不同逆境脅迫下的響應,MYB基因對蓖麻的生長有調節作用.本研究首次系統的進行蓖麻基因組和轉錄組的MYB基因挖掘,并且首次對蓖麻在干旱,冷脅迫下,鹽脅迫下和熱脅迫下MYB蛋白的表達量進行轉錄組分析,為今后進一步解析蓖麻MYB轉錄因子的結構和功能奠定基礎.

猜你喜歡
蓖麻基序擬南芥
EPIYA 基序與幽門螺桿菌感染相關胃病關系的研究進展
擬南芥:活得粗糙,才讓我有了上太空的資格
帶TRS基序突變的新型冠狀病毒威脅更大
芥藍Aux/IAA家族基因生物信息學與表達分析
尿黑酸對擬南芥酪氨酸降解缺陷突變體sscd1的影響
兩種LED光源作為擬南芥生長光源的應用探究
擬南芥干旱敏感突變體篩選及其干旱脅迫響應機制探究
巧嘴繞口令
蓖麻蒴果剝殼過程中的力學性能有限元仿真
基于金釵石斛EST的短串聯重復序列的挖掘
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合