?

竹葉花椒TPS基因家族全基因組分析

2022-07-22 06:53任妙珍董凱麟陳之端蘇俊霞
關鍵詞:萜類甜橙竹葉

任妙珍,董凱麟,張 劍,陳之端,蘇俊霞

(1.山西師范大學生命科學學院,太原 030092;2.中國科學院植物研究所系統與進化植物學國家重點實驗室,北京 100093)

竹葉花椒(ZanthoxylumarmatumDC.)屬于蕓香科(Rutaceae)花椒屬(ZanthoxylumL.),俗稱“藤椒”,是一種落葉小喬木或灌木,枝具寬而扁銳的刺,全株有濃烈辛香味,主要分布在我國秦嶺以南的廣大西南區域[1].由于其清香濃郁的特殊風味,竹葉花椒的干燥成熟果皮,常用作風味調節劑和防腐劑,是中國美食中不可或缺的一種調料.它也是一種重要的藥用植物,根、莖、葉、果實等部位都可入藥,可以輔助治療胃痛、牙痛、腸內蠕蟲及發熱、風濕等;其提取的化合物具有消炎、殺菌和抗氧化的作用[2-4].竹葉花椒不僅是我國傳統的香料、油料和藥用樹種,也是重要的生態經濟樹種,深受廣大人民的喜愛.其中含有豐富的揮發油,主要為小分子醇類或萜類物質[5].

特化次生代謝物的出現,提高了植物適應環境的能力[6].在植物組織中,揮發性有機物(volatile organic compounds, VOCs)的合成具有重要的生物學功能,包括抵抗病原菌,寄生生物和食草動物等.根據其來源,VOCs又可分為萜類、苯類芳烴和脂肪酸衍生物,其中萜類占據了大多數[7].萜類是天然化合物中規模最大,結構最多樣的一類次生代謝物[8].萜類化合物源自甲羥戊酸(MVA pathway)途徑和甲基赤蘚糖磷酸酯途徑(MEP pathway)產生的化合物和衍生物,分子骨架基于異戊二烯或其異構體二甲基烯丙基焦磷酸C5單元,包含倍半萜、單萜、二萜、三萜等幾種類型[9].萜類化合物在植物生理和生化中扮演了重要的角色,例如光合作用、電子傳遞、發育調控等[10].根據植物中萜類化合物的作用可將其分為兩大類:初級代謝產物和次級代謝產物,例如赤霉素、脫落酸、類胡蘿卜素、甾醇等為重要的初級代謝物,可調節細胞伸長和植物生長,參與光合作用以及控制膜流動性等;植物中大多數萜類是次生代謝物,如青蒿素,紫杉醇,棉酚等,在植物與環境相互作用中起著關鍵作用,并且具有重要的藥用價值.萜類合成依賴于萜類合成酶(Terpene synthase, TPS),萜類合成酶的多樣性造就了萜類的多樣性,根據生成的產物不同,可將其分為單萜合成酶、倍半萜合成酶、二萜合成酶等.根據植物TPS基因家族的系統發育關系,前人將該家族劃分為8個亞家族:TPS-a,TPS-b,TPS-c,TPS-d(裸子植物特有),TPS-e,TPS-f,TPS-g,和TPS-h(卷柏屬特有)[11].為了適應特殊的生態位,例如吸引傳粉者,散播種子,對抗病原菌,防止食草動物的啃食等,大部分植物的萜類物質會發生譜系特異進化,在各個亞家族中發生不同程度的擴張和變異[10,12,13].萜類合成酶TPS基因家族在多種植物中都已經被鑒定,例如在擬南芥[Arabidopsisthaliana(L.)Heynh.]中鑒定到32條,在玉米(ZeamaysL.)中鑒定到30條[14],在水稻(OryzasativaL.)中鑒定到34條[11],在陸地棉(GossypiumhirsutumL.)中鑒定出41條[15].然而,關于有名的香料植物竹葉花椒萜類合成酶基因家族的成員鑒定與功能研究卻還沒有相關報道.近年來隨著基因組測序技術的成熟,竹葉花椒基因組測序也已經完成[16].因此,本研究開展了竹葉花椒TPS基因家族的鑒定與表達分析,利用生物信息學方法深入解析了竹葉花椒TPS基因家族的進化和表達模式,為進一步探索竹葉花椒TPS基因的功能提供了參考,為深入探究竹葉花椒揮發油的合成調控提供重要的目標基因.

2.1 材 料

竹葉花椒的全基因組數據,相關蛋白序列和GFF文件從Figshare(https://figshare.com/articles/dataset/The_chromosome-level_genome_assembly_of_Sichuan _pepper/14400884/1)網站下載獲取.擬南芥(A.thaliana)與甜橙[Citrus sinensis(L.)Osbeck]的蛋白序列分別來自于TAIR10(https://www.arabidopsis.org/)和 Phytozome13(https://phytozome-next.jgi.doe.gov/info/Csinensis_v1_1)網站.

2.2.1 基因家族成員的鑒定和序列分析 根據TPS蛋白包含保守N端結構域Terpene_synth(PF01397)和C端結構域Terpene_synth_C(PF03936)的特征,從Pfam34.0網站(http://pfam.xfam.org/)[17]下載這兩個隱馬爾科夫模型文件.分別用PF01397和PF03936隱馬爾科夫模型文件對竹葉花椒蛋白數據進行hmmsearch,使用默認閾值10.0,可以在初始搜索時覆蓋所有可能的TPS基因,最終得到兩個序列集,對這兩個數據集合并去冗余,得到hmmsearch的數據集(1).為了使數據集更完善,使用前人已鑒定的擬南芥TPS蛋白序列[18],進行blastp搜索竹葉花椒的蛋白庫,獲得竹葉花椒同源序列數據集(2).將數據集(1)和(2)合并去冗余,并在Pfam34.0網站(http://pfam.xfam.org/)[17]對合并得到的數據集進行結構域核查,獲得最終的竹葉花椒TPS基因列表.甜橙中的TPS基因序列采用同樣方法獲得.等電點,分子量等理化性質分析用perl腳本計算完成.亞細胞定位使用WoLF PSORT網站(https://wolfpsort.hgc.jp/)進行預測.

2.2.2 系統發育分析 在MAFFT v7在線網站(https://mafft.cbrc.jp/alignment/software/)[19]對竹葉花椒、甜橙、擬南芥和三條經過功能驗證的胡椒木的TPS蛋白序列進行多序列比對,比對好的序列在IQ-tree在線網站(http://iqtree.cibiv.univie.ac.at/)[20]上進行系統發育樹構建,Bootstrap值設置為1000.竹葉花椒TPS基因類別劃分根據2011年Chen的系統發育分類標準[11].

2.2.3 基因結構及蛋白保守基序分析 使用在線網站MEME(http://meme-suite.org/tools/meme)[21]對ZaTPSs保守基序進行分析,預測值設置為20個;利用竹葉花椒基因組的GFF文件和蛋白序列,采用TBTOOLS[22]中的Gene Structure View 功能對竹葉花椒TPS基因結構和保守基序進行可視化繪圖.

2.2.4 染色體定位及基因重復類型分析 染色體定位使用以下幾個文件:MCScanX中的duplicate_gene_classifier程序生成的串聯重復對文件,染色體序列長度文件,GFF文件以及竹葉花椒的TPS基因ID列表,運行腳本生成Mapchart所需要的配置文件,在Mapchart軟件中進行繪制和美化.竹葉花椒基因重復類型分析采用PGDD(http://chibba.agtec.uga.edu/duplication/)的方法進行本地化分析.從基因組注釋文件中提取ZaTPSs基因家族成員的染色體定位信息和相關基因對信息,而后使用MCScanX鑒定ZaTPSs基因的重復類型.

2.2.5 全基因組共線性分析 為了揭示竹葉花椒與其近緣種甜橙及模式植物擬南芥的TPS家族同源基因的共線性關系,比對三者基因組,進行全基因組共線性分析,使用JCVI畫圖,竹葉花椒、甜橙和擬南芥的TPS基因在共線性塊中的連線將會高亮顯示.

2.2.6 基因表達模式分析 使用Hisat2軟件分別將竹葉花椒的頂芽、幼葉、成熟葉片、葉柄、幼花、種子、果皮、莖和皮刺9個不同組織的轉錄組數據(https://www.ncbi.nlm.nih.gov/sra/?term=Zanthoxylum+armatum),比對到參考基因組上[16],使用featurecounts R包計算TPM值[23],分析竹葉花椒TPS家族基因在不同組織中的表達模式,使用TBTOOLS[22]軟件中的Heatmap功能完成可視化.

3.1 基因鑒定及理化性質分析

在竹葉花椒基因組中鑒定出53個TPS基因.根據染色體位置信息分別命名,見表1.對ZaTPS蛋白理化性質的分析結果顯示,ZaTPS蛋白長度在173~859 aa之間,分子量在20.21~98.44 kD之間,等電點范圍在4.87~9.10,其中有52個成員偏酸性,只有1個成員偏堿性,說明ZaTPSs蛋白質在酸性環境下更容易沉淀.亞細胞定位結果顯示ZaTPSs大部分分布在葉綠體(49.06%)和細胞質(39.62%),少部分位于細胞核(9.43%)和線粒體(1.89%)中.

表1 竹葉花椒TPS基因家族成員信息

3.2 基因家族系統發育分析

使用32個擬南芥、28個甜橙和53個竹葉花椒TPS蛋白序列構建系統發育進化樹,見圖1.三個物種的TPS基因聚為 6 個分支,分別對應TPS基因的6個亞家族:TPS-a,TPS-b,TPS-c,TPS-e,TPS-f和TPS-g,在系統樹上每個亞家族的聚類關系都得到了很好的支持.在被子植物中,TPS-a和TPS-b是倍半萜和單萜的主要合成酶.在竹葉花椒中,TPS-a和TPS-b亞家族成員較多,分別為20條和24條,TPS-e和 TPS-f 亞家族中成員最少,只有1條.與之相似,甜橙的TPS-a和TPS-b亞家族成員也較多,分別為15條和9條,TPS-c和TPS-e亞家族成員較少,均為1條,TPS-f亞家族則一條也沒有.

圖1 竹葉花椒、甜橙和擬南芥TPS蛋白的系統發育樹

3.3 基因結構及蛋白保守基序分析

利用MEME在線工具對ZaTPS蛋白序列進行分析,并得到motif保守基序,根據含有保守基序的序列數目和其顯著性,依次命名為motif 1至20,見圖2.其中motif 1(E-value為7.5e-945)有TPS最典型的保守結構域,“富含天冬氨酸殘基的DDxxD”,該殘基被認為對金屬離子起到結合作用,從而在引導底物催化時發揮重要作用[24],48個ZaTPSs都含有motif1.Motif 12包含TPS-a和TPS-b的保守基序“RRX8W”.包含Motif 20的序列條數最少,只有9條,都為TPS-b亞家族成員.整體來看,TPS-a 和TPS-b亞家族包含的保守基序較多,TPS-g亞家族保守基序較為一致,猜測TPS-g在竹葉花椒中比較保守.通過竹葉花椒全基因組GFF注釋文件和TPS基因家族CDS序列信息,統計外顯子和內含子,分析發現53個ZaTPSs均正常編碼,但各成員外顯子個數存在差異,ZaTPS25外顯子數目最多,達到15個.

圖2 竹葉花椒ZaTPSs保守基序分布及外顯子、內含子分布

3.4 染色體定位及基因重復類型

染色體定位分析結果顯示竹葉花椒有44條ZaTPSs不均勻地分布在11條染色體上,結果見圖3,剩余的9個基因分布在未掛載到染色體上的片段序列中.其中14號染色體含有的ZaTPS基因最多,且主要為串聯重復,呈小型基因簇.16號,24號染色體上都分別發生了不同程度的串聯重復.除了標紅的幾個串聯重復基因簇外,還有一些基因分布距離較近,猜測是由比較古老的串聯重復形成.TPS基因分布最少的為3號、4號、10號、12號、15號、25號染色體,僅含有1個ZaTPS基因.同時,我們對ZaTPS基因重復類型的分析結果顯示,轉座重復(TRD)(占24.53%),串聯重復(TD)(占20.75%)和全基因組復制(WGD)(占20.75%)是竹葉花椒TPS基因家族擴張的主要的驅動因素.與甜橙物種分化后,竹葉花椒發生了一次特異的WGD事件[16],這與WGD對竹葉花椒TPS基因特異擴張的貢獻相吻合.

圖3 竹葉花椒TPS基因染色體定位

3.5 竹葉花椒、擬南芥及甜橙TPS基因全基因組共線性分析

我們對竹葉花椒、擬南芥及甜橙TPS基因進行了全基因組共線性分析,見圖4.竹葉花椒有1條染色體上的TPS基因與擬南芥的TPS基因存在共線關系,有2條染色體與甜橙的TPS基因存在共線關系.與擬南芥相比,竹葉花椒與甜橙具有更近的基因進化關系,共線基因對為14對,而與擬南芥僅有1對.竹葉花椒與甜橙的TPS共線性基因對和竹葉花椒與擬南芥的TPS共線性基因對中,沒有共享的ZaTPS基因.

圖4 竹葉花椒與甜橙及擬南芥TPS基因共線性分析

3.6 TPS基因在竹葉花椒中的表達模式分析

利用竹葉花椒轉錄組數據分析ZaTPSs在竹葉花椒頂芽、幼葉、成熟葉片、葉柄、幼花、種子、莖、皮刺和果皮中的表達量,見圖5.總體來看,ZaTPSs在竹葉花椒的各個部位都有表達.相比于其他亞家族,TPS-a(log2TPM≈11.86)和TPS-b(log2TPM≈8.42)亞家族平均表達量大于其他亞家族.從各個組織的表達量來看,ZaTPSs在種子、成熟葉片和皮刺中表達量很低或不表達,但皮刺中ZaTPS51卻表達異常高(log2TPM≈11.85),忽略此異常值后,ZaTPSs在幼花組織中平均表達量最突出,尤其是TPS-a(log2TPM≈3.30),TPS-b(log2TPM≈2.89)和TPS-g(log2TPM≈4.97)亞家族成員,其中TPS-b亞家族的ZaTPS45和ZaTPS36在幼花中的表達量最多.TPS-g亞家族成員在種子、莖和皮刺中不表達,但在幼花中表達總量較明顯.除幼花組織外,ZaTPSs在果皮中總體表達量也比較高,最突出的是ZaTPS23(log2TPM≈8.79),在系統發育樹上與其聚為一支的ZaTPS24、ZaTPS42和ZaTPS51在果皮中也表達較高.一些基因在幼葉中有表達但在成熟葉中不表達,如ZaTPS4、ZaTPS6、ZaTPS7等,而一些基因在幼葉和成熟葉中都不表達,如ZaTPS14、ZaTPS44、ZaTPS52等.ZaTPS5、ZaTPS10、ZaTPS44只在莖中有微量表達.

圖5 竹葉花椒TPS基因在不同組織中的表達熱圖(TD,頂芽;YL,幼葉;ML,成熟葉;PT,葉柄;YF,幼花;SD,種子;ST,莖;PK,皮刺;HK,果皮),白色表示沒有表達,顏色越深表示表達值越高

4 討 論

TPS基因家族廣泛分布于各種生物體內,參與多種生長發育過程,發揮調節功能.目前,已在多種植物中鑒定到了大量的TPS基因家族成員,例如,在花椒(Z.bungeanum)中,鑒定得到70條TPS蛋白,TPS-a和TPS-b亞家族中成員最多,分別為23條和31條[25],這與我們在竹葉花椒中確定的TPS基因數目大體相近.最近一項基于竹葉花椒轉錄組數據的研究中,調查了果實中萜類合成通路的關鍵基因,篩選出28個表達顯著上調的關鍵基因,主要為以下幾個基因家族:TPS-like,GGPPS-like,GCPE-like和DXS-like,TPS-like中主要報道了5個TPS-a和TPS-b亞家族成員,但目前并沒有針對竹葉花椒TPS基因家族做全面系統性的研究和報道[26,27].鑒于竹葉花椒全基因組數據的發表,本研究開展了竹葉花椒TPS基因家族的鑒定與表達分析,為進一步了解ZaTPSs基因的功能提供了參考.

基于竹葉花椒全基因組數據,共有53條TPS基因被鑒定,其中TPS-a和TPS-b亞家族成員較多,分別為20條和24條,TPS-e和 TPS-f 中成員最少,只有1條,同科植物甜橙在TPS-a和TPS-b亞家族中成員也較多,分別為23條和16條,這一現象符合大多數被子植物中TPS家族分布的規律[14].通過統計竹葉花椒不同亞家族中的基因重復類型情況,我們發現TPS-a亞家族成員中35%來自于轉座重復,其次是串聯重復(25%)和全基因組復制(25%),并且該亞家族中轉座重復來源的基因表達平均值最高.在TPS-b亞家族中,分散重復來源的基因占據了29.17%,其次是近端重復(20.83%)和轉座重復(20.83%),然而在該亞家族中全基因組復制來源的基因表達平均值最高,其次是散在重復.總體來說,轉座重復(24.53%),串聯重復(20.75%)和全基因組復制(20.75%)是竹葉花椒TPS基因家族擴張的主要來源.轉座重復是一種通過DNA或RNA復制機制,將基因或基因片段從原來的位置轉移到一個新的染色體位置的基因重復類型[28].DNA轉座子,例如高粱(sorghum)的CACTA轉座元件,能夠將基因或基因片段移動到一個新的染色體位置,而基于RNA的轉座重復通常是指反轉錄轉座,能夠從信使RNA中的多個外顯子中產生單外顯子進行反轉錄,反轉錄產生的基因將會轉座到一個新的染色體[29].結合竹葉花椒基因組中含有大量轉座元件的結構特征,猜測TPS基因家族擴張受到該結構特征的影響.竹葉花椒與甜橙物種分化后,在大約26.6個百萬年前發生過一次物種特異的全基因組復制事件,TPS基因家族的擴張也受到了該事件的促進[16].

萜類生成的前體是異戊烯焦磷酸(IPP)與其異構體二甲基烯丙基二膦酸(DMAPP),二者分別由發生在細胞質中的甲羥戊酸途徑(MVA pathway)和質體中的甲基赤蘚糖磷酸酯途徑(MEP pathway)生成[9].通過二者的變換結合,在萜類合成酶的作用下,生成一系列中間化合物:牻牛兒基焦磷酸(GPP),橙花基焦磷酸(NPP),法尼基焦磷酸(FPP)和牻牛兒牻牛兒基焦磷酸(GGPP)等,最終生成單萜、倍半萜、二萜等[30,31].根據TPS基因家族的亞細胞定位分布模式,倍半萜合酶一般定位于細胞質中,單萜合酶都位于質體中[11,32].亞細胞定位結果顯示ZaTPSs大部分定位在細胞質和葉綠體,且TPS-a亞家族蛋白大部分分布于細胞質中,TPS-b亞家族蛋白大部分分布于葉綠體中.眾所周知,TPS-a亞家族基因成員編碼倍半萜合酶,TPS-b亞家族基因成員編碼單萜合酶.這與大部分TPS-a分布在細胞質中,大部分TPS-b分布于葉綠體中的事實相契合.有研究表明,代謝物質合成的基因在染色體的基因排布上并不是隨意分散,而是彼此相鄰,形成基因簇.萜類合成酶基因形成基因簇有助于基因組合的共遺傳和共表達,減少單一通路基因在重組后丟失的可能性[33].染色體定位分析顯示,16號染色體和24號染色體上均有串聯重復,且16和24號染色體上分布的全為TPS-b亞家族的成員,猜測這加強了基因的共表達.通過觀察竹葉花椒TPS基因在不同組織中的表達分析發現,幼花中基因表達最為明顯,主要集中于TPS-a,TPS-b和TPS-g三個亞家族.在擬南芥TPS基因功能研究中發現,花器官中檢測到的萜類化合物數量最多,與兩個功能相關:吸引短距離內的小型昆蟲進行傳粉,另外可能與防御機制有關[34].玉米中,已有實驗證明TPS23能夠調控石竹烯的釋放,來吸引食草動物的天敵,間接達到驅趕食草動物的目的[35].此外,在棉花中也發現能產生一系列具有殺蟲特性的萜類化合物,例如眾所周知的棉酚,半棉酚,殺食夜蛾素等[36].這說明萜類作為一種具有重要生物學意義的揮發性有機化合物及其合成相關的TPS基因家族,很有可能在竹葉花椒吸引傳粉者、防止食草動物的侵食、防御病原菌等方面起到重要作用,從而來適應特殊的生態位.單萜和倍半萜為小分子萜類,多具有揮發性,在植物體內常以揮發油的形式存在,ZaTPSs基因在果皮中也呈現較高的表達量,猜測與果皮合成、釋放揮發性物質有關.竹葉花椒同屬植物胡椒木中已有研究驗證,ZpTPS1和ZpTPS2能夠催化FPP生成倍半萜(C15),ZpTPS3催化GPP生成單萜(C10).將這三條ZpTPSs蛋白序列加入系統發育分析后發現,ZaTPS12、ZaTPS17-19和ZaTPS50與ZpTPS2聚為一支,得到了較高的支持率,猜測這幾個ZaTPSs基因也發揮與ZpTPS2同樣的功能.ZpTPS3在植物體內催化形成單萜化合物,在系統進化樹上與ZaTPS2、ZaTPS3、ZaTPS30、ZaTPS32-36和ZaTPS45、ZaTPS46聚為一支,這些基因在幼花和果皮中都有表達,但在幼葉和成熟葉中表達有所差別,在成熟葉中不表達,推測這些基因在幼花和果實中功能較為保守,參與幼花和果實單萜類化合物的合成,在葉中不會持續表達.ZaTPS23在果皮中表達量最高,在系統發育樹上與其聚為一支的ZaTPS24、ZaTPS42和ZaTPS51在果皮中也表達較高,推測這些成員都參與了果皮中揮發油的合成,后續的功能驗證實驗可通過基因敲除或過表達實驗來觀察果皮中揮發油含量的變化[37].

綜上所述,基于全基因組數據,本研究全面地鑒定了竹葉花椒中TPS基因家族成員,并對其分類、進化和表達模式進行了深入分析,為后續功能驗證實驗提供了重要的理論依據,為探究竹葉花椒的生態適應性提供了備選基因,同時為竹葉花椒揮發油應用的研究提供了理論指導.

猜你喜歡
萜類甜橙竹葉
南非:甜橙產量預計增長6%
埃及:全球最大的甜橙出口國
秘魯:甜橙出口增長
衛竹葉老師輔導的日記畫
三葉委陵菜的化學成分和藥理作用研究進展
欖形風車子萜類提取物對四種癌細胞的增殖抑制作用
益母草屬萜類化學成分及其藥理作用研究進展
載在竹葉船上的童年
竹葉溝懷古
學包圓錐粽
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合