?

天南星科植物葉綠體基因組結構特征及系統發育分析:以天南星等20個物種為例

2024-02-26 03:07許祎珂寇佩雯劉長樂李爽孫曉春黃文靜
中國野生植物資源 2024年1期
關鍵詞:天南星葉綠體核苷酸

許祎珂,寇佩雯,劉長樂,李爽,孫曉春,黃文靜

(陜西中醫藥大學 陜西中藥資源產業化省部共建協同創新中心/秦藥特色資源研究開發國家重點實驗室(培育),陜西 咸陽 712083)

葉綠體是綠色植物光合作用的主要細胞器,具有合成淀粉、色素及蛋白質等功能[1]。在大多數被子植物中,葉綠體遺傳信息來源于母系,所以其基因組相對穩定且基因較保守[2]。1962年,Ris和Plaut[3]在觀察衣藻時發現了葉綠體DNA。1986年,Shinozaki等[4]獲得了第一條(煙草)葉綠體基因組序列。同年,Ohyama等[5]獲得了地錢的葉綠體基因組的完整序列,借助于測序技術的發展,葉綠體基因組的研究愈來愈多。葉綠體基因組大約由130個基因組成(核糖體RNA、轉運RNA、蛋白編碼基因),大小在107 ~ 218 kb之間,這些葉綠體基因組均具有典型的四分體結構,包括一個大單拷貝區(Large single copy,LSC)、一個小單拷貝區(Small single copy,SSC)和兩個反向重復區(Inverted repeats a,IRa;Inverted repeats b,IRb)[6]。近緣植物的葉綠體基因大小、含量可能會因為IR區的收縮擴張而變化,基因突變、插入、倒置、重排等均在葉綠體基因組中被發現[7-8]。由于葉綠體基因組較小并且相對保守,因此其已經成為進化和比較基因組研究的理想模型,可為揭示植物類群的系統位置和遺傳發育關系提供較多的理論依據[9]。

天南星科(Araceae)隸屬于單子葉植物綱的澤瀉目,該家族有110屬3 500余種,主要分布于熱帶地區及部分溫帶地區[10]。該科植物大部分具有重要的藥用價值,常用的中藥材有天南星(Arisaema heterophyllumBlume)、半夏[Pinellia ternata(Thunb.) Breit.]和千年?。跦omalomena occulta(Lour.) Schott]等,其中天南星可燥濕化痰、祛風止痙、散結消腫[11];半夏可燥濕化痰、降逆止嘔[12];千年健具有祛風除濕,強健筋骨等功效[13]。近些年隨著分子生物學和測序技術的發展,關于葉綠體基因組系統發育的研究逐漸增多,如菊科、木犀科和豆科等植物的葉綠體基因組特征及其系統發育關系已被系統報道[14-16]。在天南星科葉綠體基因組研究中,前人分析了白鶴芋[Spathiphyllum lanceifolium(Jacq.) Schott]、綠蘿[Epipremnum aureum(Linden et Andre) Bunting]和滴水珠(Pinellia cordataN. E.Brown)的葉綠體基因組以及近緣物種的關系[17-19],但這些研究均側重于某個物種的葉綠體基因組特征以及部分屬的系統發育。目前,數據庫中的天南星科植物信息不斷增加與更新,亟需開展對該科植物葉綠體基因組全面系統的研究。本研究基于GenBank數據庫中相關葉綠體全基因組序列,針對天南星科物種的親緣關系、遺傳多樣性和系統發育展開分析,以期為該科植物的遺傳學和系統發育進化等研究提供理論依據。

1 數據與方法

1.1 基因組信息

通過NCBI(https://www.ncbi.nlm.nih.gov/)下載GenBank數據庫中現有的天南星科20個物種的葉綠體全基因組序列,并以澤瀉科慈姑屬利川慈姑(Sagittaria lichuanensisJ. K. Chen)和野慈姑(Sagittaria trifoliaL.)的葉綠體全基因組序列為外類群參照,相關物種信息見表1。

表1 葉綠體全基因組信息Tab.1 Chloroplast genome information

1.2 重復序列和SSR分析

使用在線軟件RePuter(https://bibiserv.cebitec.uni-bielefeld.de/reputer)檢索串聯重復序列,參數設置:最小長度為30 bp,最多堿基錯配為3。利用MISA(https://webblast.ipk-gatersleben.de/misa/index.php)檢索葉綠體基因組中SSR重復序列,分別將單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的最小重復設置為8、4、4、3、3和3。

1.3 全基因組分析與共線性分析

以天南星為參照基因組,利用mVISTA(https://genome.lbl.gov/vista/mvista/about.shtml)中的Shuffle-LAGAN模式進行全基因組比較分析,并用Mauve軟件進行共線性分析,檢測基因組中的重排或倒位現象。

1.4 IR邊界收縮、擴張分析

葉綠體基因組中的IR區具有高度保守性,但在不同物種中仍存在微小變化,因此被子植物葉綠體基因組大小的差異與IR邊界的收縮和擴張有很大關系。本研究使用IRscope(https://irscope.shinyapps.io/irapp/)軟件分析IR邊界。

1.5 系統發育分析

以與天南星科同目的澤瀉目下澤瀉科慈姑屬中的利川慈姑和野慈姑作為外類群,利用最大似然法(Maximum likelihood, ML)將天南星科20個物種構建系統發育分析。采用Geneious 8.0.2軟件的MAFFT插件進行序列比對,并使用PhyML(http://www.atgc-montpellier.fr/phyml/)軟件構建系統發育樹,模型為GTR + Gamma,Bootstrap設為1 000。

2 結果與分析

2.1 葉綠體基因組特征

所有的天南星科植物葉綠體基因組皆具有完整的四分體結構(LSC、SSC、IRa和IRb)(表1)。全基因組長度介于158 521(C. esculenta) ~ 175 906 bp(Z. elliottiana)之間,大部分物種的總基因數目介于129 ~ 132個之間。其中,Z. elliottiana和Z. rehmannii的基因數目達到138和139個,基因數目的差異主要是由于蛋白編碼基因數目不一致。天南星科植物葉綠體基因組的rRNA基因最為保守,皆為8個基因。堿基GC含量分析表明,不同天南星科物種葉綠體全基因組的GC含量在33.6% ~ 37.3%之間,同屬的物種GC含量差異很小,而在不同屬之間差異較大。

2.2 重復序列和SSR

采用REPuter對葉綠體基因組中的重復序列進行分析(圖1),所有物種均檢索出50條重復序列。多數物種正向重復(F)、反向重復(R)、互補重復(C)和回文重復(P)4種類型均檢索出,且正向重復和反向重復為主要重復類型;A. heterophyllum、P. cordata、P. peltata、P. pedatisecta、Z. elliottiana、Z. rehmannii和C. bicolor這7個物種中只有正向重復、反向重復、及回文重復;其中Z. elliottiana和Z. rehmannii中只有正向重復和回文重復2種類型。P. cordata、P.peltata、P. pedatisecta、Z. elliottiana和Z. rehmannii這5個物種的50條重復序列長度均大于60 bp,其他物種的重復序列長度以30 ~ 39 bp和40 ~ 49 bp居多(圖2)。

圖1 天南星科植物葉綠體基因組重復序列種類及數量Fig.1 Species and number of chloroplast genome repeats in Araceae

圖2 天南星科植物葉綠體基因組重復序列類型及長度分布Fig.2 Type and length distribution of chloroplast genome repeats in Araceae

利用MISA分析天南星科20個物種的SSR。結果表明(圖3),葉綠體基因組SSR位點數介于253 ~482個之間,除S. renifolius、C. bicolor和C. esculenta這3個物種沒有六堿基重復外,其余物種均有從單堿基重復到六堿基重復6種類型。在所有的SSR重復類型中,單堿基重復和二堿基重復比例較高,六堿基重復最少。單核苷酸重復主要為A/T重復,二核苷酸以AT/AT為主要重復類型,而三、四、五、六核苷酸相對偏少,但是均富含較高含量的A和T堿基。

圖3 天南星科植物葉綠體基因組SSR分布特征Fig.3 SSR distribution of chloroplast genomes in Araceae

2.3 全基因組比較與共線性分析

以天南星為參照,我們使用mVISTA軟件進一步分析了20種天南星科植物葉綠體全基因組序列的差異性。結果表明(圖4),高度可變的區域主要集中在非編碼區中,而較為保守的序列多分布在非翻譯區,并發現3個高度可變區accD、ycf2和ycf1。Mauve共線性分析可知,天南星科10個屬20個物種中,19個物種的葉綠體基因組序列均未檢測到大片段基因重排,說明相對保守,只有S. cannifolium中出現基因重排或倒位現象(圖5)。

圖4 天南星科葉綠體基因組比對Fig.4 Alignment of chloroplast genomes in Araceae

圖5 天南星科20種植物葉綠體基因組共線性分析Fig.5 Synteny analysis of chloroplast genomes of 20 species of Araceae

2.4 IR邊界

通過比較天南星科物種IR邊界分布情況,分析其進化過程中的IR邊界收縮擴張現象。天南星科10個屬的葉綠體基因組中,基因ndhF都位于SSC區(圖6)。除Z. elliottiana的rpl22基因橫跨LSC區和IRb區外,其他屬的植物rpl22基因都完整位于LSC區;除Z. elliottiana外,其他屬植物的rpl2基因均分布在2個IR區;并且大部分植物的rps19基因都完整位于LSC區,唯有Z. elliottiana的rps19基因出現在IR區,這一變異使得rps19基因在Z. elliottiana中為雙拷貝。Zantedeschia屬的植物與其他屬的差異較大,這一結果可能是其IR區過大導致。

圖6 天南星科10個屬的IR邊界比較Fig.6 IR boundary comparison of 10 genera in Araceae

2.5 系統發育分析

基于20個天南星科物種和兩個慈姑屬物種的葉綠體全基因組序列,構建了天南星科的系統發育關系樹(圖7)。利川慈姑和野慈姑作為外類群被聚類到天南星科類群外,其余的20個物種中自展值只有一個低于80%,剩余的自展值均為100%,表明結果可信度較高。在進化樹中,O.aquaticum和S. renifolius并沒有形成單系群,最先從基部聚為一支;其次是S. lanceifolium和S. can-nifolium聚為一支;Z. elliottiana和Z. rehmannii聚為一支,H. occulta作為一個單支與這2個物種聚在一起;P. stratiotes、C. bicolor和C. esculenta這3個物種各為一支;最后是天南星屬中6個物種(A. heterophyllum、A. bockii、A. erubescens、A. nepenthoides、A. decipiens和A. flavum)與半夏屬中4個物種(P. cordata、P. peltata、P. ternata和P. pedatisecta)各聚為一支,并且天南星屬和半夏屬關系最近聚為一支。

圖7 基于天南星科20個物種的葉綠體全基因組序列構建的系統發育樹Fig.7 Phylogenetic trees constructed based on the complete chloroplast genome sequences of 20 Araceae species

3 討論

3.1 重復序列和SSR分析

在物種進化中,重復序列扮演了重要的角色,因其會影響物種內基因的遺傳和變異[20]。本研究發現20個天南星科植物的重復類型主要表現為正向重復和反向重復,少數植物也發現了回文重復和互補重復,特別在黃花馬蹄蓮和紅馬蹄蓮中僅檢索到了正向重復和回文重復。不同植物間重復序列的分布差異可反映植物進化時的遺傳速率基因突變速率的差異[21],這表明天南星科植物在突變頻率和進化速率上的差異可能與重復序列有關,因此可根據重復序列的差異大小推測物種之間的親緣關系遠近。同時,本研究檢索到的重復序列主要分布在非編碼區,與大部分被子植物的研究結果相似[22-24]。已有研究表明,在其他物種中大部分重復序列也都大多分布在非編碼區,這可能與物種在進化過程中通過保留較少遺傳信息來提高遺傳效率有關[20]。

SSR分子標記共顯性、多態性高,且分布廣泛[25],常用于遺傳多樣性分析、物種鑒定、群體結構研究、遺傳圖譜構建和QTL定位等研究[26-27]?;谌~綠體基因組獨特的母系遺傳優勢,植物體葉綠體SSR逐步廣泛應用于遺傳學。本研究發現天南星科物種的葉綠體基因組多以單核苷酸和二核苷酸為主,其他類型的較少。以往研究表明,在所有的SSR類型中,均可發現A和T堿基含量遠高于GC含量,這與天南星科植物的葉綠體基因組的結果相似[28]。

3.2 全基因組對比分析

mVISTA全局比對分析可知變異主要集中在非編碼區,并發現accD、ycf2和ycf1三個高度可變區,與Ren等[22]研究的Cyperus esculentusLinnaeus和Fu等[29]研究的Dracocephalum heterophyllumBenth.結果相似。這些高度可變區域可用于DNA條形碼研究,從而用于天南星科植物中的物種鑒別和遺傳圖譜分析。

3.3 IR邊界分析

IR區的收縮和擴張是植物進化中的普遍現象,同時也是導致葉綠體基因組大小差異的主要原因[30]。本研究中,在天南星科10個屬中,rps19基因、rpl12基因、ndhF基因和trnH基因所居位置高度相似,說明天南星科IR區有一定的保守性。Z.rehmannii與其他屬相比,差異較大,可能因其IR區擴張導致。在被子植物中,假基因ycf1和rps19基因源于IR區的收縮和擴張[31]。在物種H. occulta中,ycf1基因從IR區開始并整合進入SSC區,導致假基因的形成,功能拷貝基因則出現在IRa/SSC的交界處,而其他物種的ycf1基因主要位于SSC區,并且不會導致假基因的形成?;騬ps19通常位于LSC/IR和SSC/IR區,在天南星科植物中,rps19基于主要位于LSC區,這個結果與Liang等[32]研究的殼斗科類似。

3.4 系統發育分析

本研究基于天南星科20個物種的葉綠體全基因組序列構建系統發育樹,該科各屬的關系得到較好處理,10個屬各聚為一支,且節點支持率較高。目前,基于葉綠體基因組測序技術的快速發展,對天南星科中少部分物種的種間關系和屬間關系已有研究報導。Zhang等[33]對A. erubescens和Cai等[34]對P. ternata的研究中,天南星屬植物和半夏屬植物關系最近,與本研究結果一致,并且在本研究中通過mVISTA、Mauve等分析也發現天南星屬植物和半夏屬植物的葉綠體基因組序列相似度最高。在羅須等[19]的研究中,大薸(P. stratiotes)和芋(C.esculenta)與天南星屬和半夏屬聚為一支,與本研究中大薸和芋的系統位置相似,說明在天南星科中大薸和芋與天南星屬和半夏屬植物關系較近。對于天南星科的其他物種,由于目前數據缺少,尚不能進一步探討。

本研究基于天南星科10個屬20個物種的葉綠體全基因組序列,分析了基因組的大小、長度、基因數量、序列變異和基因邊界變化等特征,并基于葉綠體全基因組序列構建了系統發育樹,且支持率較高,可為天南星科的系統分類和進化關系提供有力的證據。隨著高通量測序技術的發展,系統發育關系研究逐漸邁入基因組水平。然而,對于天南星科家族而言,當前該科物種的葉綠體基因組信息數量偏少,因此仍需更進一步開展測序與分析研究,為該科屬間關系和種間關系的研究提供科學依據。

猜你喜歡
天南星葉綠體核苷酸
天南星的臨床應用及其用量探究
單核苷酸多態性與中醫證候相關性研究進展
徐長風:核苷酸類似物的副作用
天南星和虎掌的本草考證
中草藥天南星的研究進展
A Network Pharmacology Analysis of Cang Fu Dao Tan Formula for the Treatment of Obese Polycystic Ovary Syndrome
Acknowledgment to reviewers—November 2018 to September 2019
南方紅豆杉葉綠體非編碼序列PCR體系優化及引物篩選
廣東人群8q24rs1530300單核苷酸多態性與非綜合征性唇腭裂的相關性研究
茶樹葉綠體DNA的PCR-RFLP反應體系優化
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合