?

無籽刺梨及其近緣種葉綠體基因組序列比較分析

2024-03-19 04:41黃嘉城段曉盟張曉琳馮家玉甘沛華何承忠
關鍵詞:無籽繅絲刺梨

縱 丹, 黃嘉城, 段曉盟, 張曉琳, 馮家玉, 甘沛華, 何承忠

(1.西南林業大學云南省高校林木遺傳改良與繁育重點實驗室;2.西南林業大學 西南山地森林資源保育與利用教育部重點實驗室,云南 昆明 650224)

無籽刺梨(RosasterilisS. D. Shi),又名搭鉤刺梨、光枝無子刺梨、安順金刺梨等,是薔薇科(Rosaceae)薔薇屬(Rosa)植物。其由于無法產生可育種子而得名,是貴州特有的刺梨種,主要分布在貴州安順、興仁等地[1-2]。其果實清爽可口,富含維生素C等營養物質,因此被稱為“維C之王” 。無籽刺梨還富含多種氨基酸和礦物元素,具有較高的營養價值和開發利用價值。此外,無籽刺梨的根系發達,生長迅速,因此在退耕還林等工程造林中被視為優選樹種[2-3]。

刺梨(R.roxburghiiTratt),又名繅絲花,同屬薔薇科薔薇屬植物。季祥彪等[4]基于形態學比較分析認為,無籽刺梨可能是一種自然雜交種,它與刺梨在葉型、果形和花序等方面高度相似。單瓣繅絲花(R.roxburghiif.normalisRehd et Wils)是繅絲花的變型,是其野生原始類型,兩者的形態和解剖結構基本相似[5]。文曉鵬等[6]結合形態學特征和RAPD分子標記對刺梨及部分近緣種的親緣關系進行探討,結果顯示,無籽刺梨與貴州繅絲花(R.kweichowensisT. T. Yu &T. C. Ku)的遺傳距離最近,并推測無籽刺梨可能來源于貴州繅絲花的高度雄性不育種。陳睿等[7]基于33個形態學性狀對8種野生薔薇的親緣關系進行了研究,聚類結果顯示,刺梨與紫花重瓣玫瑰[Rosarugosaf.plena(Regel) Byhouwe]和無籽刺梨聚在一組。李旦等[8]基于AFLP分子標記和DNA條形碼分析結果認為,刺梨與無籽刺梨是獨立的2個種。鄧亨寧等[9]基于葉綠體基因片段和核基因片段的綜合分析結果認為,無籽刺梨起源于長尖葉薔薇(R.longicuspisBertal)和刺梨的天然雜交種,且長尖葉薔薇為母本。陳興銀等[10]基于形態學特征比較分析表明,無籽刺梨與貴州繅絲花和刺梨的親緣關系較近,內轉錄間隔區(internal transcribed spacers,ITS)的序列分析則表明,無籽刺梨與長尖葉薔薇聚為一支。Han et al[11]基于葉綠體全基因組構建最大似然(maximum likelihood,ML)樹,結果表明,無籽刺梨與中國月季(R.chinensisJacq)或單瓣月季(R.chinensisvar.spontanea)親緣關系較近。綜合上述分析,不同研究方法得出的結果在無籽刺梨的分類地位存在一定的差異。

葉綠體是綠色植物進行光合作用和碳固定的場所。作為半自主性細胞器,葉綠體具有一套完整的基因組,其遺傳方式以母系為主[12-13]。大多數植物的葉綠體基因組呈典型的四分體結構,包括兩個反向重復區(inverted repeat region, IR)、大單拷貝區(large single copy region, LSC)和小單拷貝區(small single copy region, SSC)[13]。長度一般120~160 kb,但最新研究結果表明,部分植物的葉綠體基因組長度可達到170 kb[14-16]。與核基因組和線粒體基因組相比,葉綠體因基因組較小、不易發生重組、進化速率較慢且序列較為保守等特征,在探究物種起源、演化以及物種間親緣關系分析等方面具有重要應用[17-20]。截至2022年12月,研究者已經對大約110個薔薇屬植物(包括種、變種、雜交種和品種)的葉綠體基因組進行了測序工作。

本試驗采用比較基因組學的研究方法,對無籽刺梨、刺梨、貴州繅絲花、單瓣繅絲花、長尖葉薔薇和中國月季的葉綠體全基因組進行了分析。研究內容包括編碼基因的組成、單拷貝(single copy, SC)區與IR區邊界的比較、簡單重復序列(simple sequence repeats,SSR)的鑒定以及基因組范圍內的高變區序列的鑒定。此外,基于葉綠體全基因組序列,重建了薔薇屬植物的系統進化樹,旨在揭示無籽刺梨及其近緣種之間的親緣關系,并為薔薇屬植物的系統進化研究提供重要的分子標記。

1 材料與方法

1.1 無籽刺梨及其近緣種葉綠體基因組序列

從NCBI基因組數據庫(https://www.ncbi.nlm.nih.gov/)下載6種薔薇屬的葉綠體基因組序列。具體物種信息為:無籽刺梨(MW007387)、刺梨(KX768420)、貴州繅絲花(MZ261861)、中國月季(MH332770)、長尖葉薔薇(MZ261890)、單瓣繅絲花(MZ261869)。

1.2 葉綠體基因組序列組成和編碼基因

利用Geneious軟件分別確定6種植物葉綠體基因組序列LSC、SSC和IR區的長度,GC含量以及編碼基因的類型和數目。

1.3 IR區邊界的收縮與擴張分析

利用IRScope工具(https://irscope. shinyapps. io/irapp/)[21]對各區域連接位點進行可視化分析,直觀呈現6個葉綠體基因組邊界區域在IR、SSC和LSC之間的變化。

1.4 SSR分析

利用MISA軟件(http://misaweb.ipk-gatersleben.de/)分析6種植物葉綠體基因組SSR位點。參數設置:單核苷酸最低重復次數為10次,二核苷酸最低重復次數為6次,三核苷酸、四核苷酸、五核苷酸和六核苷酸的重復次數均為5次。

1.5 葉綠體基因組高變區分析

采用DnaSP V5軟件[22]并利用滑動窗口分析的方法計算薔薇屬40個葉綠體基因組(包括37種植物)(表1)的核苷酸多態性(nucleotide diversity)Pi。參數設置為窗口長度600 bp,步長200 bp,基于R語言繪制折線圖,同時結合Geneious軟件分析薔薇屬植物葉綠體基因組內高變區片段。

表1 用于高變區及系統發育分析的葉綠體基因組Table 1 Chloroplast genome of Rosa species for hypervariable region and phylogeny analysis

1.6 薔薇屬植物的系統進化樹構建

從NCBI基因組數據庫另外下載薔薇屬34種植物的葉綠體基因組序列,以薔薇科稠李屬(Prunus)的稠李(P.padus)和桃(P.persica)作為外類群(表1),采用MAFFT軟件[23]對葉綠體基因組序列進行比對分析,其結果經過BioEdit軟件進一步優化處理。優化后采用IQ-TREE軟件構建薔薇屬植物的ML樹[24],基于IQ-TREE內置的ModelFinder[25]篩選出建樹的最佳模型TVM+F+R9,重復次數為1 000,最后將建樹結果采用Figtree軟件進行美化。

2 結果與分析

2.1 葉綠體基因組大小與結構

從NCBI基因組數據庫下載了6種植物(無籽刺梨、刺梨、貴州繅絲花、中國月季、長尖葉薔薇和單瓣繅絲花)的葉綠體基因組序列,并對其序列和編碼基因進行了統計和比較(表2)。這些薔薇屬植物的葉綠體基因組長度為156 561~156 749 bp。其中,刺梨的葉綠體全基因組序列最長,為156 749 bp,而無籽刺梨和貴州繅絲花的葉綠體全基因組序列最短,為156 561 bp。與長尖葉薔薇相比,無籽刺梨和貴州繅絲花的葉綠體全基因組序列長度分別短了95和125 bp,而與中國月季相比僅相差30 bp。這6種薔薇屬植物的葉綠體基因組的平均GC含量均為37.2%。另外,LSC、SSC和IR區長度分別為85 701~85 852 bp、18 746~18 792 bp和26 044~26 063 bp,IR區GC含量均高于LSC區和SSC區(表2)。

表2 6種薔薇屬植物的葉綠體基因組Table 2 Summary of chloroplast genome sequences of 6 Rosa species

經過對6種植物葉綠體基因組編碼基因進行比較分析,發現無籽刺梨、貴州繅絲花、單瓣繅絲花和中國月季共編碼129個基因,包括84個蛋白編碼基因、8個rRNA基因和37個tRNA基因。而長尖葉薔薇共編碼128個基因,刺梨共編碼131個基因。與前述的4種植物相比,長尖葉薔薇的差異在于tRNA基因數目少1個,而刺梨的差異在于tRNA基因數目多2個,共有39個tRNA基因。

2.2 IR區邊界的收縮與擴張

IR區作為葉綠體基因組中最保守的區域,其邊界的擴張和收縮可導致葉綠體基因組長度發生改變[26]。本試驗將6種植物的葉綠體基因組的IR/SSC區的邊界情況進行了比較分析(圖1)。結果表明:這些植物的4個邊界基因類型和排列順序完全一致,未出現基因的擴張或收縮,SSC/IRb邊界(junction of SSC/IRb, JSB)和SSC/IRa邊界(junction of SSC/IRa, JSA)均位于ycf1基因內部,且向IR區擴張的長度均為1 106 bp;除了單瓣繅絲花的rps19基因距離LSC/IRb的邊界(junction of LSC/IRb, JLB)為15 bp外,其余樹種的距離均為14 bp。此外,LSC/IRa區的邊界(junction of LSC/IRa, JLA)位于trnH附近,單瓣繅絲花的JLA與trnH的距離為9 bp,而無籽刺梨、刺梨、中國月季、長尖葉薔薇和貴州繅絲花JLA與trnH的距離分別為3、3、3、2、2 bp,表明無籽刺梨及其近緣種之間的葉綠體基因組結構具有高度保守性。

圖1 葉綠體基因組邊界分析Fig.1 Analysis on chloroplast genome boundary

2.3 SSR

利用MISA程序對無籽刺梨及其近緣種葉綠體基因組中SSR序列進行檢測(圖2),在6個物種的葉綠體基因組中,發現了3種類型的SSR序列重復基序,分別是單核苷酸(P1)、二核苷酸(P2)和復合型(C)。其中,單核苷酸重復類型最多,主要由A和T堿基重復組成,二核苷酸重復類型相同且均為AT堿基重復,表明無籽刺梨及其近緣種具有較強的AT偏向性。對無籽刺梨及其近緣種葉綠體基因組SSR序列進行比較分析表明,6種植物SSR類型和數目高度相似,除無籽刺梨和貴州繅絲花的SSR位點數量為50個(包括38個P1+3個P2+9個C)外,其他4種植物的SSR總數均為49個(圖2)。

P1:單核苷酸SSR;P2:二核苷酸SSR;C:復合型SSR。

2.4 核苷酸多樣性

采用DnaSP軟件對40個薔薇屬植物的葉綠體基因組進行變異位點分析,發現共有3 753個多態位點。不同區段的葉綠體基因組Pi為0~0.015 6,平均值0.003 4。SC區變異核苷酸多樣性高于IR區(圖3),以Pi>0.01為閾值,篩選出了7個核苷酸變異較大的區段,包括trnK-trnQ、psbM-trnY、ycf3-rps4、rps4-trnL、psbE-petG、rpl16 intron和ycf1。除ycf1位于SSC區外,其余均位于LSC區。7個高變區片段中,5個為基因間隔片段,1個為內含子片段,1個為蛋白編碼基因片段。這說明基因間隔區域表現出比編碼區更高的核苷酸多樣性。

圖3 薔薇屬40個物種的核苷酸多樣性分析Fig.3 Analysis on nucleotide diversity of 40 Rosa species

2.5 系統發育

本試驗共涉及40種薔薇屬植物,包括無籽刺梨及其近緣種。對這些植物的葉綠體全基因組進行了研究,并結合7個高變區片段的聯合矩陣,利用ML法構建了系統發育樹(圖4和圖5)。結果表明,基于高變區片段聯合矩陣構建的系統發育樹與基于葉綠體全基因組構建的系統發育樹的拓撲結構完全一致。兩者均表明無籽刺梨和刺梨位于不同的分支,為2個獨立的種。其中,刺梨與單瓣繅絲花聚為一個分支,互為姊妹關系;無籽刺梨、貴州繅絲花、中國月季和長尖葉薔薇聚為一支,且無籽刺梨與貴州繅絲花聚為一個高支持率的小支(支持率100%),并互為姊妹關系。

圖4 基于葉綠體全基因組構建的系統發育樹Fig.4 Phylogenetic tree based on complete chloroplast genome

圖5 基于高變區序列構建的系統發育樹Fig.5 Phylogenetic tree based on hypervariable regions

3 討論

植物葉綠體基因組通常由LSC、SSC、IRa和IRb組成,薔薇屬植物葉綠體基因組與絕大多數植物一樣,呈閉合環狀雙鏈結構,具有典型的四分體結構[27]。本研究對無籽刺梨、刺梨、貴州繅絲花、中國月季、長尖葉薔薇和單瓣繅絲花的葉綠體基因組進行了比較。結果表明,無籽刺梨及其近緣種之間葉綠體基因組高度相似,基因組長度為156 561~156 749 bp,總GC含量均為37.2%,且IR區GC含量高于LSC區和SSC區,4個rRNA基因位于IR區,這可能是導致IR區GC含量較高的原因[28]。IR區是葉綠體基因組中最保守的區域,在植物葉綠體基因組進化過程中,IR邊界的收縮與擴張決定著植物葉綠體基因組的長度[26],此外,IR區的收縮和擴張頻率也可反映物種之間的進化關系[29-30]。在本研究中,對這6種薔薇屬植物的葉綠體基因組進行了詳細比較,發現各區域的穩定性較高,IR區的收縮或擴張對基因組長度影響較小。因此,推測這些植物葉綠體基因組大小的差異可能是由基因間隔區的插入或缺失所引起的[31]。

葉綠體基因組中的SSR(cpSSR)具有高復制率、共顯性遺傳、高多態性和母系遺傳等特點,因此在物種鑒定、目的基因標記和系統發育研究中得到廣泛應用[32-33]。對無籽刺梨及其近緣種cpSSR進行比較分析表明,6種植物的SSR類型和數目基本一致。其中,最常見的SSR位點是單核苷酸,主要由A/T組成,二核苷酸均為AT重復類型,進一步表明無籽刺梨及其近緣種葉綠體基因組偏好使用A或T堿基[34]。

在植物物種鑒定中,常選擇進化速率較快的葉綠體基因片段和核糖體的ITS作為DNA條形碼[35]。然而,薔薇屬植物葉綠體基因組高度保守的結構、基因數目和順序,導致其基因或結構標記的變異程度較低,限制了薔薇屬物種親緣關系的分析[26,36-37]。為了解決這個問題,Wu et al[38]和Wissemann et al[39]分別采用rbcL、matK、ndhC-trnV、atpB-rbcL、psbJ-petA、ndhJ-trnF、ndhF-rpl32作為DNA條形碼分析薔薇屬系統發育關系,但部分序列的變異率較低,無法有效區分近緣種。因此,篩選變異率較高的高變區片段對于近緣種的鑒定和系統發育分析非常必要。本研究對40個薔薇屬植物葉綠體基因組進行比較分析,共檢測到7個高變區片段,其中ycf1在其他植物中也具有較高的變異[40]。本試驗將獲得的這7個高變區片段聯合進行系統發育樹的構建,結果與全基因組序列構建的系統進化樹一致,證明了這些高變區片段在薔薇屬物種親緣關系研究中的有效性,可以進一步利用這些高變區片段作為候選標記,進行薔薇屬低分類階元的系統發育和進化研究[41]。

本試驗結果表明,無籽刺梨和刺梨是2個獨立的種。其中,無籽刺梨與貴州繅絲花、長尖葉薔薇和中國月季聚為一支,且貴州繅絲花與無籽刺梨互為姊妹關系,刺梨與單瓣繅絲花互為姊妹關系,此結果與文曉鵬等[6]、李旦等[8]研究結果一致;但與陳興銀等[10]、鄧亨寧等[9]研究結果略有差異。這種差異可能源于樣本數量的不同。此外,與單個葉綠體基因片段相比,完整的葉綠體基因組可以提供更多的信息位點,從而更有助于研究低分類水平物種之間的親緣關系。這也可能是導致差異的原因之一[42]。

猜你喜歡
無籽繅絲刺梨
貴州刺梨專題書法作品
貴州刺梨專題纂刻作品
無籽刺梨扦插育苗技術研究
家蠶單??壗z質評價體系初報
不同施肥水平對金刺梨生長的影響
無籽刺梨的研究現狀及展望
無籽葡萄是用避孕藥培育的嗎?
嫘祖繅絲
桐鄉市蠶桑生產與繅絲業現狀調查
繅絲張力對絲纖維結構與力學性能的影響
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合