?

紫葉風箱果葉綠體基因組特征及繡線菊亞科系統發育分析

2024-03-22 01:08黃祥何夢瑤王子煊楚光明江萍
草業學報 2024年3期
關鍵詞:繡線菊紫葉風箱

黃祥,何夢瑤,2,王子煊,楚光明,江萍,2*

(1. 石河子大學農學院,新疆 石河子 832003;2. 新疆生產建設兵團特色果蔬栽培生理與種質資源利用兵團重點實驗室, 新疆 石河子 832003)

繡線菊亞科(subfam. Spiraeoideae)是薔薇科(Rosaceae)最原始的亞科,全球共22 屬260 余種,我國有8 屬100 種[1]。紫葉風箱果(Physocarpus opulifolius‘Diabolo’)為薔薇科,繡線菊亞科,風箱果屬(Physocarpus)落葉灌木,是我國近年來從北美引入的觀賞性花灌木;其枝葉整個生長季均呈紫色,花多而密,果實紅色且宿存,具有較高的觀賞價值,是園林綠化中優良的觀花灌木和彩葉觀賞樹種,其形態特征及繁殖能力均優于我國分布的風箱果屬中唯一的古老殘遺種:風箱果(Physocarpus amurensis)[2]。目前,國內外學者對風箱果屬物種的研究主要集中在栽培技術[3-4]、逆境脅迫[5-7]、雜交育種[8-10]等方面,關于風箱果屬物種的系統發育研究較少[11]。然而,紫葉風箱果的分子遺傳信息缺失不僅限制了其對風箱果屬分類和遺傳多樣性的研究,也阻礙了該優良品種在風箱果育種中的應用。

葉綠體是具有高級自主遺傳系統的細胞器,在高等植物的能量轉換器中發揮著重要作用[12]。與核基因組相比,植物葉綠體基因組在結構組成和基因類型方面具有相對保守性[13]。被子植物具有高度保守的環狀葉綠體基因組,包含一個大單拷貝區(large single copy, LSC)和一個小單拷貝區(small single copy, SSC),由成對的反向重復區(inverted repeats, IR)分隔。陸生植物物種的葉綠體基因組包括120~130個不同的基因,其中大多數編碼與光合作用相關的蛋白質(約79個),其余的基因編碼轉移RNA(約30個)和核糖體RNA(4個)[14]。由于葉綠體基因組結構簡單,缺乏重組、單親遺傳特征,其在植物研究的不同分類水平上得到了廣泛研究,如:分子鑒定[15]、系統發育[16-17]、種群遺傳[18]等。此外,葉綠體基因組中存在一些簡單重復序列(simple sequence repeats, SSR)和單核苷酸多態性(single nucleotide polymorphism, SNP)的熱點區域,可產生足夠的信息用于物種分類和鑒定[19]。同時,植物葉綠體基因組中的密碼子偏好性也可以反映其在進化過程中的分子適應程度和受到的進化壓力。

本研究首次對風箱果屬中紫葉風箱果的葉綠體基因組進行測序、組裝和注釋,進一步分析其葉綠體基因組特征和密碼子偏好性等;此外,將其與已公布葉綠體基因組的繡線菊亞科物種構建系統發育樹,進一步篩選種間基因組高變區。本研究目的在于:1) 闡明紫葉風箱果與其他繡線菊亞科物種的進化關系及其在系統發育中的地位;2) 篩選有效的候選分子標記序列和最優密碼子,以期為紫葉風箱果的分子遺傳標記、進化發育及葉綠體基因工程研究提供參考。

1 材料與方法

1.1 試驗材料

植物樣本來源于石河子大學校園內(84°03' E,44°18' N,海拔450 m),經石河子大學王梅教授鑒定為紫葉風箱果。2022 年5 月初,采集新鮮葉片,用液氮處理后置于液氮保溫桶,帶回實驗室放入-80 ℃冰箱保存。

1.2 試驗方法

1.2.1 葉綠體基因組測序、組裝與注釋 使用改良的CTAB 法[20]在紫葉風箱果新鮮葉片(100 mg)中提取其全基因組DNA。使用Illumina NovaSeq 6000 平臺進行配對末端(pair end,PE)測序,測序讀取長度為150 bp。使用fastp v0.20.0 軟件篩選原始數據,去除接頭并過濾掉Q-score≤5 占堿基數50%以上的reads,獲得高質量的干凈數據。使用GetOrganelle 軟件[21]中的assembly 和graph.gfa 命令組裝紫葉風箱果的葉綠體基因組。組裝后使用風箱果葉綠體基因組序列(登錄號MK911770)進行質量控制。為了提高注釋準確性,分別使用Prodigal v2.6.3、Hummer v3.1b2、Aragorn v1.23[22]在默認設置和置信度≥95%的情況下對編碼序列(coding sequence, CDS)、核糖體RNA(ribosomal RNA, rRNA)、轉運RNA(transfer RNA, tRNA)進行注釋,利用Sequin[23]檢查注釋缺失或錯誤的基因。使用OGDRAW v.1.3.1 軟件[24]繪制整個基因組環狀結構圖。最終,紫葉風箱果完整葉綠體基因組數據上傳至GenBank 數據庫(https://www.ncbi.nlm.nih.gov/genbank/),登錄號為OQ612669。

1.2.2 密碼子偏好性分析 篩選長度大于300 bp 的基因序列,使用Codon W 1.4.2 軟件和CUSP 在線程序(https://emboss. toulouse. inra. fr/cgi-bin/emboss/cusp)對有效密碼子數、同義密碼子相對使用度(relative synonymous codon usage, RSCU)、密碼子鳥嘌呤和胞嘧啶(guanine and cytosine, GC)含量和最優密碼子進行計算。通過中性繪圖、ENC-plot 和PR2-plot 分析密碼子偏好性的影響因素。

1.2.3 葉綠體基因組重復序列分析 使用REPuter v1.0 確定正向、反向、互補和回文序列,最大重復序列數為100 bp,最小重復大小為22 bp,同源性為90%[25]。使用MISA 軟件[26]檢查簡單重復序列(SSR)的位置和基序。分別使用10、5、4、3、3 和3個重復單元的閾值來檢測單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的SSR。

1.2.4 葉綠體基因組突變位點和IR 邊界分析 使用DnaSP v6.0 計算風箱果屬2個物種之間的核苷酸多態性(窗口長度設置為600 bp,步長為200 bp)[27]。將紫葉風箱果和風箱果的GenBank 格式的葉綠體基因組文件上傳至生信云在線分析網站(http://112.86.217.82:9919/#/tool/alltool/detail/296),進行葉綠體基因組IR 區邊界區域上基因的可視化。

1.2.5 系統發育分析 從NCBI 的GenBank 數據庫下載繡線菊亞科其他15個物種的葉綠體基因組序列,和3種薔薇科物種的葉綠體基因組序列(表1)。以3 種薔薇科物種的葉綠體基因組序列作為外群,與測得的紫葉風箱果葉綠體基因組序列一起用于比較和分析系統發育。使用ModelFinder[28]估計了最佳擬合模型(TVM+F+R2)?;谧罴褦M合模型,使用IQ-TREE v. 2.1.1[29]推斷構建了步長值為1000 的最大似然法(maximum likelihood, ML)系統進化樹。

表1 其他物種葉綠體基因組序列信息Table 1 Chloroplast genome sequence information of other species

2 結果與分析

2.1 葉綠體基因組基本特征

紫葉風箱果葉綠體基因組呈典型的雙鏈環狀四分體結構(圖1),全長為159131 bp,LSC 長87582 bp、SSC 長18829 bp、反向重復區a(IRa)和反向重復區b(IRb)長26360 bp。葉綠體基因組GC 含量為36.43%,其中, LSC、SSC、IR 區的GC 含量分別為34.32%、36.41%、40.50%。

紫葉風箱果葉綠體基因組中共注釋到130個基因,包含83個蛋白編碼基因,8個rRNA 基因,37個tRNA 基因和2個假基因。其中75個基因與自我復制功能相關,45個基因與光合作用功能相關,5個基因編碼其他蛋白質,6個基因的功能未知(表2)。18個基因存在雙份拷貝,包括6個蛋白編碼基因(rpl2、rpl23、rps12、rps7、ndhB、ycf2),8個tRNA 基因(trnA-UGC、trnI-CAU、trnI-GAU、trnL-CAA、trnN-GUU、trnR-ACG、trnS-GCU、trnV-GAC)和4個rRNA 基因(rrn16S、rrn23S、rrn4.5S、rrn5S)。

紫葉風箱果葉綠體基因組中有17個基因包含內含子,12個基因位于LSC 區,4個基因位于IR 區,1個基因位于SSC 區 (表3)。15個基因包含1個內含子(trnK-UUU、rps16、trnG-GCC、atpF、rpoC1、trnL-UAA、trnV-UAC、petB、petD、rpl16、rpl2、ndhB、trnI-GAU、trnA-UGC、ndhA),2個基因包含2個內含子(ycf3、clpP)。內含子長度為516 (trnL-UAA)~2499 bp(trnK-UUU)。

表3 紫葉風箱果葉綠體基因組中含內含子的基因信息Table 3 Information of gene introns in the chloroplast genome of P. opulifolius ‘Diabolo’ (bp)

2.2 密碼子偏好性分析

紫葉風箱果葉綠體基因組中RSCU 值為0.47(CGC)~1.90(AGA),28個密碼子為高表達優越密碼子(ΔRSCU≥0.08),32個密碼子為高頻密碼子(RSCU>1)。共確定12個最優密碼子(UUG、AUU、GUU、GUA、UAA、AAA、UCU、UCC、CCU、ACU、GCU、GGU),除編碼亮氨酸的密碼子UUG 及編碼絲氨酸的UCC 外,均以A/U 結尾(表4)。

進一步通過ENC-plot、ENC 分布直方圖、PR2-plot 和中性繪圖,分析紫葉風箱果葉綠體基因組中密碼子偏好性的影響因素。由圖2A 可知,大部分基因的分布在期望曲線附近;由圖2B 可知,大部分基因的ENC 值小于ENC 期望值,且分布在直方圖的0~0.05 區間內的基因數量較多。由圖2C 可知,4個象限點的數量分布不均勻,中線上方基因數量小于下方基因數量,水平方向差異不大。由圖2D 可知,GC12 和GC3 含量變異范圍小,GC12和GC3 主要分布在0.3~0.5 和0.2~0.4;GC12 和GC3 之間線性回歸系數為0.3293,進一步表明突變因素對密碼子使用偏好性的影響占32.93%。因此,紫葉風箱果葉綠體基因組密碼子使用偏好性主要受自然選擇影響,突變等因素對其影響較弱。

圖2 ENC-plot 分析(A)、ENC 分布直方圖(B)、PR2-plot 分析(C)以及中性繪圖分析(D)Fig.2 Analysis of ENC-plot (A), distribution histogram of ENC (B), analysis of PR2-plot (C), and analysis of neutrality plot (D)

2.3 序列重復分析

紫葉風箱果葉綠體基因組中共有27 對長序列重復,其中正向重復12 對,反向重復5 對,回文重復10 對,無互補重復序列(圖3)。其中,重復長度為23 bp 的數量最多,占總數的37.04%;分布在LSC 區的重復長序列數量最多,占總數的59.26%。紫葉風箱果葉綠體基因組中,共確定87個SSR 位點,屬于8 種重復類型(表5)。其中,單堿基A/T 重復類型的SSR 數量最多,占總數的74.71%;且重復次數在9、10、11 次最為常見,分別有25、13、10個SSR 位點。此外,SSR 在非編碼區數量最多,占總數的88.51%;基因中SSR 占總數的14.10%,蛋白編碼序列中SSR 占總數的11.49%。

圖3 紫葉風箱果葉綠體基因組長序列重復分析Fig.3 Analysis of long number of repeat sequences in the chloroplast genome of P. opulifolius‘Diabolo’

表5 紫葉風箱果葉綠體基因組簡單重復序列信息Table 5 Number of SSRs identified in the chloroplast genome of P. opulifolius ‘Diabolo’

2.4 突變熱點分析

將風箱果屬的紫葉風箱果和風箱果葉綠體基因組序列進行突變熱點分析。結果表明,LSC 和SSC 區的核苷酸多態性高于IR 區(圖4)。序列比對總長度為159290 bp,序列一致位點長度為158951 bp, 突變位點數為36;核苷酸多態性平均值為0.00023,范圍為0~0.00667。其中,8個突變位點的核苷酸多態性大于0.00400,均在LSC區;分別屬于trnfM(CAU)-rps14、trnH(GUG)-psbA、rpl20-rps12基因間區和psbZ、trnG(UCC)、trnfM(CAU)、trnH(GUG)、psbA、rbcL、rpl20基因區。

圖4 風箱果屬植物葉綠體基因組序列核苷酸多態性分析Fig.4 The nucleotide diversity of chloroplast genome sequence of Physocarpus species

2.5 IR 邊界收縮和擴張分析

風箱果屬的紫葉風箱果和風箱果葉綠體基因組邊界分析顯示,IR 區長度無變化,但4個邊界區的過渡區域存在一定差異(圖5)。風箱果屬2個物種的葉綠體基因組在LSC-IRb 邊界均存在rps19基因,向IRb 區擴張178 bp;IRb-SSC 邊界均存在ndhF基因,向IRb 區擴張10 bp;SSC-IRa 邊界均存在ycf1基因,向SSC 區擴張4621 bp;IRa-LSC 邊界不存在擴張現象。紫葉風箱果葉綠體基因組ycf1基因向SSC 區擴張14 bp,風箱果中不存在這種現象。

圖5 風箱果屬植物葉綠體基因組IR 邊界收縮和擴張分析Fig.5 Analysis of IR boundary contraction and expansion in chloroplast genome of Physocarpus species

2.6 系統發育分析

為確定紫葉風箱果在繡線菊亞科的系統位置,將其和19個繡線菊亞科物種的葉綠體基因組進行系統發育分析,并以3 種薔薇亞科物種為外群,構建了ML 系統發育樹(圖6)。結果表明,繡線菊亞科物種系統發育樹共分為兩個大的分支,聚類的支持率較高,大部分節點的支持率為100%。第一分支包含5個繡線菊屬物種、1個鮮卑花屬物種和2個假升麻屬物種,第二分支包含2個風箱果屬物種、1個繡線梅屬物種、3個珍珠梅屬物種和2個白鵑梅屬物種。第二分支中風箱果屬和繡線梅屬物種聚成一小支,珍珠梅屬和白鵑梅屬物種聚成一小支。其中紫葉風箱果和風箱果聚成一小支,親緣關系最近。

圖6 基于最大似然法構建的繡線菊亞科葉綠體基因組系統發育樹Fig.6 The maximum-likelihood tree of subfam. Spiraeoideae species based on analyses of the chloroplast genomes

3 討論

紫葉風箱果葉綠體基因組呈典型的四分體結構,具有LSC、SSC 和兩個IR 區域,這和先前報道的路邊青(Geum aleppicum)[30]、花楸(Sorbus koehneana)[31]、長柄扁桃(Amygdalus pedunculata)[32]等薔薇科物種的葉綠體基因結構相似。Wolf 等[33]研究表明,被子植物葉綠體基因組長度通常為120~180 kb,IR 區為20~30 kb。本研究中,紫葉風箱果葉綠體基因組全長為159131 bp,IR 區長度為26360 bp,這也進一步表明葉綠體基因組的保守性。IR 區域是葉綠體基因組中最保守的區域,被子植物葉綠體基因組大小與IR 區和拷貝區邊界的擴張和收縮密切相關[34-35]。本研究中,紫葉風箱果和風箱果的葉綠體基因組大小僅相差21 bp,這可能與兩者IR 區長度的一致性相關。紫葉風箱果葉綠體基因組的平均GC 含量為36.43%,這與薔薇科植物葉綠體基因組的平均GC 含量為35%~40%的結果一致[36],表明紫葉風箱果進化率較低[37];IR 區的GC 含量高于LSC 和SSC 區,這可能與IR 區分布大量GC 含量較高的rRNA 有關[38],這也和其他薔薇科植物葉綠體基因組的特征一致[39]。

密碼子偏好性通過平衡自然選擇和突變偏好性顯著影響葉綠體基因組的進化[40]。前人研究表明,中性突變發生在第3個密碼子位置,G/C 和A/T 將同樣存在于葉綠體基因組內的密碼子組中[41]。本研究中,在RSCU 值大于1 的32個密碼子中,29 種密碼子均以A/U 結尾;當RSCU 值小于1 時,多以G/C 結尾;這表明以A/U 結尾的同義密碼子更多地參與紫葉風箱果葉綠體基因組的蛋白質編碼基因的過程,密碼子第3 位堿基存在不對稱性,密碼子使用偏好性主要受自然選擇影響,中性突變等因素對其影響較弱,這與前人在雙子葉植物中密碼子使用偏好性的研究一致[42-43]。此外,本研究在紫葉風箱果葉綠體基因組中確定了12個最優密碼子,除編碼亮氨酸的密碼子UUG 與編碼絲氨酸的UCC 外,均以A/U 結尾,這為紫葉風箱果中外源基因密碼子的優化提供了理論依據。

重復序列和SSR 廣泛存在于植物葉綠體基因組中,重復序列的類型、數量和位置因物種而異,它們用于識別葉綠體基因組突變熱點[44-45]。本研究中,分布在LSC 區的重復長序列數量最多,LSC 和SSC 區的核苷酸多態性高于IR 區,表明IR 區保守性更高,這與其他薔薇科物種的研究結果一致[38]。psbZ、trnG(UCC)、trnfM(CAU)、trnH(GUG)、psbA、rbcL、rpl20是紫葉風箱果葉綠體基因組中高核苷酸多態性的基因,這些序列可以為紫葉風箱果群體遺傳學研究提供十分重要的分子標記。紫葉風箱果葉綠體基因組中,單堿基(A/T)重復類型SSR 數量最多,這可能和其葉綠體基因組A、T 堿基含量(63.57%)較高有關。此外,鑒定到的8 種重復類型共87個SSR 位點,可被用于確定紫葉風箱果系統發育關系、遺傳多樣性研究和物種鑒定中,但未來還需要進一步篩選具有高多態性的SSR。

植物葉綠體全基因組序列較單個基因或多個編碼序列包含更豐富的遺傳信息,被用于多個物種的系統發育關系研究[46-47]。陸玲娣[1]基于繡線菊亞科物種的起源、演化和分布等,提出風箱果屬是從繡線梅屬的親緣類型中演化的另一個分支。本研究基于葉綠體基因組序列構建的ML 系統發育樹從分子角度驗證了前人的結論,風箱果屬和繡線梅屬物種聚成一支,近緣關系最近。此外,繡線菊屬與鮮卑花屬和假升麻屬親緣關系較近,珍珠梅屬與白鵑梅屬親緣關系較近,這和Zhang 等[41]的研究結果一致。為了進一步清楚地反映繡線菊亞科物種之間的系統發育關系,仍然需要更多物種的葉綠體基因組被測序。

4 結論

紫葉風箱果葉綠體基因組全長為159131 bp,包括1個LSC 區(87582 bp)、1個SSC 區(18829 bp)、1 對IR 區(IRa 和IRb,26360 bp),呈典型的四分體結構。trnfM(CAU)-rps14、trnH(GUG)-psbA、rpl20-rps12基因間區和psbZ、trnG(UCC)、trnfM(CAU)、trnH(GUG)、psbA、rbcL、rpl20基因區是風箱果屬植物葉綠體基因組中高核苷酸多態性區域,這些信息為其今后的分子標記開發提供了科學的依據。系統發育分析中,20個繡線菊亞科物種被歸為4個聚類組,其中紫葉風箱果和風箱果聚成一支,親緣關系最近。在紫葉風箱果葉綠體基因組中確定的12個最優密碼子,除編碼亮氨酸的密碼子UUG 外,均以A/U 結尾;其密碼子使用偏好性主要受自然選擇影響,突變等因素對其影響較弱;研究結果可為紫葉風箱果的系統進化及葉綠體基因工程研究提供參考。

猜你喜歡
繡線菊紫葉風箱
論手風琴風箱的重要性
淺析抖風箱在手風琴演奏中的作用
金山繡線菊引種及繁殖技術研究
20%啶蟲脒可溶液劑對蘋果繡線菊蚜防治效果
15種繡線菊白粉病抗性鑒定
紫葉甘藍花色素苷提取影響因素的研究
不同處理對紫葉李水培扦插生根的影響研究
紫葉生菜家庭盆栽法
聚焦創新提升質量
我家的風箱
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合