?

珍稀瀕危植物越南小花金花茶的葉綠體基因組特征分析

2024-03-10 15:09鄧永彪張進藍倫禮趙博
廣西植物 2024年1期
關鍵詞:特征分析

鄧永彪 張進 藍倫禮 趙博

摘 要: ???越南小花金花茶(Camellia minima) 是一種珍稀瀕危的金花茶組植物,目前尚未有其葉綠體基因組的相關研究。該研究利用Illumina HiSeq 2000平臺對越南小花金花茶進行了葉綠體基因組序列的測序、組裝、注釋和分析。結果表明:(1) 越南小花金花茶葉綠體基因組全長156 961 bp,為典型的四分體結構,共注釋到136個基因,其中包含87個蛋白編碼基因、41個tRNA基因和8個rRNA基因。(2) 分析鑒定出66個SSR位點和39個重復序列。(3) 密碼子偏好使用以A/U結尾的密碼子,綜合有效密碼數(ENC)繪圖、PR2-plot和中性分析推測自然選擇是影響密碼子使用模式的主導因素。(4) 邊界分析顯示ycf1基因的長度和位置在不同金花茶組植物間存在差異。(5) 對已發表的金花茶組植物葉綠體基因組的系統發育分析發現越南小花金花茶與小花金花茶聚為一支,親緣關系最近。該研究結果為探索物種進化和提高外源基因表達提供了重要的參考信息,同時為后續的金花茶組植物的保護和利用提供了理論基礎。

關鍵詞: ?越南小花金花茶, 葉綠體基因組, 特征分析, 系統發育分析, 密碼子偏好性

中圖分類號: ??Q943

文獻標識碼: ???A

文章編號: ??1000-3142(2024)01-0030-13

Analysis of chloroplast genome features of endangered

and rare plant Camellia minima

DENG Yongbiao, ZHANG Jin, LAN Lunli, ZHAO Bo*

( Pharmacy School, Guilin Medical University, ?Guilin 541199, Guangxi, China )

Abstract: ??Camellia minima, a rare and endangered species of sect. Chrysantha, has not been previously explored in terms of its chloroplast genome. Utilizing the Illumina HiSeq 2000 platform, the chloroplast genome sequence of C. minima was sequenced, assembled, annotated, and analysed. The results were as follows: (1) The chloroplast genome of C. minima was 156 961 bp in length, embodied a typical tetrad structure, and contained 136 annotated genes, including 87 protein-coding genes, 41 tRNA genes, and 8 rRNA genes. (2) The analysis identified 66 SSR loci and 39 repetitive sequences. (3) Codons prefered to use codons ending in A/U. Comprehensive effective number of codons (ENC) mapping, PR2-plot, and neutral analyses suggested natural selection as a primary factor shaping codon usage patterns. (4) Boundary analysis showed ?variation in the length and position of the ycf1 gene among different species of yellow Camellia. (5) Phylogenetic analysis of the chloroplast genomes of published sect. Chrysantha species ?revealed that C. minima was most closely related to C. micrantha. This study provides crucial references for exploring species evolution and enhancing exogenous gene expression, establishing a theoretical foundation for the conservation and utilization of species of sect. Chrysantha in the future.

Key words: ?Camellia minima, chloroplast genome, characteristic analysis, phylogenetic analysis, codon preference

金花茶組(Sect. Chrysantha )隸屬于山茶科(Theaceae)山茶屬(Camellia L.),主要分布在我國的廣西、云南以及越南部分地區(賽璇,2018)。其生長環境為人類活動蹤跡較少的喀斯特地貌和潮濕山地等(李桂娥等,2022)。所有金花茶組植物都被列入我國國家重點保護野生植物名錄,保護等級為二級(國家林業和草原局 農業農村部,2021)。金花茶組植物被稱為“植物界的大熊貓”“茶中皇后”,因為該組植物是山茶屬唯一擁有金黃色花瓣的類群(張蕾等,2019; 吳麗君等,2020)。金花茶組植物的花瓣和葉片中含有豐富的黃酮,常被用作保健食品與飲品(劉青等,2021; 賽璇,2018)。金花茶植物由于頻繁的種間雜交和多倍化導致其分類研究十分困難(Zhang et al., 2019)。Wei等(2022)基于雙酶切位點相關的簡化基因組測序(ddRAD)、轉錄組和核糖體內部轉錄間隔區(nrITS)等數據對20個中國金花茶物種進行系統發育重建,結合形態學證據確定了物種之間的親緣關系。研究表明,強烈的雜交/滲入信號表明網狀進化是造成核基因數據和葉綠體基因組數據構建的系統發育樹不一致的主要原因。本研究利用基因內容較少的葉綠體基因組進行有關信息的研究,更多完整的葉綠體基因組數據的積累將為今后金花茶屬植物的系統發育和網狀進化關系的研究提供更多的分子證據,也可以為金花茶組植物的保護與綜合利用提供基礎理論支持。

四分體結構是葉綠體基因組的典型特征,由一個大單拷貝(large single-copy, LSC)區、一個小單拷貝(small single-copy, SSC)區和兩個倒置重復序列(inverted repeats, IRs)顯示和編碼110~130個基因,大小范圍為120~180 kb(Li DM et al., 2021)。相較于核基因組,葉綠體基因組在基因結構、基因內容、基因序列方面更加穩定,較慢的進化速率,因此被廣泛應用于系統發育、DNA條形碼、基因工程和種群間親緣關系等研究中(Dong et al., 2018)。近年來葉綠體基因組測序的成本大大降低,越來越多的葉綠體基因組數據被成功應用于植物系統發育和進化研究。同時,葉綠體基因組中包含大量的重復序列是研究物種進化進程以及遺傳特征的重要依據(Hui et al., 2014),其中簡單重復序列(SSRs)又稱微衛星序列可以作為有效的分子標記來檢測種群多態性,廣泛應用于分子輔助育種和物種保護等方面 (Cavalier, 2002)。密碼子是連接核酸和蛋白質的紐帶,在遺傳信息的傳遞過程中具有重要作用(Liu et al., 2012)。研究物種密碼子使用模式并確定最優密碼子,有助于設計基因表達載體來提高目的基因的表達量,在品種改良方面具有重要應用價值(Qi et al., 2015; 胡曉艷等,2019)。

越南小花金花茶(C. minima)為金花茶組植物之一,可做觀賞植物和嫁接砧木(George & Anthony, 2015)。目前,尚未有關于越南小花金花茶葉綠體基因組的相關研究,限制了對其遺傳特征和系統發育關系的理解。為此,本研究利用高通量測序技術對越南小花金花茶進行了葉綠體全基因組測序組裝,擬探討以下科學問題:(1) 越南小花金花茶葉綠體基因組圖譜和序列特征;(2)越南小花金花茶葉綠體基因組密碼子使用的偏好性及影響密碼子使用模式主導因素;(3)越南小花金花茶與其近緣物種在IR和SC邊界區域堿基分布的差異;(4)越南小花金花茶在金花茶組植物系統發育中的位置。本研究不僅為后續開展越南小花金花茶物種鑒定、遺傳多樣性分析、葉綠體基因工程以及分子育種等研究提供了重要的理論基礎,也為金花茶組植物的系統發育研究提供了豐富的葉綠體基因組數據。

1 材料與方法

1.1 植物材料

越南小花金花茶采集于中國廣西壯族自治區南寧市金花茶公園(108°21′43″ E、 22°49′30″ N),采集單株新鮮幼嫩的葉片,裝進有硅膠的自封袋內低溫保存,用于后續提取總DNA,標本保存在廣西壯族自治區中國科學院廣西植物研究所標本館,標本憑證為CSF2020003。

1.2 DNA提取和測序

使用改良的CTAB法從越南小花金花茶干燥的葉片中提取總DNA,葉綠體基因組測序服務由北京格致博雅生物科技有限公司提供。使用Fastp軟件處理測序獲得的原始數據,除去過多的N序列、接頭序列和過短序列,輸出大小為1 005.18 Mb的clean data,用于后續的葉綠體基因組組裝(Gu et al., 2018)。

1.3 基因組組裝注釋和序列表征

使用getOrganelle v1.7.6.1組裝clean data,參考數據庫為embplant_pt(陸生植物葉綠體),最大擴充循環數為20,調用Spedas的K-mer值為21、45、65、85、105、127;拼接完成后用Bandage 軟件可視化(Jian et al., 2018)。使用葉綠體基因組在線注釋網站CPGAVAS2 (http://47.96.249.172:16019/analyzer/home),以C. parvipetala (NC_067089.1)為參照基因組進行注釋。使用GB2sequin檢查序列分區是否存在顛倒并手動調整準確位置,得到完整的注釋結果(Pascal & Stephan, 2018; Shi et al., 2019)。最后使用在線網站CPGview (http://www.1kmpg.cn/cpgview/)繪制了葉綠體基因組圈圖(Liu et al., 2023)。注釋完成的葉綠體基因組提交至GenBank數據庫,登錄號為NC_069310.1,相應的SRA、BioProject和BioSample編號分別為SRR20648317、PRJNA861872和SAMN29930849。

1.4 密碼子使用偏好性分析

1.4.1 密碼子相關參數計算[HTSS] 在剔除重復基因、含有終止密碼子和長度小于300 bp的編碼序列(coding sequence, CDS)后,選取52條CDS序列進行密碼子分析。使用Codon W 1.4.2軟件對相對同義密碼子使用度(relative synonymous codon usage,RSCU)進行分析。利用EMBOSS工具包中的CUSP程序分析總GC含量以及第1、第2和第3個堿基位置(GC1、GC2、GC3)的GC含量,CHIPS程序用于分析有效密碼子數(effective number of codons,ENC)(朱偉垚等,2022)。采用R軟件中的cor()函數計算相關性。

1.4.2 密碼子中性繪圖、ENC-plot及PR2-plot繪圖[HTSS] 在中性繪圖分析中,以GC12和GC3做散點圖,研究密碼子3個位置堿基之間的相關性,從而分析突變壓力和自然選擇對于密碼子偏好性的影響(Wei et al., 2014)。GC12為GC1和GC2的平均值。如果GC12和GC3之間顯著相關,即R2越大且趨于1時,GC12與GC3的相關程度越高,表明突變壓力是密碼子使用偏向的決定因素;相反,如果相關性不顯著,則回歸曲線斜率偏低甚至接近于零,表明密碼子偏好性由自然選擇主導(Sueoka, 1988)。

ENC-plot繪圖進一步分析了密碼子偏好性受堿基組成對的影響,以GC3為橫坐標、有效密碼子數為縱坐標進行繪制散點圖,根據下式計算:ENC =2+ GC3+29/ [GC32+(1-GC3)2] (楊祥燕等,2021;辛雅萱等,2021)。當密碼子偏好性僅受突變影響時,基因將沿著或接近標準曲線分布,而當基因落在標準曲線以下時則說明自然選擇等因素是影響密碼子偏好性的主要因素(Chakraborty et al., 2020)。

奇偶偏好性分析(parity rule 2 plot, PR2-plot)用于計算各密碼子第3位A、T、C、G的含量,通常用于估計突變壓力和自然選擇對密碼子偏好性的影響(Xiang et al., 2015)。以A3 /(A3+T3)為y軸,G3 /(G3+C3)為x軸繪制PR2-plot圖。中心點(A=T, G=C)意味著自然選擇和突變壓力之間沒有偏差。如果基因均勻分布在中心點周圍,則認為密碼子偏好性可能完全是由突變壓力造成的,否則,密碼子的使用可能受到自然選擇和其他因素的影響(Xiang et al., 2015)。

1.5 重復序列分析

使用在線網站REPuter對散在重復序列進行計算。參數設置:最大計算重復次數=200; 最小重復序列>30 bp;重復序列相似度>90%;漢明距離(Hamming Distance)= 3 (Kurtz et al., 2001)。簡單重復序列使用在線網站MISA進行鑒定和統計分析。各重復單元(unit size) 對應的最少重復次數分別為1~10、2~5、3~4、4~3、5~3、6~3,相鄰SSR之間的最小單位間隔距離設置為100 bp (Beier et al., 2017)。

1.6 葉綠體基因組IR邊界分析

基于系統發育分析的結果,以簇蕊金花茶(C. fascicularis)葉綠體基因組為參考,使用本地部署的IRscope對越南小花金花茶及其近緣物種葉綠體基因組的LSC/IRb/SSC/IRa邊界進行可視化分析(Amiryousefi et al., 2018)。

1.7 系統發育分析

將測序組裝得到的越南小花金花茶以及從NCBI數據庫中獲得的23個為金花茶組植物的葉綠體基因組全長序列,以Polyspora penangensis為外類群,構建系統發育樹。具體流程:使用MAFFT(version 7.505)進行多序列比對,使用trimAI(V1.4)去除多序列比對結果中的低質量區域,以提高比對結果的質量和準確性;使用IQ-TREE2軟件在TVM+F+I+I+R6模型下,以最大似然法(Maximum Likelihood, ML)構建系統發育樹(Katoh & Standley, 2013; Minh et al., 2021)。

2 結果與分析

2.1 葉綠體基因組特征

越南小花金花茶葉綠體基因組包含136個功能基因(表1),包括87個蛋白質編碼基因,41個tRNA基因和8個rRNA基因,在這些基因中,與自我復制相關的基因有78個,與光合作用有關的基因有45個,其他功能未知的基因共有13個?;蚪M中有16個雙拷貝基因 (ndhB、rpl2、rpl23、rps7、rps12、rrn4.5S、rrn5S、rrn16S、rrn23S、trnI-CAU、trnL-CAA、trnN-GUU、trnR-ACG、trnV-GAC、ycf2、ycf15), 2個四拷貝基因(trnI-GAU, trnA-UGC)。在越南小花金花茶的葉綠體基因組中共有10個基因含有內含子,分別是petB、petD、rps16、rpl16、rpl12、atpF、rpoC1、clpP、ndhB、ndhA,其中rpl12和ndhB基因都含有2個內含子。

越南小花金花茶葉綠體基因組為環狀雙鏈四分體結構(圖1),長度為156 961 bp,其中有兩個長度為26 047 bp的反向重復(IR)區域被一個86 600 bp的大單拷貝(LSC)區域和一個18 267 bp的小單拷貝(SSC)區域分開。葉綠體基因組的GC總含量為37.32%,其中LSC區為35.33%,SSC區為30.60%,IR區為42.98%。

2.2 重復序列分析

通過MISA在線網站分析,發現越南小花金花茶的葉綠體基因組中含有的SSR位點數目為66個,類型包括單核苷酸、二核苷酸、三核苷酸、四核苷酸和六核苷酸且大多數為單核苷酸重復(圖2:A,C)。這些類型的SSR有17個分布在蛋白編碼區、40個分布在基因間隔區、9個分布在內含子區(圖2:B)。通過REPuter軟件分析了越南小花金花茶葉綠體基因組中的散在重復序列,共檢測到39個散在重復序列,分別是16個正向重復序列(forward)和23個回文重復序列(palindromic),但沒有檢測到反向(reverse)和互補(complement)重復序列的存在。這些散在重復序列的長度在30~64 bp之間,且大部分位于IR區的ycf2基因中(圖2:D)。

2.3 密碼子偏好性分析

2.3.1 同義密碼子相對使用度分析[HTSS] 對越南小花金花茶葉綠體基因組的52個大于300 bp的蛋白質編碼序列進行密碼子偏好性分析發現,其中相對同義密碼子使用度(RSCU)值大于1的密碼子有30個,其中13個以A (30個中13個)或U (30個中16個)結尾,以G結尾的數目僅有1個;RSCU值小于1的32個密碼子多以C (32個中16個)或G (32個中13個)結尾 ,表明密碼子偏好使用以A/U結尾的密碼子(圖3)。

2.3.2 密碼子中性繪圖、ENc-plot及PR2-plot分析[HTSS] 對越南小花金花茶葉綠體基因進行中性圖(GC12 vs GC3)分析。由圖4:A可知,葉綠體基因分布相對集中,但并不密集。GC12和GC3的平均值分別為43.10%和27.49%。GC12和GC3的相關系數為r=0.118(R2=0.014),回歸曲線斜率為0.107,表明GC12與GC3無顯著相關性。由此推斷密碼子使用偏好性受突變壓力影響較小,而自然選擇等因素的貢獻更大。

為了評估越南金花茶葉綠體基因組中蛋白編碼基因的密碼子偏好程度,計算并分析了ENC值。如圖4:B所示,大部分基因的ENC值低于預期值,位于標準曲線下方,表明密碼子使用偏好性主要受自然選擇等因素的影響,而突變壓力僅起次要作用。為了進一步反映差異,分析了越南小花金花茶葉綠體基因的ENC頻數分布(表2)。ENC比值在-0.05~0.45之間,其中9個(17.00% )基因分布在-0.05~0.05范圍內,表明這部分基因分布在標準曲線周圍,而剩余的大部分基因都距離標準曲線較遠,以上結果說明了自然選擇對越南小花金花茶葉綠體基因組密碼子偏好的影響更大。

如果密碼子偏好性完全受突變影響,則密碼子第3位核苷酸A、T、C、G的使用頻率相同。在本研究中,PR2平面的4個區域并非均勻分布。由圖4:C可知,大部分基因位于平面的下半部分,尤其是右下方。因此,從堿基的使用頻率來看,T>A,G>C,表明葉綠體基因組中A/T和G/C的密碼子使用偏好性不平衡,推斷越南小花金花茶葉綠體基因組的密碼子偏好性同時受到突變壓力和自然選擇等因素的影響。

2.4 IR邊界分析

葉綠體基因組在LSC、IRb、IRa和SSC之間有4個邊界,即LSC/IRb邊界、IRb/SSC邊界、SSC/IRa邊界和IRa/LSC邊界。本研究對越南小花金花茶及6個近緣金花茶組植物的葉綠體基因組邊界進行了比較分析。由圖5可知,在所有比較的葉綠體基因組中,IR區僅有輕微的擴張和收縮,長度從25 996 bp(四季花金花茶)到26 096 bp(毛瓣金花茶)。在LSC/IRb邊界處,所有物種的rps19基因都跨越了LSC/IRb邊界,向IRb區域延伸了46 bp。在IRb/SSC邊界處,7個金花茶組植物的邊界均位于ycf1假基因和ndhF基因的重疊處,在越南金花茶和毛瓣金花茶中,ndhF基因跨越IRb/SSC邊界,分別有39、25 bp位于IRb區域中。在SSC/IRa邊界處,ycf1基因跨越該邊界,包含在IRa 1 034~1 055 bp區域內。在IRa/LSC邊界處,所有物種的邊界均位于rps19拷貝基因和trnH基因之間,trnH距離IRa/LSC邊界1 bp。

2.5 系統發育分析

基于25種山茶科植物(包括24種金花茶組植物和1種大頭茶屬物種)葉綠體全基因組序列構建系統發育樹,以P. penangensis 作為外類群,利用最大似然法構建系統發育樹。由圖6可知,24種金花茶組植物主要分為2個分支,即Clade Ⅰ分支和Clade Ⅱ分支。Clade Ⅰ分支中,越南小花金花茶(C. minima)與小花金花茶(C. micrantha)以100%的支持率聚為了一個單支,表明這兩個物種的親緣關系最近。

3 討論與結論

金花茶組植物均為國家二級保護植物(國家林業和草原局 農業農村部,2021),具有較高的觀賞和藥用價值。其中,越南小花金花茶是一種原產于越南北部的金花茶組植物,生長于潮濕蔭蔽的山谷,具有較強的適應能力,被視為優良的嫁接砧木,近年來受到了園藝界的廣泛關注(李桂娥等,2022)。越南小花金花茶葉綠體基因組為典型的環狀雙鏈四分體結構,長度為156 961 bp,GC含量為37.32%,葉綠體全基因組注釋到了136個基因,包括87個蛋白編碼基因,41個轉運RNA基因和8個核糖體RNA基因, 共有10個基因含有內含子,其中rpl12和ndhB基因含有2個內含子,與金花茶組其他植物的特征一致,可能與葉綠體基因組的特殊結構和復制方式有關(Henry et al., 2016)。此外,越南小花金花茶的葉綠體基因組長度、基因的類型和排列順序、GC含量等與山茶屬的其他已發表物種 (如山茶、油茶、凹脈金花茶等) 相似(Li et al., 2019)。這表明越南小花金花茶葉綠體基因組的進化可能保守而緩慢(Sophiarani et al., 2019; 丁祥青等,2022a)。

簡單重復序列(SSRs)是由DNA鏈的滑移而產生,在基因組和葉綠體基因組中都有較廣分布。與其他中性DNA區域相比,SSRs通常具有更高的突變率(Li et al., 2018; Zhang, 2019)。由于其具有非重組、單倍體和單親遺傳的特性,因此常被用作遺傳標記,為植物群體遺傳學和生態學及進化研究提供有價值的信息(Aii et al., 1997; Gui et al, 2020)。本研究在越南小花金花茶葉綠體基因組中共鑒定了66個SSR位點,主要位于大單拷貝區(LSC),其中所有的單核苷酸重復都是由A/T組成,類似的結果在金花茶組葉綠體基因組(丁祥青等,2022b)和其他被子植物中均有發現(Hui et al., 2014),可能歸因于polyA和polyT相比polyC和polyG具有更高的結構穩定性(Jin et al., 2023)。然而,我們檢測到的SSR位點數量與Hui等(2014)的結果存在差異,可能是由于檢索 SSR 位點的參數設定不同,導致輸出的結果不同。在越南小花金花茶的葉綠體基因組中,cp-SSRs含量豐富,可用于檢測群體的遺傳多態性。此外,在越南小花金花茶葉綠體基因組中鑒定出的散在重復序列主要以正向和回文重復為主,與抱莖金花茶葉綠體基因組序列特征類似(丁祥青等,2022b)。這些重復序列是重要的遺傳資源,在系統發育研究中具有重要作用(Wei et al., 2022)。

密碼子使用偏好性對于研究基因的分子進化和外源表達具有重要意義(Li et al., 2022)。本研究首次系統分析了越南小花金花茶葉綠體基因組的密碼子使用模式,發現精氨酸、異亮氨酸、甘氨酸是密碼子編碼的最豐富的氨基酸,由6個密碼子編碼,相比之下,色氨酸、甲硫氨酸僅有一個密碼子編碼,葉綠體基因傾向于使用A/U密碼子,與耿曉姍等(2022)對金花茶的密碼子分析研究結果一致。通過進行中性繪圖分析,本研究發現GC12和GC3之間并無顯著相關性且基因分布相對集中,表明自然選擇是影響密碼子偏好的主要因素(Zhang et al., 2012)。進一步結合ENC繪圖、PR2-plot分析結果,表明越南小花金花茶的密碼子使用偏好性受多個因素影響,包括突變壓力、堿基組成和基因長度,其中自然選擇是主導影響因素,這與丁祥青等(2023)和李清等(2022)的研究結果一致。自然選擇是葉綠體基因組進化的主要驅動力,這一發現加深了我們對越南小花金花茶進化歷史的理解,特別是與自然選擇有關的進化歷史。對密碼子偏好性的分析結果有利于密碼子優化,可為今后金花茶組植物轉基因技術提供理論依據(段義忠和張凱,2020; Zhao et al., 2016)。

在葉綠體基因組中,IR的收縮和擴張時常發生,這些差異會導致假基因的產生、基因重復和基因缺失,進一步造成IR/SC連接處的位置變化,高等植物葉綠體基因組長度變異就是由這種位置變化而造成(Li DM et al., 2021)。本研究對越南小花金花茶及6個近緣金花茶組植物的葉綠體基因組邊界進行比較分析,結果表明7個物種IR區長度(25 996~26 096 bp)基本一致,未檢測到基因丟失,表明IR區的高度保守可能對于維持其長度和結構穩定至關重要。通過邊界收縮和擴張分析,本研究發現ycf1基因的長度和位置在不同金花茶組植物間存在差異,可能是潛在的突變熱點區域。Li L等(2021)研究表明,ycf1基因因其高度的多態性而被推薦作為植物的核心DNA條形碼,然而這一潛在的高變區是否可以作為金花茶組植物有效的DNA條形碼還需要進一步的驗證。此外,越南小花金花茶及6個近緣金花茶組植物的葉綠體基因組邊界相對保守,表明其親緣關系較近,之后的系統發育研究也支持這一推論。

迄今為止,許多學者已經采用諸如隨機擴增多態性DNA (random amplified polymorphic DNA, RAPD )、葉綠體DNA trnL-trnF、擴增片段長度多態性(amplified fragment length polymorphism, AFLP)、ISSR以及核糖體內轉錄間隔區(nuclear ribsomal internal transcribe spacer, nrITS )等多樣化的分子標記,以闡明山茶屬之間的親緣關系(Ju et al., 2021)。 Wei等(2022)整合了ddRAD、轉錄組、nrITS和SSC等分子標記研究金花茶組系統發育關系,但基于葉綠體基因組SSC區的系統發育樹支持率極低。本研究基于葉綠體全基因組序列,對越南小花金花茶和其余23種金花茶組植物的系統發育關系進行了分析。結果表明,依據系統發育的結果可將系統發育樹分為兩個大的分支,其中越南小花金花茶與小花金花茶聚為高支持率的分支,親緣關系最近。各分支支持率較高,表明完整的葉綠體基因組數據可為重建金花茶組系統發育關系提供重要的數據支持。

綜上所述,本文首次完成了越南小花金花茶葉綠體基因組的序列測序、組裝注釋和基礎信息分析,揭示了越南小花金花茶葉綠體基因組基本特征。在此基礎上,通過剖析密碼子使用模式以及影響密碼子偏好的各類因素,確定了越南小花金花茶葉綠體基因組的高頻密碼子,為后續山茶屬金花茶組植物的轉基因研究提供了理論支持。此外,基于全葉綠體基因組構建的系統發育樹明確了越南小花金花茶在金花茶組植物中的系統位置。本研究為后續越南小花金花茶和其他金花茶組植物的保護和合理開發利用研究提供了理論基礎。

參考文獻:

AI I J, KISHIMA Y, MIKAMI T, et al., 1997. Expansion of the IR in the chloroplast genomes of buckwheat species is due to incorporation of an SSC sequence that could be mediated by an inversion [J]. Curr Genet, 31: 276-279.

AMIRYOUSEFI A, HYVNEN J, POCZAI P, 2018. IRscope: an online program to visualize the junction sites of chloroplast genomes [J]. Bioinformatics, 34(17): 3030-3031.

BEIER S, THIEL T, MNCH T, et al., 2017. MISA-web: a web server for microsatellite prediction [J]. Bioinformatics, 33(16): 2583-2585.

CAVALIER ST, 2002. Chloroplast evolution:secondary symbiogenesis and multiple losses [J]. Curr Biol, 12: 62-64.

CHAKRABORTY S, YENGKHOM S, UDDIN A, 2020. Analysis of codon usage bias of chloroplast genes in Oryza species [J]. Planta, 252: 1-20.

DING XQ, CHEN SY, CHEN JT, et al., 2023. Codon bias analysis of 11 yellow Camellia chloroplast genome [J]. J Fujian Agric For Univ (Nat Sci Ed), 52(4): 1-9. ?[丁祥青, 陳絲雨, 陳佳婷, 等, 2023. 11種金花茶葉綠體基因組密碼子偏好性分析 [J]. 福建農林大學學報(自然科學版), 52(4): 1-9.]

DING XQ, LI WF, WU JL, et al., 2022a. Chloroplast genome characteristics and genetic relationship of yellow Camellia [J]. J Fujian Agric For Univ (Nat Sci Ed), 52(3): 1-11. ?[丁祥青, 李文芳, 吳麗君, 等, 2022a. 4種金花茶葉綠體基因組的比較分析 [J]. 福建農林大學學報(自然科學版), 52(3): 1-11.]

DING XQ, BI YY, CHEN JT, et al., 2022b. Analysis of the chloroplast genome characteristics of Camellia tienii [J]. Agric Sci Jiangsu, 50(23): 33-40. ?[丁祥青, 畢遠洋, 陳佳婷, 等, 2022b. 抱莖金花茶(Camellia tienii)的葉綠體基因組特征分析 [J]. 江蘇農業科學, 50(23): 33-40.]

DONG W, XU C, WU P, et al., 2018. Resolving the systematic positions of enigmatic taxa: Manipulating the chloroplast genome data of Saxifragales [J]. Mol Phylogenet Evol, 126: 321-330.

DUAN YZ, ZHANG K, 2020. Comparative analysis and phylogenetic evolution of the complete chloroplast genome of Ammopiptanthus [J]. Acta Bot Boreal-Occident Sin, 40(8): 1323-1332. ?[段義忠, 張凱, 2020. 沙冬青屬植物葉綠體基因組對比和系統發育分析 [J]. 西北植物學報, 40(8): 1323-1332.]

GENG XS, JIA W, CHEN JN, et al., 2022. Codon usage bias analysis of chloroplast genome in Camellia nitidissima ?[J]. Mol Plant Breed, 20(7): 2196-2203. ?[耿曉姍, 賈魏, 陳佳寧, 等, 2022. 金花茶葉綠體基因組密碼子偏好性分析 [J]. 分子植物育種, 20(7): 2196-2203.]

GEORGE O, ANTHONY SC, 2015. In pursuit of hidden camellias 32 new Camellia species from Vietnam and China ?[M]. 2nd ed. Sydney: Theaceae Exploration Associates.

GUI L, JIANG S, XIE D, et al., 2020. Analysis of complete chloroplast genomes of curcuma and the contribution to phylogeny and adaptive evolution [J]. Gene, 732: 144355.

GU J, CHEN S, ZHOU Y, et al., 2018. Fastp: an ultra-fast all-in-one FASTQ preprocessor [J]. Bioinformatics, 34(17): i884-i890.

HENRY D, LIN CS, YU M,et al., 2016. Chloroplast genomes: diversity, evolution, and applications in genetic engineering [J]. Genome Biol, 17(134): 1-29.

HU XY, XU YQ, HAN YZ, et al., 2019. Codon usage bias analysis of the chloroplast genome of Ziziphus jujuba var. spinosa [J]. J For Environ, 39(6): 621-628. [胡曉艷, 許艷秋, 韓有志, 等, 2019. 酸棗葉綠體基因組密碼子使用偏性分析 [J]. 森林與環境學報, 39(6): 621-628.]

HUI H, CHAO S, YUAN L, et al., 2014. Thirteen Camellia chloroplast genome sequences determined by high-throughput sequencing: genome structure and phylogenetic relationships [J]. BMC Evol Biol, 14(1): 151-168.

JIAN JJ, YU WB, YANG JB, et al., 2018. GetOrganelle: a fast and versatile toolkit for accurate de novo assembly of organelle genomes [J]. Genome Biol, 21(1): 241.

JIN GZ, LI WJ, SONG F, et al., 2023. Comparative analysis of complete Artemisia subgenus Seriphidium (Asteraceae: Anthemideae) chloroplast genomes: insights into structural divergence and phylogenetic relationships [J]. BMC Plant Biol, 136: l-23.

JU NG, HOANG DKD, KIM CK, et al., 2021. Complete chloroplast genomes shed light on phylogenetic relationships, divergence time, and biogeography of Allioideae (Amaryllidaceae) [J]. Sci Rep, 11(1): 3262

KATOH K, STANDLEY DM, 2013. MAFFT mutiple sequence alignment software version 7:improvements in performance and usability [J]. Mol Biol Evol, 30(4): 772-780.

KURTZ JV, CHOUDHURI, OHLEBUSCH E, et al., 2001. REPuter: the manifold applications of repeat analysis on a genomic scale [J]. Nucl Acids Res, 29(22): 4633-4642.

LI DM, LI J, WANG DR, et al., 2021. Molecular evolution of chloroplast genomes in subfamily Zingiberoideae (Zingiberaceae) [J]. BMC Plant Biol, 21: 1-24.

LI GE, JIANG CJ, QI Y, et al., 2022. Morphological characteristics and identification points of Camellia minima and Camellia cucphuongensis from Vietnam [J]. S Hortic, 33(1): 54-60. ?[李桂娥, 蔣昌杰, 漆婭, 等, 2022. 越南小花金花茶和菊芳金花茶的形態特征及識別要點 [J]. 南方園藝, 33(1): 54-60.]

LI L, HU YF, HE M, et al., 2021. Comparative chloroplast genomes: insightsinto the evolution of the chloroplast genome of Camellia sinensis and the phylogeny of Camellia [J]. BMC Genomics, 22(138): 471-493.

LI Q, LUO RJ, GE R, et al., 2022. Analysis on codon usage bias of chloroplast genomein Ampelopsis grossedentata [J]. Guangdong Agric Sci, 49(11): 162-169. [李清, 羅永堅, 葛蓉, 等, 2022. 顯齒蛇葡萄葉綠體基因組密碼子使用偏好性分析 [J]. 廣東農業科學, 49(11): 162-169.]

LI W, ZHANG CP, GUO XP, et al., 2019. Complete chloroplast genome of Camellia japonica genome structures, comparative andphylogenetic analysis [J]. PLoS ONE, 14(5): e0216645.

LI XP, MENG J, ZHANG N, et al., 2018. Comparative analysis of chloroplast genomes of Aconitum vilmorinianum and Aconitum vilmorinianum var. patentipilum [J]. J Chin Med Mat, 41(8): 1812-1820. ?[李雪佩, 孟靜, 張琳娜, 等, 2018. 黃草烏與展毛黃草烏葉綠體全基因組結構的比較分析 [J]. 中藥材, 41(8): 1812-1820.]

LIU H, HUANG Y, DU X, et al., 2012. Patterns of synonymous codon usage bias in the model grass Brachypodium distachyon [J]. Genet Mol Res, 11(4): 4695-4706.

LIU Q, LI Y, YANG RM, et al., 2021. Yellow Camellia: resource status and research progress in modern studies [J]. Mod Chin Med, 23(4): 727-733. ?[劉青, 李月, 楊潤梅, 等, 2021. 金花茶組植物資源現狀與現代研究進展 [J]. 中國現代中藥, 23(4): 727-733.]

LIU S, NI Y, LI J, et al., 2023. CPGView: A package for visualizing detailed chloroplast genome structures [J]. Mol Ecol Resour, 23(3): 694-704.

MINH BQ, SCHMIDT HA, CHERNOMOR O, et al., 2021. IQ-TREE 2: New models and efficient methods for phylogenetic inference in the genomic era [J]. Mol Biol Evol, 37(5): 1530-1534.

National Forestry and Grassland Administration, Ministry of Agriculture and Rural Affairs, 2021. List of National Key Protected Wild Plants ?[EB/OL]. 2021(15). ?https://www.gov.cn/zhengce/zhengceku/2021-09/09/content_5636409.htm. [國家林業和草原局 農業農村部, 2021. 國家重點保護野生植物名錄 ?[EB/OL] 2021年第15號. https://www.gov.cn/zhengce/zhengceku/2021-09/09/content_5636409.htm.]

PASCAL L, STEPHAN G, 2018. GB2sequin — A file converter preparing custom GenBank files for database submission [J]. Genomics, 111(4): 759-761.

QI YY, XU WJ, XING T, et al., 2015. Synonymous codon usage bias in the plastid genome is unrelated to gene structure and shows evolutionary heterogeneity [J]. Evol Biol Online, 11: 65-77.

SAI X, 2018. Anti-lung cancer effect of Camellia euphlbia flowers extract and its potential mechanism of action [D]. Dalian: Dalian University of Technology. ?[賽璇, 2018. 金花茶花提取物的肺癌防治作用及其機理初探 [D]. 大連: 大連理工大學.]

SHI L, CHEN H, JIANG M, et al., 2019. CPGAVAS2, an integrated plastome sequence annotator and analyzer [J]. Nucl Acids Res, 7(W1): W65-W73.

SOPHIARANI Y, ARIF U, SUPRIYO C, 2019. Deciphering codon usage patterns and evolutionary forces in chloroplast genes of Camellia sinensis var. assamica and Camellia sinensis var. sinensis in comparison to Camellia pubicosta [J]. J Inte Agric, 18(12): 2771-2785.

SUEOKA N, 1988. Directional mutation pressure and neutral molecular evolution [J]. Proc Natl Acad Sci USA, 85(8): 2653-2657.

WEI L, HE J, JIA X, et al., 2014. Analysis of codon usage bias of mitochondrial genome in Bombyx mori and its relation to evolution [J]. BMC Evol Biol, 14: 262.

WEI SJ, LIUFU YQ, ZHENG HE, et al., 2022. Using phylogenomics to untangle the taxonomic incongruence of yellow-flowered Camellia species (Theaceae) in China [J]. J Syst Evol, 61(5): 1-16.

WU LJ, ZHENG HC, CHEN WR, et al., 2020. Performance and thinking on introduction and cultivation of Camellia Sect.Chrysantha Chang in Fujian [J]. Fujian For Sci Technol, 47(2): 109-115. ?[吳麗君, 鄭惠成, 陳文榮, 等, 2020. 福建金花茶組植物引種栽培現狀與思考 [J]. 福建林業科技, 47(2): 109-115.]

XIANG H, ZHANG RZ, BUTLER RR,et al., 2015. Comparative analysis of codon usage bias patterns in Microsporidian genomes [J]. PLoS ONE, 10: e0129223.

XIN YX, LI RZ, LI X, et al., 2021. Analysis on codon usage bias of chloroplast genome in Mangifera indica [J]. J Centr S Univ For Technol, 41(9): 145-157. [辛雅萱, 黎若竹, 李鑫, 等, 2021. 杧果葉綠體基因組密碼子使用偏好性分析 [J]. 中南林業科技大學學報, 41(9): 145-157.]

YANG XY, CAI YB, TAN QL, et al., 2021. Analysis of codon usage bias in the chloroplast genome of Ananas comosus [J]. J Trop Crop, 43(3): 439-446 [楊祥燕, 蔡元保, 譚秦亮, 等, 2021. 菠蘿葉綠體基因組密碼子偏好性分析 [J]. 熱帶作物學報, 43(3): 439-446.]

ZHANG L, NI S, LI JY, et al., 2019. Analysis of petal nutrition and bioactive components in different periods of Camellia nitidissima [J]. For Res, 32(2): 32-38. [張蕾, 倪穗, 李紀元, 等, 2019. 金花茶不同時期花瓣營養與生物活性成分分析 [J]. 林業科學研究, 32(2): 32-38.]

ZHANG JW, 2019. The complete chloroplast genome and phylogenetic analysis of the endangered species Syringa pinnatifolia (Oleaceae) [D]. Yangling: Northwest A & F University. ?[張靖雯, 2019. 瀕危植物羽葉丁香葉綠體全基因組及系統發育研究 [D]. 楊凌: 西北農林科技大學.]

ZHANG W, ZHAO Y, YANG G, et al., 2019. Determination of the evolutionary pressure on Camellia oleifera on Hainan Island using the complete chloroplast genome sequence [J]. PeerJ, 7: e7210.

ZHANG Y, NIE X, JIA X, et al., 2012. Analysis of codon usage patterns of the chloroplast genomes in the Poaceae family [J]. Aust J Bot, 60: 461-470.

ZHAO YC, ZHENG H, XU AX, et al., 2016. Analysis of codon usage bias of envelope glycoprotein genes in nuclear polyhedrosis virus (NPV) and its relation to evolution [J]. BMC Genom, 17: 677-677.

ZHU WY, LONG Y, ZHENG S, et al., 2022. Chloroplast genome structure and characterization of Melaleuca bracteata [J/OL]. Mol Plant Breed: 1-14 [2023-08-12]. ??[朱偉垚, 龍宇, 鄭叔召, 等, 2022. 黃金寶樹葉綠體基因組測序與特征分析 [J]. 分子植物育種: ?1-14 [2023-08-12]. http://ifgfy2b08d79e045e4fd4hpu0ow5n56x966nfnficg.res.gxlib.org.cn/kcms/detail/46.1068.S.20220428.1423.017.html.]

( 責任編輯 李 莉 )

收稿日期: ??2023-08-12

基金項目: ??國家自然科學基金(32060090); 廣西科技基地和人才專項(桂科AD19110089); 廣西自然科學基金(2021JJA130119)。

第一作者: ?鄧永彪(2000-),碩士研究生,研究方向為中藥資源,(E-mail)dengyongbiao1@gmail.com。

* 通信作者: ??趙博,博士,教授,研究方向為藥用植物資源學,(E-mail)122017017@glmc.edu.cn。

猜你喜歡
特征分析
1822號臺風“山竹”演變特征分析
64排CT在腦梗死早期診斷中的應用及影像學特征分析
穆夏藝術特征分析
泡罩包裝揮發性有機物排放特征分析
2016年14號臺風“莫蘭蒂”特征分析
2012 年南海夏季風特征分析
涼山州閃電活動特征分析
近35年云貴高原暴雨特征分析
聽神經瘤患者的遠紅外熱像特征分析
腎康注射液不良反應特征分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合