?

復羽葉欒樹葉綠體基因組密碼子偏好性分析

2023-06-20 12:27肖明昆聶愷宏沈紹斌劉倩段春芳李月仙張林輝
西南林業大學學報 2023年3期
關鍵詞:偏性欒樹密碼子

肖明昆聶愷宏沈紹斌劉 倩段春芳李月仙張林輝

(1. 云南省農業科學院熱帶亞熱帶經濟作物研究所,云南 保山 678000;2. 四川省廣元市昭化區林業局,四川 廣元 628000)

葉綠體是具有完整母系遺傳信息的細胞器,其基因組序列信息可以探究物種起源進化,判定物種間親緣關系[1-2],對植物基因組學、生物信息學等學科的發展也起著重要作用[3]。根據最優密碼子設計的葉綠體基因表達載體,有助于選擇與目的基因契合度高的葉綠體基因進行轉化,從而提高葉綠體基因組中基因表達量[4-5]。因此,開展葉綠體基因組密碼子使用模式研究,有助于了解物種進化歷程,提高葉綠體外源基因的表達量[6]。

密碼子是信使核糖核酸上編碼氨基酸的三聯體核苷酸序列。通常編碼同一個氨基酸的幾個同義密碼子在無選擇壓力和中性突變的情況下,使用頻率應該相同。但實際上它們是非隨機使用的,往往傾向于使用某一種密碼子,這種現象稱為密碼子偏好性[7-9]。密碼子偏好性是生物在長期進化演變中逐漸形成的,借助密碼子偏性分析可以更好地理解分子進化、基因調控等生命過程,對探究物種進化和提高外源基因的表達具有重要意義[10]。

復羽葉欒樹(Koelreuteria bipinnata)為無患子科欒樹屬喬木,野生種群分布于云南、四川、貴州、湖南、湖北等省區[11],該植物具有樹干通直、枝葉茂密、花果艷麗、季相色彩變化明顯的特征,是園林綠化中觀花和觀果的優良樹種[12]。此外該物種還對石灰巖山地具有很好的適應性,是石漠化地區植被恢復和重建的優選物種,有極高的生態價值[13]。還有研究表明,復羽葉欒樹種仁含有多種脂肪酸及氨基酸,具有開發成營養品、保健品或者飼料添加劑的廣闊前景,是一種具有很高開發價值的植物資源[14]。目前,有關復羽葉欒樹的研究多集中于種苗培育[15]、逆境脅迫[13]、種子生理生化[14,16]等方面。隨著基因測序技術的發展,雖已完成對復羽葉欒樹葉綠體基因組的測序、拼裝和注釋[17],但是關于復羽葉欒樹葉綠體密碼子使用偏好性的研究還未見報道。本研究以復羽葉欒樹葉綠體基因組全序列為研究對象,通過對葉綠體基因組密碼子的使用偏性的影響因素分析,確定復羽葉欒樹葉綠體基因組密碼子的使用偏好性,并篩選出最優密碼子,可為復羽葉欒樹葉綠體基因組在基因工程的應用和研究提供理論依據。此外有助于從基因水平分析物種間的親緣關系及物種的進化發展,為揭示葉綠體的起源與進化提供參考依據[18]。

1 材料與方法

1.1 材料

在云南省保山市隆陽區采集新鮮幼嫩、完整的復羽葉欒樹葉片,樣品保存于干冰中。葉綠體基因組測序由浙江安諾優達生物科技有限公司完成,后將測序結果提交至美國國立生物技術中心(NCBI)(登錄號:MW387267)。對復羽葉欒樹葉綠體基因組進行分析時,從87 條CDS(coding DNA sequence)中剔除序列長度不足300 bp、存在終止密碼子的序列及重復基因,篩選出52 條基因序列用于最終數據分析。

1.2 方法

1.2.1 相對同義密碼子使用度分析

運用Codon W 1.4.2 軟件分析復羽葉欒樹葉綠體基因組中篩選到的52 條CDS,獲取各CDS 的有效密碼子數(ENC)、同義密碼子相對使用度(RSCU)。通過在線軟件CUSP 分析獲得不同基因的GC 總含量(GC)及各個密碼子第1 位(GC1)、第2 位(GC2)、第3 位堿基的GC(GC3)含量,并根據獲得的參數繪制相關性熱圖[19-20]。

1.2.2 中性繪圖分析

以GC3為橫坐標、GC12(GC1和GC2的平均值)為縱坐標繪制散點圖,對兩者相關性進行分析。若GC12與GC3之間的相關關系不顯著,說明第 1、2 位與第3 位的密碼子堿基組成具有差異,選擇為偏好性的主要影響因素。反之,則突變是密碼子偏好性的主要影響因素[21-22]。

1.2.3 ENC-plot 繪圖分析

以ENC 值為縱坐標,GC3為橫坐標進行二維散點圖的繪制。若散點在標準曲線附近,則突變是該基因密碼子偏性的主要影響因素。若散點距離標準曲線較遠,則選擇是該基因密碼子偏性的主要影響因素[23]。ENC 的理論取值為20~61,其值越接近20 偏性越強,其值越接近61 偏性越弱[24-25]。一般當 ENC 值> 35 時,表明密碼子的偏性較弱,反之,則強[21]。

顧名思義,人生價值觀是指關于人生價值的根本觀點和看法,說到底就是對人生目的和人生意義的認識。人生價值觀決定人生態度。而人生價值觀又是由人生的理想和信念所決定。有了偉大的理想和信念才能樹立正確的人生價值觀。因此,我們論及方志敏的人生價值觀,首先必須了解方志敏的人生理想和信念。

標準曲線公式:

1.2.4 PR2-plot 分析

PR2-plot 繪圖分析時將A3/(A3+ T3)作為縱坐標,G3/(G3+ C3)作為橫坐標。圖的中心點值為A=T 且C=G,其余點與中心點的矢量距離表示偏性程度和方向[26-28]。

1.2.5 最優密碼子的確定

以復羽葉欒樹葉綠體基因52 條CDS 的ENC值為偏好性標準,對其52 條CDS 的ENC 值進行排序,由低到高對其進行排序,分別選出兩端10%的基因,構建高低偏性基因庫[29],ENC 值小的為高表達庫,ENC 值大的為低表達庫[30]。將同時滿足高頻密碼子( RSCU>1)和高表達密碼子(ΔRSCU≥0.08)的密碼子定為復羽葉欒樹葉綠體基因組的最優密碼子[31-32]。

2 結果與分析

2.1 復羽葉欒樹密碼子堿基組成

利用Codon W 1.4.2 和在線軟件CUSP 對符合要求的CDS 的堿基組成及ENC 值進行分析(圖1)。結果顯示,所有CDS 序列的GC1、GC2、GC3分別為47.27%、39.49%、29.84%,平均GC含量為38.87%。3 個密碼子位置的GC 含量由高到低表現為GC1>GC2>GC3,說明復羽葉欒樹密碼子3 個位置的堿基組成不均衡,葉綠體基因密碼子偏好AU 堿基。對復羽葉欒樹的ENC 值進行分析,發現復羽葉欒樹各 CDS 的ENC 值在36~61 之間,52 條CDS 序列的ENC 值均大于35,說明復羽葉欒樹葉綠體基因組密碼子偏好性弱。

圖 1 復羽葉欒樹葉綠體基因組不同位置的GC 含量Fig. 1 GC content of different positions in the chloroplast genome of K. bipinnata

圖 2 葉綠體基因組密碼子各參數的相關性分析Fig. 2 Correlation analysis of each codon parameters ofchloroplast genome

表 1 復羽葉欒樹各氨基酸的RSCU 分析Table 1 RSCU analysis of each amino acid in K. bipinnata

2.2 中性繪圖分析

中性繪圖分析表明(圖3),GC12在0.220~0.379 之間,GC3在0.187~0.568 之間,相關分析顯示,GC12與GC3的相關系數為0.198,相關性不顯著,回歸系數為0.265 2。說明GC1、GC2、GC3的堿基組成存在差異,因此,推論復羽葉欒樹葉綠體基密碼子的使用偏性主要受到選擇的影響。

圖 3 復羽葉欒樹葉綠體基因組中性繪圖分析Fig. 3 Neutrality plot analysis in the chloroplast genome of K. bipinnata

2.3 ENC-plot 分析

ENC-plot 分析顯示(圖4),復羽葉欒樹的部分基因在標準曲線周圍分布,而大部分基因落在標準曲線下方,離標準曲線較遠。進一步確定基因與標準曲線的距離,對ENC 比值進行計算(表2),發現ENC 比值在-0.05~0.05 區間的有18 個,與預期ENC 值較為接近,而約65.4%的基因與預期ENC 值差距較大。因此,選擇是復羽葉欒樹葉綠體基因組密碼子使用偏好性關鍵影響因素,其他因素的影響較弱。

圖 4 復羽葉欒樹葉綠體基因組ENC-plot繪圖分析Fig. 4 ENC-plot analysis in the chloroplast genome ofK. bipinnata

表 2 復羽葉欒樹葉綠體基因組有效密碼子數比值頻數分布Table 2 Distribution of ENC ratio in the chloroplast genome of K. bipinnata

2.4 PR2-plot 分析

通過 PR2-plot 繪圖分析(圖5),發現圖中4 個區域中的基因位點呈現不均勻分布,多數處在中心點稍右下位置,說明在第3 位堿基的選擇上密碼子具有偏好性,且堿基的使用頻率表現為T>A、G>C。因此,復羽葉欒樹葉綠體基因組密碼子偏好性主要受到選擇的影響,還可能受到突變等其他因素的影響。

圖 5 復羽葉欒樹密碼子奇偶偏好性分析Fig. 5 Analysis of PR2-plot of codon bias ofK. bipinnata

2.5 最優密碼子的確定

根據表3,將同時滿足RSCU>1、ΔRSCU≥0.08 兩個條件的密碼子確定為最優密碼子,最終篩選出了12 個最優密碼子(CUU、GUU、AGU、GCA、CAA、CAU、AAA、GAU、CGU、CGA、GGU、GGA),其中7 個以U 結尾,5 個以A結尾。

表 3 復羽葉欒樹葉綠體基因組最優密碼子的確定Table 3 Determination of optimal codons in the chloroplast genome of K. bipinnata

3 結論與討論

自然界常見的20 種氨基酸,除蛋氨酸(Met)和色氨酸(Trp)由 1 個密碼子編碼外,其余18 種均由2~6 個密碼子編碼。編碼同一種氨基酸的密碼子稱為同義密碼子。理論上在沒有突變和進化壓力等因素下,mRNA 翻譯時同義密碼子的使用頻率應相等[33],但在實際情況中,同義密碼子的使用頻率表現出很大差異,由此造成了同義密碼子使用偏性。本研究依托復羽葉欒樹葉綠體基因組數據,以篩選出的52 條完整CDS 序列為研究對象,對其密碼子的堿基構成及偏好性進行分析,發現復羽葉欒樹葉綠體基因組的密碼子使用頻率AU>CG,總體上偏好使用堿基為A/U的密碼子。在燈盞花(Erigeron breviscapus)[5]、秋茄(Kandelia obovata)[34]、蒺藜苜蓿(Medicago truncatula)[35]等物種的研究中也得出類似結論,這些研究均指出葉綠體基因組密碼子使用模式中偏好使用A/U 堿基。而對芒果(Mangifera indica)[31]等的研究發現,葉綠體基因組偏好使用G/C 堿基,這與本研究結果不一致。

研究表明,影響氨基酸密碼子偏好性的原因除了突變和自然選擇外,還與堿基的組成差異、基因編碼結構和 tRNA 豐度、GC 含量、基因長度等因素有關[8]。綜合分析發現,復羽葉欒樹葉綠體基因組密碼子偏好性關鍵受到自然選擇的影響,在對藿香(Agastache rugosa)[36]、紫苜蓿(Medicago sativa)[37]、灰毛漿果楝(Cipadessa baccifera)[32]、抽筒竹(Gelidocalamus tessellatus)[22]等植物的研究中也得到了相似結果。但在對蒺藜苜蓿[35]、薔薇科果樹[38]、乳油木(Vitellaria paradoxa)[39]、籽粒莧(Amaranthus hypochondriacus)[40]等植物的研究中指出,突變是影響葉綠體基因組密碼子偏好性的因素。由此可見,影響不同植物葉綠體密碼子偏好性的主要因素不同,植物葉綠體密碼子偏好性受到多種因素影響。從進化學角度上看這種差異很可能與不同物種對自然環境的適應性調節相關。本研究中GC3、ENC 與基因長度無顯著相關關系,說明基因長度對密碼子偏好影響并不大,這與梁曉靜等[41]的研究結果相似,說明密碼子偏好性影響因素具有一定的相似性。但也有研究表明基因長度對密碼子偏性有影響,可見密碼子偏性的影響因素不僅因物種而異還受多種未知因素影響。

本研究將RSCU>1 且ΔRSCU≥0.08 的密碼子確定為高表達密碼子,最終篩選出了復羽葉欒樹葉綠體基因組的12 個最優密碼子(CUU、GUU、AGU、GCA、CAA、CAU、AAA、GAU、CGU、CGA、GGU、GGA),其中7 個以U 結尾,5 個以A 結尾,這與上述復羽葉欒樹葉綠體基因組密碼子偏好使用A 或U 結尾密碼子的結論相一致。

猜你喜歡
偏性欒樹密碼子
獨行菜抗逆相關轉錄因子LaDREB密碼子偏性與進化分析
密碼子與反密碼子的本質與拓展
隨季節而變奏的欒樹
我和欒樹有個約會
我和欒樹有個約會
10種藏藥材ccmFN基因片段密碼子偏好性分析
看待中藥毒性 厘清三大誤區
欒樹
密碼子偏性分析方法及茶樹中密碼子偏性研究進展
茶樹CsActin1基因密碼子偏性分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合