?

地熊蜂基因組中具有潛在活性的轉座子鑒定

2021-05-22 02:59
中國蜂業 2021年5期
關鍵詞:轉座子熊蜂拷貝數

(中國農業科學院蜜蜂研究所,北京 100093)

轉座子(TEs)是能夠從基因組一個位點轉移到另一個位點,在此過程中通常會發生自我復制的DNA 片段[1]。轉座子可分為逆轉錄轉座子和DNA 轉座子兩大類。逆轉錄轉座子借助轉座子轉錄后產生的mRNA 而完成轉座過程,轉座后逆轉錄轉座子的拷貝數增加;而DNA 轉座子是借助自身的DNA 序列發生轉座,可以是復制或非復制型的轉座[2,3]。在幾乎所有生物的基因組中都發現了轉座子,通常數量很多。例如在脊椎動物基因組中,轉座子含量的變化范圍從綠河豚的6%到斑馬魚的55%以上[4]。在植物中,轉座子更為普遍,轉座子覆蓋了多達90%的玉米基因組[5]。在昆蟲中,轉座子的基因組部分從南極蠓中的低至1%[6]到蝗蟲中的高達65%[7]。由于轉座子可以在一個生物的基因組中發生跳動,這一方面可能破壞基因的編碼序列或調控序列,造成個體的表型發生變異;還可能為染色體的異位重組提供熱點,從而導致宿主基因組中的染色體發生缺失、重復、倒位和易位等變異[8,9]。目前科學家利用活躍的轉座子可以破壞基因組中功能基因的這一特點,為許多種生物創制了突變體,并利用這些突變體鑒定出了許多功能基因。例如,利用Sleeping Beauty轉座子誘變小鼠,鑒定出涉及膠質瘤產生的候選基因[10];在逆轉座子Tos17誘導產生的水稻胎生突變體中捕獲了影響水稻脫落酸合成的OsABA1和OsTATC基因[11];根據P轉座子創造的果蠅突變體的表型特征,發現了與睡眠調節有關的SLEEPLESS基因[12]等。鑒定出的功能基因在生物的遺傳育種和品質改良中發揮了重要作用。

熊蜂是植物重要的傳粉者,具有重要經濟和生態價值[13]。在世界范圍內,熊蜂為超過4 萬公頃的溫室作物授粉,產生的經濟價值約為120 億歐元/年[14]。但目前只有少數幾種熊蜂能夠提供授粉服務,其余大多數熊蜂由于繁育或授粉性能差而不能被很好地使用。近年來,隨著全球環境變化的加劇,野外生存的熊蜂正在遭受自然界中各種生物和非生物因素的影響,導致一些熊蜂的數量顯著減少[15]。鑒于熊蜂在農業生產上的重要性及它們在野外環境中受到的威脅,挖掘出與熊蜂繁育、授粉及環境抗性等性狀相關的基因,對于促進熊蜂更好地服務農業生產、更好地提供生態服務非常重要。但是目前熊蜂中尚無高效的功能基因挖掘系統。

近年來,科學家成功地在昆蟲中應用轉座子進行了功能基因的挖掘,但相關研究主要集中于雙翅目的果蠅中[16-18]。本研究旨在對地熊蜂基因組中的轉座子進行全面的鑒定、分類和注釋,并鑒定出具有潛在轉座活性的轉座子,以用于熊蜂功能基因的挖掘。

1 材料與方法

1.1 基因組與已知重復序列數據庫的來源

地熊蜂的基因組序列從NCBIGenebank 數據庫下載獲得(www.ncbi.nlm.nih.gov/),assembly accession:GCF_000214255.1。

1.2 轉座子數據庫的構建

RepeatModeler[19]是一個從頭(de novo) 鑒定和分類轉座子的軟件,其中包括RECON[20]和RepeatScout 兩個程序[21],用于轉座子家族的從頭鑒定并構建全基因組轉座子的非冗余數據庫。此外,除了重復序列組裝的一般方法外,我們還采用基于結構的轉座子預測方法,使用兩個專門的軟件來檢測小的非自主性轉座子,這是因為它們缺少編碼區,因此更難通過與同源物的分類來進行區分。MITE-Hunter[22]用于鑒定一種屬于DNA 轉座子的微型反向重復轉座元件(MITEs)。SINE_scan[23]鑒定非自主型的非LTR逆轉座子,稱為短散在元件(SINE)。SINE_scan 是基于SINE-Finder[24]的從頭識別SINE 的軟件,不同于SINE-Finder 僅能鑒定tRNA 來源的SINE,SINE_scan 可以識別所有三種已知的SINE 類型,即tRNA、7SLRNA 和5SRNA。

將RepeatModerler、MITE-Hunter 和SINE_scan產生的一致性序列(consensus sequence)合并,并使用cd-hit[25]軟件去冗余(-n 5-d 0-aL 0.99-c 0.8-s 0.8),進而得到整個基因組中非冗余的轉座子數據庫。

1.3 基因組轉座子注釋

使用RepeatMasker 軟件對得到的轉座子一致性序列進行注釋和分類(使用-a、-lib 參數),并使用軟件內置的buildSummary.pl 腳本總結轉座子超家族估計的拷貝數和基因組比例(基于每個轉座子被屏蔽的堿基數)。

1.4 轉座子間序列差異分析

一致性序列與不同拷貝之間的差異可以用K 值(kimura distance)[26]來表示。把buildSummary.pl 腳本的結果文件用作createrepeatlandscape.pl和calcdivergencefromalign.pl 腳本的輸入,以計算Kimura 距離,我們對createrepeatlandscape.pl 做出更改,對轉座子家族一致性的序列與拷貝之間的差異合并到類,并用編寫的R 腳本繪制差異分布統計圖。三個腳本都是RepeatMasker 軟件包中的Perl腳本。

1.5 潛在活性轉座子的鑒定

使用編寫的shell 腳本對RepeatMasker 的結果.out文件進行進一步篩選,對于每個與其轉座子家族的一致性序列(推測的祖先序列)差異度小于等于2%、覆蓋度大于98%的轉座子,我們提取出它們的序列,并手動驗證其是否具有活躍轉座子的序列特征。對于滿足上述所有條件的轉座子,認為它們是具有潛在活性的轉座子。

2 結果

2.1 地熊蜂基因組轉座子鑒定結果

表1 地熊蜂全基因組轉座子統計分析結果

經過RepeatMasker 的統計結果,我們在地熊蜂基因組中一共鑒定出了167 條一致性序列,被劃分到22 個超家族中(表1)。DNA 轉座子和逆轉錄轉座子占比幾乎相同,TcMar、Jockey 和Maverick 是含量最豐富的轉座子,代表了基因組中超過50%的轉座子,P 轉座子含量最低。LTR 主要的類別都存在于地熊蜂基因組中,其中Gypsy 和Pao 類別最多。與DNA、LINE、LTR 轉座子相比,SINE 轉座子所占比例最小。

2.2 轉座子差異分布分析結果

圖1 基于Kimura distance計算的地熊蜂轉座子拷貝之間的差異性

我們通過計算K 值來估算轉座子的年齡和轉座歷史,其中每一個波峰可以代表物種在進化過程中發生了轉座子拷貝數迅速增加(爆發)。從結果可以看出,在地熊蜂的基因組中發生了兩次爆發事件(圖1)。在第一次爆發事件中,DNA 轉座子是最主要的成分,顯示出DNA 轉座子在此階段極為活躍。轉座子的第二次也就是最近的一次爆發中,DNA、MITE以及LINE 都出現了拷貝數的增加。對于地熊蜂基因組來說,DNA 轉座子的活躍轉座貫穿了兩次爆發事件。

2.3 潛在的活躍轉座子

在地熊蜂基因組中,我們鑒定出兩條MITE 轉座子,它們與祖先序列的分化程度小于2%并且具有完整的轉座子結構,我們認為它們是具有潛在活性的轉座子。序列如下:

3 討論

在基因組中對轉座子進行全面注釋與研究至關重要,但是大多數測序項目都對與表型特征相關的基因組成分感興趣,通常會忽略基因組的重復序列或僅給予很少關注。轉座子是一大類在生物基因組中廣泛存在的序列。轉座子是挖掘功能基因的有力工具,果蠅中人們已經成功地利用活躍的轉座子來創制果蠅的突變體,進行功能基因的挖掘[27-29]。本研究在地熊蜂基因組鑒定出2 條潛在活躍的MITE 轉座子,若能進一步通過實驗驗證其活性,將對熊蜂功能基因挖掘及優良品種培育具有重要意義。

猜你喜歡
轉座子熊蜂拷貝數
毛竹Mariner-like element自主轉座子的鑒定與生物信息學分析*
線粒體DNA拷貝數變異機制及疾病預測價值分析
安徽省首次從國外進口熊蜂
淅川烏骨雞全基因組轉座子的鑒定與分析
胎兒染色體組拷貝數變異與產前超聲異常的相關性分析
云的世界你不懂
魔手花,神奇果
花葉矢竹轉錄組中的轉座子表達分析
HBV相關性肝細胞癌組織及癌旁組織PDCD1基因拷貝數差異分析
樂器也瘋狂
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合