?

黑翅土白蟻工蟻和兵蟻轉錄組測序比較及表達分析

2022-07-19 09:33黃雙
天津農業科學 2022年6期
關鍵詞:轉錄組工蟻比較分析

黃雙

摘? ? 要:基于Illumina高通量測序RNA-seq技術對黑翅土白蟻Odontotermes formosanus (Shiraki,1909)的工蟻和兵蟻進行了轉錄組測序分析,了解不同品級的轉錄組特征,豐富白蟻轉錄組數據信息,為探明黑翅土白蟻品級分化的分子機制打下基礎。經過測序獲得質量值高于20的堿基比例(Q20)均不低于98%的數據,所有reads組裝成65 604個Unigenes,平均長度337.78 bp;將所得序列注釋到NR、NT、KOG、GO和KEGG等數據庫進行比對,所得Unigenes均被注釋。兵蟻與工蟻差異基因的上調基因有與能量代謝及蛋白質翻譯有關,下調相關基因有與能量運輸相關,差異基因豐富,有助于黑翅土白蟻品級分化相關基因挖掘。本研究擴充了黑翅土白蟻的基因資源,為科學研究白蟻種群的基因構造、遺傳社會性、獲取有效分子標記、綜合防控等提供珍貴的生物資源。

關鍵詞:黑翅土白蟻;轉錄組;工蟻;兵蟻;比較分析

中圖分類號:Q963? ? ? ? ?文獻標識碼:A? ? ? ? ? ? DOI 編碼:10.3969/j.issn.1006-6500.2022.06.001

Comparative Transcriptome Sequencing and Expression Analysis of Worker and Soldier Termites of Odontotermes Formosanus

HUANG Shuang

(Key Laboratory of Southwest China Wildlife Resources Conservation ( Ministry of Education) ,China West Normal University, Nanchong , Sichuan 637002, China)

Abstract: Based on Illumina high-throughput sequencing RNA-seq technology, the transcriptome of worker and soldier termites of Odontotermes formosanus (Shiraki, 1909) was sequenced to understand the transcriptome characteristics of different grades, to enrich the information of termite transcriptome data, and to lay the foundation for exploring the molecular mechanism of grade differentiation in the black-winged soil termite. After sequenced, we obtained data that the proportion of bases with quality values higher than 20 (Q20) was not less than 98%, and all reads were assembled into 65 604 Unigenes with an average length of 337.78 bp. The obtained sequences were annotated to NR, NT, KOG, GO and KEGG databases for comparison, and all Unigenes were annotated. The up-regulated genes were related to energy metabolism and protein translation, and the down-regulated genes were related to energy transport, which were rich in differential genes and could help to further develop their work to find their class differentiation-related genes. The study expands the genetic resources of black-winged soil termites and provides valuable biological resources for scientific research on the genetic structure of termite populations, genetic sociality, acquisition of effective molecular markers, and integrated prevention and control.

Key words: Odontotermes formosanus (Shiraki, 1909); transcriptome; worker ants; solider ants; comparative analysis

黑翅土白蟻Odontotermes formosanus(Shiraki,1909)為白蟻科(Termitidae)大白蟻亞科(Macroter-mitinae)土白蟻屬(Odontotermes),屬土棲性白蟻,主要分布在我國北緯35°以南的地區,分布范圍廣,食性雜,主要以樹根、皮層、幼苗、幼樹、莊稼秸桿、甘蔗、竹根、草根、水稻等為取食對象,也能取食牛糞[1-2]。黑翅土白蟻品級包括蟻王與蟻后、有翅成蟲、兵蟻、工蟻4個品級[3],各品級白蟻具有不同的行為模式和社會分工,其中蟻后與有翅成蟲為繁殖蟻,而工蟻與兵蟻為不育蟻,其形態結構及社會職能為不同屬性[4]。根據巢體大小其卵分化為不同品級,其分化時間及齡期會不同。黑翅土白蟻工蟻數量全巢最多,可達到200萬個,從卵孵化到工蟻需要17 d;兵蟻數量次之,兵蟻有雌雄之分,但無交配生殖能力,從卵孵化到兵蟻分化大約需要24 d[5]。工蟻社會屬性為作工,主要有筑巢、供食、修路、照顧幼蟻、覓食等;兵蟻社會屬性為保衛巢穴,用發達的上顎和能分泌毒液的額腺作為防御武器[6]。卵發育為工蟻或兵蟻受環境影響,且在最后1個齡期前其品級完成轉化,通過工蟻與兵蟻的高通量轉錄組測序比較分析,可為影響分化品級基因發生的分子機制提供研究信息[7]。本研究采用Illumina Hiseq 2000高通量測序技術對黑翅土白蟻工蟻與兵蟻進行測序及生物信息學分析,建立轉錄組數據庫,分析兵蟻和工蟻表達差異顯著的基因,為其分化品級相關分子機制的研究提供依據[8]。

1 材料和方法

1.1 試驗材料

2020年6月在四川南充西山進行了黑翅土白蟻樣品的采集,采集后立刻將其保存在RNA保存液中。

1.2 試驗方法

1.2.1 總RNA提取 選取樣品中的兵蟻20頭和工蟻30頭,分別取下頭部,成功地從工蟻和兵蟻頭部提取總RNA。

1.2.2 轉錄組測序 通過Illumina Hiseq 2000平臺測序,構建cDNA文庫,在無參考基因組的條件下,通過樣本間比較對差異基因進行分析。其中,對照組為工蟻,處理組為兵蟻。測序由上海生工生物有限公司完成。

1.2.3 數據處理 在Hiseq平臺上經CASAVA堿基識別 (Base Calling) 分析轉化得到原始測序序列(Sequenced Reads),黑翅土白蟻的兵蟻和工蟻的轉錄組原始數據通過FastQC進行原始數據質量評估,使用Trimmomatic[9]進行質量剪切,得到clean 數據。再使用Trinity軟件[10]組裝成轉錄本,得到轉錄組拼接序列(Transcript)和冗余后的拼接轉錄本序列(Unigene)。使用Salmon[11]計算基因的表達量,Unigene表達量的計算使用TPM(Transcripts Per Million)。計算方式為:

TPMi=××106

Xi=total exon fragment/reads Li=

1.2.4 Unigene的注釋、功能分類和生物學通路分析 通過BLAST[12]將拼接后的Unigene序列與CDD、KOG、NR、NT、PFAM、Swissprot、TrEMBL等多個數據庫進行比對,摘取重要數據庫比對信息得到其重要功能注釋信息。比對到NCBI非冗余核酸數據庫(NCBI non-redundant protein sequences,NR)中,分析物種相似性。根據轉錄本與Swissprot、TrEMBL的注釋結果得到基因功能分類數據庫(Gene Ontology,GO)功能注釋信息,從宏觀上認識黑翅土白蟻的工蟻及兵蟻的基因和基因產物的屬性。對Unigene進行真核蛋白質直系同源數據庫(Clusters of orthologous

groups for eukaryotic complete genomes,KOG)比對,對其可能的功能分類統計[13]。利用KAAS得到轉錄本基因組百科全書代謝通路庫(Kyoto encyclopedia of genes and genomes,KEGG)注釋信息,了解其代謝途徑、生物學功能以及基因間的相互作用等[14]。

1.2.5 工蟻和兵蟻差異基因表達數據分析處理? 利用聚類分析軟件對表達模式相似的不同基因進行聚類,并用數據分析比較基因差異。

2 結果與分析

2.1 工蟻和兵蟻RNA-seq轉錄組數據拼接及注釋結果

2.1.1 工蟻和兵蟻RNA-seq轉錄組數據拼接結果 黑翅土白蟻兵蟻共獲得24 138 602條原始序列,Q20含量98.93%,GC含量62.28%。工蟻共獲得39 376 474條原始序列,Q20含量98.97% ,GC含量57.40%,具體見表1。轉錄組測序結果較好,能夠滿足后續數據分析。

將轉錄組進行de novo拼接,這些干凈讀數組裝成 99 639 條Transctipt,這些轉錄本最后被組裝成 65 604條Unigenes。對已組裝的轉錄本和Unigenes進行了長度分布統計,具體見表2。

2.1.2 工蟻和兵蟻Unigene序列的比對及NR注釋? 用NCBI Blast+將工蟻和兵蟻所有Unigenes序列比對到PFAM、Swissprot、TrEMBL、CDD、KOG、NR、NT7個數據庫,其注釋基因分別有8 738,18 326,

23 458,13 235,11 562,23 646,13 256條。NR數據庫可查閱同源序列的功能信息及與相似物種的近似值,注釋匹配較高的相似物種分別為內華達州濕木白蟻(Zootermopsis nevadensis)、小鼠(Mus muscuius)、家白蟻(Coptotermes formosanus),分別有8 549,

2 477,789條相似序列。

2.1.3 工蟻和兵蟻Unigene的GO注釋及其分類? 根據NR數據庫注釋所得,對21 285條Unigenes(占總Unigenes的32.44%)進行了GO功能注釋,共注釋206 751個GO功能,可了解其基因功能分布特征。在GO注釋中有3大類別,分別是生物過程、細胞組分和分子功能。如圖1所示,生物過程共注釋了92 356個基因,數量最多,占總注釋的44.67%,其包含的26個功能亞類中,以細胞進程(Cellular Processes)和代謝過程(Metabolism)、生物調節(biological regulation)占主導地位,分別占該類型15.95%,12.76%,8.87%,以生物相(biological phase)最低,僅占生物過程全部的0.000 3%。其次是細胞組分,共注釋了82 799個基因,占40.04%,其包含的22個功能亞類中,細胞(cell)、細胞組分(cell part)、細胞器(organelle)占主導地位,分別占該類別的18.88%,18.81%,13.97%,而以其他細胞器(other organism)和其他細胞器組成(other organism part)較低,均占該類別的0.02%。分子功能最少,共31 596個基因被注釋,占15.28%,其包含的21個功能亞類中,以結合(binding)、催化活性(catalytic activity)居多,分別占該類型的42.41%,32.18%,而以形態發生素活性(morphogen activity)、化學排斥物活性(chemorepellent activity)、營養庫活性(nutrient reservoir activity)、金屬伴侶蛋白活性(metallochaperone activity)較低,分別占該類別的0.001%,0.019%,0.022%,0.025%。這些結果顯示了黑翅土白蟻頭部基因表達情況,以生物活性及代謝調節相關的基因量較多,表明黑翅土白蟻代謝能力較強。

2.1.4 黑翅土白蟻轉錄組Unigenes的KOG注釋及其分類 在KOG注釋成功的基因有11 562條Unigenes,占總Unigene的17.62%。按其數據庫功能分類為25個。其比對結果如圖2所示,信號傳導機制(Signal transduction mechanisms)最多,占12.8%,其次是翻譯后修飾、蛋白質折疊和分子伴侶(Posttranslational modification,protein turnover,chaper-

ones,11.85%),一般功能基因(General function prediction only,9.89%),翻譯、核糖體結構與生物起源(Transiation,ribosomal structure and biogenesis,7.95%);而防御機制(Defense machanisms, 0.72%)、核結構(Nuclear structure,0.36%)和細胞運動性(Cell motility,0.10%)是最小的類群。結果表明,黑翅土白蟻在信號傳遞和轉錄、翻譯等基因表達豐度高。

2.1.5 工蟻和兵蟻差異表達基因Unigene的KEGG代謝通路分析 根據KO與Pathway的關聯性對KEGG代謝通路進行分析。結果如圖3所示,共有9 539 Unigenes獲得注釋(14.54%),共獲得6 657個KEGG功能注釋。黑翅土白蟻Unigenes參與或涉及的代謝通路可歸為5個類別,即環境信息處理(Environmental Information Processing)、代謝(Metabolism)、細胞過程(Cellular Processes)、生物系統(Organismal Systems)、遺傳信息處理(Genetic Information Processing),共有33個亞類293個信號通路(Pathway)。大多數Unigenes都被注釋到了代謝、有機系統。參與代謝的共有2 271條Unigenes,主要集中在參與糖代謝過程(Carbohydrate metabolism)的Unigenes數量為419條,比例為18.45%;其次參與能量代謝過程(Energy metabolism)的為328條(14.44%);參與全局整體映射(Overview)和氨基酸代謝(Amino acid metabolism)的Unigenes分別有301條(13.25%)和279條(12.29%)。參與生物系統的共有1 415條Unigenes,主要集中在內分泌系統(Endocrine system,21.98%)和免疫系統(Immune system,18.80%)。參與細胞過程的共有 895條Unigenes,主要集中在運輸與代謝(Transport and catabolism,38.77%)和細胞群落(Cellular community,28.38%)。環境信息處理涉及912條Unigenes,包括信號轉導(Signal transduction,79.50%),信號分子和交互作用(Signaling molecules and interaction,13.38%),膜轉運(Membrane transport,7.13%)?;蛐畔⑻幚砩婕? 164條Unigenes,主要涉及翻譯(Translation,46.48%),折疊、分類和降解(Folding sorting and degradation,31.27%)。

2.2 工蟻和兵蟻差異基因表達的分析

2.2.1 工蟻和兵蟻差異基因Unigenes的GO富集分析 所有Unigenes比對到數據庫中所有差異基因數為53 092個,其中工蟻和兵蟻差異表達基因GO生物過程比對基因數為16 957個,如圖4所示,最顯著富集基因數為3 472個,主要用于發育過程(developmental process)、多細胞生物過程(multicellular organismal process)、生物調節(biological regulation)、生物過程調節(regulation of biological process)、行為(behavior)、信號(signaling)等;細胞組成中比對基因數有3 908個,其中最顯著富集基因數為3 908個,主要用于膜部分(membrane part)、突觸(synapse)、突觸部分(synapse part);分子功能比對基因數為18 062個,其中最顯著富集基因數為3 810個,主要功能是結構分子活性(structural molecule activity)、受體活性(receptor activity)、運輸活性(transporter activity)等。

2.2.2 工蟻和兵蟻差異基因Unigenes的KEGG富集分析 KEGG通路中所有基因數3 591個,其中差異表達基因數890個,差異表達基因顯著富集通路20個(表3),其中5個是與營養因子合成及代謝相關的通路,5個是與蛋白質、激素合成相關的通路,3個是與免疫應答相關的通路,7個是與信號傳導相關通路。

2.2.3 工蟻和兵蟻差異基因表達的分析 在兵蟻和工蟻的處理組中,有20 486個差異基因,篩選出10 503個具有顯著表達差異基因,其中上調基因有5 099個,下調基因有5 404個(圖5)。具有功能注釋的上調基因有2 291個,具有功能注釋的下調基因有4 063個。工蟻和兵蟻一共有27 167個相同的差異表達基因,12 279條有功能注釋。工蟻有19 889個特有差異基因,7 969條有功能注釋;兵蟻有17 868個特有差異基因,9 670條有功能注釋。

2.2.4 工蟻和兵蟻相比差異幅度最大且前18位的基因 與兵蟻頭部基因表達相比,工蟻頭部中上調或下調幅度前18位基因見表4。統計學差異顯著性檢驗指標P<0.01;q為校正后的P值,q<0.01。從表4可以看出,兵蟻上調幅度最大前7位基因中有主要功能為碳水化合物運輸和代謝及翻譯、核糖體結構和生物生成,其余功能未知;在工蟻中下調幅度最大的前11位基因主要功能為能量運輸相關,其余功能未知。

3 結論與討論

本研究中,采用Illumina hisiqTM高通量測序對黑翅土白蟻的兵蟻和工蟻的轉錄組差異進行了分析,獲得黑翅土白蟻轉錄組信息。測序結果發現,共獲得0.58 Gb的clean reads,每個樣品的Q20含量均在98%以上,說明測序質量較好。經過組裝拼接構建Unigenes數據庫,共獲得65 604個Unigenes,平均長度為337.78 bp,N50為319 bp,N90為216 bp,且多數Unigenes能比對到親緣關系較近的物種,說明其測序組裝質量較好。采用生物信息學分析方法,對黑翅土白蟻兵蟻及工蟻轉錄組的序列進行功能注釋及其功能分類。通過NR數據庫的比對,有23 646條序列比對上,占總Unigene的36.04%。在KOG分類中,共得到11 562個功能注釋,涉及25個KOG類別,其中信號傳導機制比例最大(1 632個,12.80%),其次是翻譯后修飾、蛋白質轉換、分子伴侶(1 511個,11.85%),防御機制比例較?。?2個,0.72%),最小是核結構(46個,0.36%),這些基因反映了兵蟻與工蟻在一定時期的表達情況。在NR數據庫中發現剩余的未被注釋的基因在無參考基因組的條件下,可能是黑翅土白蟻自身特有的基因,或是含有蛋白質編碼未翻譯或非保守的一段區域[15]。

在GO分類中,獲得206 751個功能性注釋,占生物過程注釋總數的44.67%,其次是細胞成分(40.04%)和分子功能(15.28%)。在KEGG分類中,有3 591條Unigenes具有具體的定義,共獲得6 657個KEGG功能注釋,在5大分支中,基因主要參與信號傳導、翻譯、糖代謝、折疊排序和降解。對黑翅土白蟻兵蟻及工蟻差異表達基因進行分析,發現細胞胚胎發育、生物調節、膜部分、突觸等基因表達均存在差異。黑翅土白蟻中兵蟻及工蟻的差異基因表達分析結果可根據qPCR試驗進行進一步分析。兵蟻失去自身取食能力,需由工蟻將食物吞入自身體內然后將已經消化或半消化的營養從口吐出或腸管下側排出予以喂飼才能存活。因此,轉錄組分析可進一步探索和發現纖維素利用、消化酶的調控基因[16]。

通過轉錄組測序發現有65 604條Unigenes具有注釋信息,占總Unigenes的100%。其中,GO分析得到69個功能分類,以生物學過程、細胞組分占大多數,各分亞類中以細胞組分、細胞、細胞進程等類別的基因含量豐富,表明黑翅土白蟻具有很強的細胞活性機制;KOG分析可分為25個不同功能分類,以信號傳導機制和轉錄功能、一般功能基因的較多;KEGG的293個代謝通路,以代謝、有機系統較為豐富。兵蟻與工蟻差異基因的上調基因有與能量代謝及蛋白質翻譯有關,下調相關基因有與能量運輸相關,差異基因豐富,有助于黑翅土白蟻品級分化相關基因發掘。黑翅土白蟻基因豐富,分析其基因分布特征,確定基因代謝通路的分布,為黑翅土白蟻基因提供了轉錄組水平上的支持,也為后續黑翅土白蟻基因構造,遺傳社會性,獲取有效分子標記,綜合防控等提供珍貴的生物資源。

參考文獻:

[1] 黃復生, 朱世模, 平正明, 等. 中國動物志 昆蟲綱 第十七卷 等翅目[M]. 北京: 科學出版社, 2000.

[2] 蔡邦華, 陳寧生. 中國白蟻分類和區系問題[J]. 昆蟲學報, 1964, 13(1): 25-37.

[3] 徐志德, 李德運, 周貴清, 等. 黑翅土白蟻的生物學特性及綜合防治技術[J]. 昆蟲知識, 2007, 44(5): 763-769.

[4] 陳艷. 黑翅土白蟻巢群間競爭和種間競爭的研究[D]. 武漢: 華中農業大學, 2007.

[5] 黃求應. 黑翅土白蟻覓食行為學基礎及誘殺系統的研究[D]. 武漢: 華中農業大學, 2006.

[6] PRESTWICH G D. Chemical systematics of termite exocrine secretions[J]. Annual Review of Ecology and Systematics, 1983, 14(1): 287-311.

[7] MIURA T, KAMIKOUCHI A, SAWATA M, et al. Soldier caste-specific gene expression in the mandibular glands of Hodotermopsis japonica (Isoptera: Termopsidae)[J]. Proceedings of the National Academy of Sciences of the United States of America, 1999, 96(24): 13874-13879.

[8] LEONARDO F C, DA CUNHA A F, DA SILVA M J, et al. Analysis of the workers head transcriptome of the Asian subterranean termite, Coptotermes gestroi[J]. Bulletin of Entomological Research, 2011, 101(4): 383-391.

[9] BOLGER A M, LOHSE M, USADEL B. Trimmomatic: a flexible trimmer for Illumina sequence data[J]. Bioinformatics, 2014, 30(15): 2114-2120.

[10] HAAS B J, PAPANICOLAOU A, YASSOUR M, et al. De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis[J]. Nature Protocols, 2013, 8(8): 1494-1512.

[11] PATRO R, DUGGAL G, LOVE M I, et al. Salmon provides fast and bias-aware quantification of transcript expression[J]. Nature Methods, 2017, 14(4): 417-419.

[12] ALTSCHUL S F, MADDEN T L, SCH?FFER AA, et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs[J]. Nucleic Acids Research, 1997, 25(17): 3389-3402.

[13] TATUSOV R L, GALPERIN M Y, NATALE D A, et al. The COG database: a tool for genome-scale analysis of protein functions and evolution[J]. Nucleic Acids Research, 2000, 28(1): 33-36.

[14] KANEHISA M, GOTO S. KEGG: kyoto encyclopedia of genes and genomes[J]. Nucleic Acids Research, 2000, 28(1): 27-30.

[15] HOWARD R, HAVERTY M I. Seasonal variation in caste proportions of field colonies of Reticulitermes flavipes (Kollar)[J]. Environmental Entomology, 1981, 10(4): 546-549.

[16] MCMAHAN E A. Studies of termite wood-feeding preferences[J]. Proceedings, Hawaiian Entomological Society, 1966, 19(2): 239-250.

猜你喜歡
轉錄組工蟻比較分析
蟻群的“神經系統”
基于轉錄組測序的山茱萸次生代謝生物合成相關基因的挖掘
金釵石斛轉錄組SSR位點信息分析
人參屬藥用植物轉錄組研究進展
經管類本科生就業期望與實際就業的比較分析
螞蟻的飼養
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合