?

比較基因組分析斯氏假單胞菌遺傳多樣性及固氮基因島進化機制

2017-02-27 10:35李向陽湯宏張國輝
江蘇農業科學 2017年1期
關鍵詞:多樣性

李向陽+湯宏+張國輝

摘要:對5株固氮與11株非固氮斯氏假單胞菌(Pseudomonas stutzeri)基因組開展綜合比較分析,從基因組水平上研究斯氏假單胞菌種內遺傳多樣性及其固氮基因島進化機制。核心與元基因組分析發現,16個斯氏假單胞菌擁有的獨特基因數占元基因數的46.37%;基于平均核苷酸相似度分析,這16個菌株被劃分為11種不同的基因組變異型,表明斯氏假單胞菌基因組異質化程度高。固氮基因島及進化樹分析表明,5株固氮菌屬于3種不同基因組變異型,它們的固氮基因島及其側翼序列保守性好,而且固氮酶基因進化樹與菌株譜系進化樹呈現高度一致性。據此推測,斯氏假單胞菌祖先可能通過水平基因轉移的方式獲得固氮基因島,從而轉變為固氮菌,但是在后期進化過程中,絕大部分固氮菌株丟失了固氮基因島。

關鍵詞:斯氏假單胞菌;固氮基因島;比較基因組;基因組變異型;多樣性

中圖分類號: S182 文獻標志碼: A 文章編號:1002-1302(2017)01-0033-06

斯氏假單胞菌(Pseudomonas stutzeri)屬γ變形菌亞門(γ-Proteobacteria)假單胞菌屬(Pseudomonas),是革蘭氏陰性菌。它廣泛分布于土壤、湖泊和海洋,甚至臨床環境中[1-2],是研究細菌反硝化作用機制的主要模式菌株之一,同時也是假單胞菌屬中為數不多的具備生物固氮能力的菌種[3-4]。代謝功能多樣性是斯氏假單胞菌的典型特征,這些代謝功能使得斯氏假單胞菌在農業生產和環境修復領域具有重要應用價值[3]。例如,斯氏假單胞菌的生物固氮和反硝化代謝作用廣泛參與氮元素的地球化學循環;一些斯氏假單胞菌能夠降解芳香族化合物(如萘、苯并蒽、咔唑)[5]并參與重(類)金屬循環與轉化[6]。此外,很多菌株具有自然轉化(自然吸收外界DNA)的能力,如自然轉化菌株P. stutzeri DSM 10701[7]、P. stutzeri 28a24[8]。

基于16S rRNA 基因及多位點序列分析發現,斯氏假單胞菌在遺傳水平上呈現高度異質性[9-10]。因為在分類學上暫時沒有發現明確的表型來支持新種的劃分,所以研究者暫時采用基因組變異型對這些斯氏假單胞菌進行分類[3]。目前斯氏假單胞菌被劃分為多達19種不同的基因組變異型[3,11],如該種的典型菌株P. stutzeri ATCC 17588和固氮菌株P. stutzeri A1501為基因組變異型1的菌株[12-13];P. stutzeri ATCC 14405為基因組變異型2的菌株[14];固氮菌株P. stutzeri NF13為基因組變異型19的菌株[15]。

自2008年中國農業科學院首次完成聯合固氮斯氏假單胞菌A1501基因組序列測定以來[13],目前累計已對十幾株分離于不同環境的斯氏假單胞菌完成了基因組序列的測定,其中包括5株固氮菌,分別是菌株P. stutzeri A1501、P. stutzeri DSM4166、P. stutzeri B1SMN1、P. stutzeri NF13、P. stutzeri KOS6[13,15-18]。對P. stutzeri A1501菌株的固氮基因島分析顯示,它由49個成簇分布的基因組成。通過與假單胞菌屬其他菌株基因組序列比較并結合GC含量分析,推測菌株A1501的固氮基因島可能通過水平基因轉移的方式獲得[13]。

雖然眾多斯氏假單胞菌完成了基因組測序,但是目前還沒有對它們開展多基因組比較的報道。本研究首次對16株斯氏假單胞菌基因組進行綜合比較分析,從基因組成水平上分析與解釋斯氏假單胞菌顯著的遺傳多樣性;同時通過斯氏假單胞菌種內的5株固氮菌、11株非固氮菌基因組之間的比較來分析固氮基因島復雜的進化機制。

1 材料與方法

1.1 材料

16株斯氏假單胞菌基因組從美國國家生物技術信息中心(NCBI)基因組數據庫下載,包括7株完整基因組(P. stutzeri 28a24、P. stutzeri A 1501、P. stutzeri ATCC 17588、P. stutzeri CCUG 29243、P. stutzeri DSM 10701、P. stutzeri DSM 4166 和P. stutzeri RCH2)和9株草圖基因組(P. stutzeri ATCC 14405、P. stutzeri B1SMN1、P. stutzeri KOS6、P. stutzeri MF28、P. stutzeri NF13、P. stutzeri SDM-LAC、P. stutzeri T13、P. stutzeri TS44 和P. stutzeri XLDN-R)。

1.2 方法

1.2.1 核心基因與元基因組分析 利用自編寫的Perl腳本從16個斯氏假單胞菌的基因組序列注釋文件中分別提取每個基因組的所有基因序列,作為元基因組分析軟件PGAP[19]的輸入文件;然后在LINUX系統下運行PGAP,依次經蛋白質同源聚類分析和元基因組計算,即可獲得元基因組和核心基因組信息。

1.2.2 核心基因序列構建系統譜系進化樹 利用16個斯氏假單胞菌的核心基因數據來推導它們之間的譜系進化關系。首先從17個菌株(選取銅綠假單胞菌Pseudomonas aeruginosa POA1為外群菌株)的核心基因中選取894個高度保守基因(蛋白質相似度≥70%,序列比對覆蓋度≥90%),確保這些同源蛋白基因在每個基因組中只有1個拷貝,而且每套保守基因的長度都差不多;用ClustalW分別比對每套保守基因的蛋白質序列,然后將這些保守基因比對結果串聯成17條氨基酸鏈,每條分別對應1個基因組;將串聯得到的序列文件導入MEGA 5.0[20]軟件,選擇鄰接法來重構進化樹,Bootstrap方法重復計算1 000次來評估樹的可靠性。

1.2.3 平均核苷酸相似度(ANI)分析及進化樹構建 平均核苷酸相似度表示2個菌株在基因組DNA水平上的相似度,一般用軟件JSpecies[21]進行計算。JSpecies計算平均核苷酸相似度的主要步驟:(1)將16個基因組的DNA序列導入JSpecies;(2)在JSpecies窗口,根據基因組兩兩自由組合,共120個組合[C(16,2)],并選擇序列比對算法MUMMER(其他參數設置為默認)進行計算。

將JSpecies生成的120個ANI值導入Excel 2007,以 100-ANI%處理方法構建距離矩陣,然后導入MEGA 5.0構建鄰接法進化樹。

1.2.4 基因組共線性分析 7株完整基因組采用軟件MUMMER 3.0[22]進行共線性分析。在Linux環境下運行MUMMER程序,并選取典型菌株P. stutzeri ATCC 17588作為參考基因組。

1.2.5 多基因組及固氮基因島比較分析 以生物固氮株A1501生物為參考基因組,利用BLASTp 程序(選擇默認參數)比對其他15株基因組的蛋白質基因序列,然后用軟件CGview[23]對比對結果進行可視化展示。固氮基因島序列比對采用多基因組比對軟件MAUVE[24]進行。另外,通過5株固氮斯氏假單胞菌的固氮酶編碼基因nifHDK比對NCBI蛋白質數據庫,獲取其他相關菌株的nifHDK蛋白質基因序列,按照“1.2.2”節建樹類似方法,構建固氮酶基因進化樹。

2 結果與分析

2.1 16株斯氏假單胞菌基因組特征

16株斯氏假單胞菌分離于多種不同的環境,表明它們具有廣泛的環境適應性。與假單胞菌屬其他菌株相比,斯氏假單胞菌基因組較小,其長度介于4.17~5.32 Mbp之間,GC含量為60.5%~64.4%(表1)。用MUMMER3.0軟件分析種內菌株基因組之間的共線性,由圖1可知,P. stutzeriATCC17588與同一基因組變異型菌株A1501、DSM 4166及菌株RCH2之間的共線性非常保守;除幾個大片段區域的倒位外,P. stutzeri ATCC 17588與基因組變異型3菌株CCCUG 29243的整體共線性較好;但是,菌株ATCC 17588與2個自然轉化菌株(P. stutzeri DSM 10701和28a24)的共線性程度非常低。

2.2 核心與元基因組分析

核心和元基因組經常被用來評估一個種內菌株之間的多樣性[25],一個種的核心基因定義為所有菌株共同擁有的基因,也就是基本的遺傳物質用來維持這個種的特征。元基因組指的是所有基因,主要用來反映這個種容納遺傳物質的能力。分析結果表明,16個斯氏假單胞菌元基因組大小為 10 822 個同源蛋白基因,在10 822個同源蛋白基因中,所有16個菌株的獨特同源蛋白基因總和為5 018個(圖2),約為元基因組數的46.37%,說明斯氏假單胞菌通過高頻率的水平基因轉移獲取外源基因。核心基因數為2 157個同源蛋白基因(圖2),占其基因組大小的42.27%~56.54%,表明斯氏假單胞菌株只需要其50%左右的基因來維持種的基本特征。上述這些特征正好解釋了斯氏假單胞菌的表型及代謝多樣性,在一定程度上賦予它們適應周圍環境的能力。

2.3 平均核苷酸相似度分析斯氏假單胞菌多樣性

與16S rRNA基因進化樹相比較,核心基因進化樹具有更高的分辨率[26]。如圖3-A所示,基于894個核心基因構建的進化樹能夠清晰地區分16個斯氏假單胞菌之間的進化關系?;?20個ANI值構建100-ANI%雙向矩陣,然后采用MEGA構建得到進化樹,如圖3-B所示,可見ANI矩陣進化樹與核心基因進化樹之間的拓撲結構非常相似。以上結果相互驗證了2種方法推導得到的進化樹結果的可靠性。

ANI被認為是一種用來比較菌株之間進化距離的非??煽康姆椒?,2個細菌基因組之間的ANI值為95%,相當于它們之間DNA-DNA雜交值為70%,因此ANI≥95%被作為判斷細菌種的閾值[21,27]。由圖3-B可知,菌株ATCC 17588、A1501、DSM 4166、B1SMN1、T13和XLDN-R緊密聚集在一起,它們兩兩之間的ANI值均大于95%,因此被歸類為基因組變異型1;其他10個菌株兩兩之間的ANI值均小于95%的臨界值,因此分別代表基因組突變型2、3、8、19和其他未知的6種。綜上所述,16個菌株可以被劃分為11個基因組變異型;同時ANI分析結果顯示,120個ANI值介于84.51%~98.37%之間,絕大多數ANI值遠遠低于95%,說明斯氏假單胞菌基因組之間存在顯著的遺傳多樣性。

2.4 固氮基因島進化分析

從圖4-A中可以看出,固氮基因島存在于所有5株固氮斯氏假單胞菌(A1501、B1SMN1、DSM 4166、KOS6和NF13)中, 但是在其他11株非固氮斯氏假單胞菌基因組中缺失,并且固氮基因島對應的側翼序列在16個基因組中保守性較好。5株菌的固氮基因島序列比對分析結果顯示,它們整體上的組成類似,并且固氮相關基因序列相似度高(圖4-B)。此外還發現,基因組變異型1的3個菌株(A1501、B1SMN1、DSM 4166)的固氮基因島在組成與排布上幾乎完全相同;屬于基因組變異型19的NF13菌株,其固氮基因島與4株固氮菌的差異最大。為了進一步分析固氮基因島的進化機制,利用5株固氮斯氏假單胞菌及其他相關固氮菌的固氮酶編碼基因nifHDK構建進化樹。如圖5所示,固氮斯氏假單胞菌在nifHDK基因進化樹和斯氏假單胞菌譜系進化樹(圖3-A、圖3-B)中的位置關系高度一致。

3 結論與討論

本研究主要從基因組水平上對斯氏假單胞菌高度的遺傳多樣性以及固氮基因島的進化機制進行了分析。斯氏假單胞菌在進化上呈現高度的遺傳多樣性是該種研究的主要熱點之一。之前的研究主要借助16S rRNA基因或者多個看家基因來解析該種群的多樣性關系[28-32]。根據相關研究,斯氏假單

胞菌被分為19個基因組突變型,并且更多的基因組突變型還在不斷被發現。本研究首次利用已測序的16個斯氏假單胞菌基因組序列,從基因組內容(基因)、結構(共線性)及核苷酸(ANI)水平上分析了斯氏假單胞菌種內多樣性。結果顯示:(1)絕大多數斯氏假單胞菌兩兩基因組之間的ANI值都小于95%,16個菌株可以劃分為11種不同的基因組變異型;(2)獨特基因占整個元基因組數量的46.37%;(3)部分菌株基因組之間的共線性程度非常低(如DSM 10701vs ATCC 17588和28a24vs ATCC 17588)。上述現象正好解釋了斯氏假單胞菌種內高度的遺傳多樣性(異質性)以及多樣的代謝表型。在分類學上,ANI被認為很有可能替代DNA-DNA雜交法,作為一種衡量菌株之間遺傳關系的非??煽康姆椒?。本研究根據ANI分析結果推測,斯氏假單胞菌很可能將被劃分為多個親緣關系非常密切的種。

生物固氮菌通過固氮酶及其他相關基因的作用下,將大氣中的氮氣轉變成生物可利用的銨根離子(NH4+),使其在氮元素的地球化學循環和農業生產上具有重要應用價值[33]。雖然生物固氮菌廣泛分布于原核生物界,但是主要零星地分布于變形菌門(Proteobacteria)、厚壁菌門(Firmicutes)、藍藻門(Cyanobacteria)、放線菌門(Actinobacteria)、綠藻門(Chlorobi)、廣古菌門(Euryarchaeota)等[34-35]。同樣,本研究涉及的5株固氮斯氏假單胞菌也是呈零散狀分布于該種的譜系進化樹分支中。核心基因進化樹分析顯示,在進化時間上,非固氮斯氏假單胞菌(MF28、28a24、SDM-LAC、DSM10701和TS44)的起源早于固氮斯氏假單胞菌(A1501、B1SMN1、DSM 4166、KOS6和NF13),因此推測斯氏假單胞菌的祖先不具有固氮基因島,而是在后來進化的過程中才獲得了固氮基因島[36]。5株固氮斯氏假單胞菌的固氮基因島組成相似,蛋白質編碼基因序列相似度高,并且它們在nifHDK基因進化樹和該種譜系進化樹中的位置關系高度一致[37],表明固氮基因島很可能通過垂直遺傳傳遞給子代,同時,ATCC1788、T13、XLDN-R、ATCC1405和CCUG29243在長期的進化過程中丟失了固氮基因島[36]。另外,固氮基因島的GC含量明顯高于其基因組的平均GC含量,因此推測斯氏假單胞菌固氮基因島通過近期水平基因轉移獲得。綜上所述,在斯氏假單胞菌中,固氮基因島的發生與轉移是一個相當復雜的過程。

參考文獻:

[1]Sikorski J,Mhle M,Wackernagel W. Identification of complex composition,strong strain diversity and directional selection in local Pseudomonas stutzeri populations from marine sediment and soils[J]. Environmental Microbiology,2002,4(8):465-476.

[2]Scotta C,Mulet M,Sanchez D,et al. Identification and genomovar assignation of clinical strains of Pseudomonas stutzeri[J]. European Journal of Clinical Microbiology & Infectious Diseases,2012,31(9):2133-2139.

[3]Lalucat J,Bennasar A,Bosch R,et al. Biology of Pseudomonas stutzeri[J]. Microbiology and Molecular Biology Reviews,2006,70(2):510-547.

[4]Desnoues N,Lin M,Guo X W,et al. Nitrogen fixation genetics and regulation in a Pseudomonas stutzeri strain associated with rice[J]. Microbiology-SGM,2003,149(8):2251-2262.

[5]Moscoso F,Deive F J,Longo M A,et al. Insights into polyaromatic hydrocarbon biodegradation by Pseudomonas stutzeri CECT 930:operation at bioreactor scale and metabolic pathways[J]. International Journal of Environmental Science and Technology,2015,12(4):1243-1252.

[6]Li X Y,Gong J,Hu Y,et al. Genome sequence of the moderately halotolerant,arsenite-oxidizing bacterium Pseudomonas stutzeri TS44[J]. Journal of Bacteriology,2012,194(16):4473-4474.

[7]Busquets A,Pen″a A,Gomila M,et al. Genome sequence of pseudomonas stutzeri strain JM300 (DSM 10701),a soil isolate and model organism for natural transformation[J]. Journal of Bacteriology,2012,194(19):5477-5478.

[8]Sikorski J,Teschner N,Wackernagel A W. Highly different levels of natural transformation are associated with genomic subgroups within a local population of Pseudomonas stutzeri from soil[J]. Applied and Environmental Microbiology,2002,68(2):865-873.

[9]Rius N,Fuste M C,Guasp C,et al. Clonal population structure of Pseudomonas stutzeri,a species with exceptional genetic diversity[J]. Journal of Bacteriology,2001,183(2):736-744.

[10]Cladera A M,Bennasar A M,Lalucat J,et al. Comparative genetic diversity of Pseudomonas stutzeri genomovars,clonal structure,and phylogeny of the species[J]. Journal of Bacteriology,2004,186(16):5239-5248.

[11]Mulet M,Gomila M,Gruffaz C A,et al. Phylogenetic analysis and siderotyping as useful tools in the taxonomy of Pseudomonas stutzeri:description of a novel genomovar[J]. International Journal of Systematic and Evolutionary Microbiology,2008,58(10):2309-2315.

[12]Chen M,Yan Y L,Zhang W,et al. Complete genome sequence of the type strain Pseudomonas stutzeri CGMCC 1.1803[J]. Journal of Bacteriology,2011,193(21):6095.

[13]Yan Y L,Yang J,Dou Y E,et al. Nitrogen fixation island and rhizosphere competence traits in the genome of root-associated Pseudomonas stutzeri A1501[J]. Proceedings of the National Academy of Sciences of the United States of America,2008,105(21):7564-7569.

[14]Pena A,Busquets A,Gomila M,et al. Draft genome of Pseudomonas stutzeri strain ZoBell (CCUG 16156),a marine isolate and model organism for denitrification studies[J]. Journal of Bacteriology,2012,194(5):1277-1278.

[15]Pea A,Busquets A,Gomila M,et al. Draft genome of Pseudomonas stutzeri strain NF13,a nitrogen fixer isolated from the Galapagos rift hydrothermal vent[J]. Genome Announcements,2013,1(2):e00113.

[16]Busquets A,Pea A,Gomila M,et al. Draft genome sequence of Pseudomonas stutzeri strain B1SMN1,a nitrogen-fixing and naphthalene-degrading strain isolated from wastewater[J]. Genome Announcement,2013,1(4):e00584.

[17]Grigoryeva T V,Laikov A V,Naumova R P,et al. Draft genome of the nitrogen-fixing bacterium Pseudomonas stutzeri strain KOS6 isolated from industrial hydrocarbon sludge[J]. Genome Announc,2013,1(1):e00072.

[18]Yu H Y,Yuan M L,Lu W,et al. Complete genome sequence of the nitrogen-fixing and rhizosphere-associated bacterium Pseudomonas stutzeri strain DSM4166[J]. Journal of Bacteriology,2011,193(13):3422-3423.

[19]Zhao Y,Wu J,Yang J,et al. PGAP:pan-genomes analysis pipeline[J]. Bioinformatics,2012,28(3):416-418.

[20]Tamura K,Peterson D,Peterson N,et al. MEGA5:molecular evolutionary genetics analysis using maximum likelihood,evolutionary distance,and maximum parsimony methods[J]. Molecular Biology and Evolution,2011,28(10):2731-2739.

[21]Konstantinidis T K,Tiedje J M. Genomic insights that advance the species definition for prokaryotes[J]. Proceedings of the National Academy of Sciences of the United States of America,2005,102(7):2567-2572.

[22]Kurtz S,Phillippy A,Delcher A L,et al. Versatile and open software for comparing large genomes[J]. Genome Biology,2004,5(2):R12.

[23]Grant J R,Arantes A S,Stothard P. Comparing thousands of circular genomes using the CGView Comparison Tool[J]. BMC Genomics,2012(13):202.

[24]Darling,A C E,Mau B,Blattner F R,et al. Mauve:multiple alignment of conserved genomic sequence with rearrangements[J]. Genome Research,2004,14(7):1394-1403.

[25]Vernikos G,Medini D,Riley D R,et al. Ten years of pan-genome analyses[J]. Current Opinion in Microbiology,2015,23:148-154.

[26]Li X Y,Hu Y,Gong J,et al. Comparative genome characterization of Achromobacter members reveals potential genetic determinants facilitating the adaptation to a pathogenic lifestyle[J]. Applied Microbiology and Biotechnology,2013,97(14):6413-6425.

[27]Richter M,Rosselló-Móra R. Shifting the genomic gold standard for the prokaryotic species definition[J]. Proceedings of the National Academy of Sciences of the United States of America,2009,106(45):19126-19131.

[28]Zhang F,She Y H,Banat I M,et al. Genomovar assignment of Pseudomonas stutzeri populations inhabiting produced oil reservoirs[J]. MicrobiologyOpen,2014,3(4):446-456.

[29]Rossello R,Garcia-Valdes E,Lalucat J,et al. Genotypic and phenotypic diversity of Pseudomonas stutzeri[J]. Systematic and Applied Microbiology,1991,14(2):150-157.

[30]Scotta C,Gomila M,Mulet M,et al. Whole-Cell MALDI-TOF mass spectrometry and multilocus sequence analysis in the discrimination of Pseudomonas stutzeri populations:three novel genomovars[J]. Microbial Ecology,2013,66(3):522-532.

[31]Sikorski J,Lalucat J,Wackernagel W. Genomovars 11 to 18 of Pseudomonas stutzeri,identified among isolates from soil and marine sediment[J]. International Journal of Systematic and Evolutionary Microbiology,2005,55(5):1767-1770.

[32]Bennasar A,Rossellómora R,Lalucat J,et al. 16S rRNA gene sequence analysis relative to genomovars of Pseudomonas stutzeri and proposal of Pseudomonas balearica sp. nov.[J]. International Journal of Systematic Bacteriology,1996,46(1):200-205.

[33]Canfield D E,Glazer A N,Falkowski P G. The evolution and future of earths nitrogen cycle[J]. Science,2010,330(6001):192-196.

[34]Santos P C D,Zhong F,Mason S W,et al. Distribution of nitrogen fixation and nitrogenase-like sequences amongst microbial genomes[J]. BMC Genomics,2012,13(1):162.

[35]Gaby J C,Buckley D H. A global census of nitrogenase diversity[J]. Environmental Microbiology,2011,13(7):1790-1799.

[36]Xie J B,Du Z L,Bai L Q,et al. Comparative genomic analysis of N2-fixing and non-N2-fixing Paenibacillus spp.:organization,evolution and expression of the nitrogen fixation genes[J]. PLoS Genetics,2014,10(3):119-123.

[37]Hartmann L S,Barnum S R. Inferring the evolutionary history of Mo-dependent nitrogen fixation from phylogenetic studies of nifK and nifDK[J]. Journal of Molecular Evolution,2010,71(1):70-85.王 婧. 荷花MADS-box基因的克隆及表達分析[J]. 江蘇農業科學,2017,45(1):39-42.

猜你喜歡
多樣性
淺析阿拉伯語初級階段聽力教學材料的選擇
利用網絡教學多樣性 開展有效教學
海洋微生物次生代謝的生物合成機制
舞蹈表演的表現形式多樣性研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合