?

基于大數據的微生物高通量測序

2022-05-09 03:13章玉鮮申鐵
華東科技 2022年4期
關鍵詞:填埋場高通量測序

文/章玉鮮,申鐵*

(貴州省信息與計算科學重點實驗室,貴州貴陽 550001)

1.實驗部分

1.1 Illumina Novaseq 6000高通量測序

隨著生物信息學科的興起,高通量測序成為大數據分析方式中高效的分析測序方法,有利于相關部門高效快捷地得到所需數據。例如,我們將采集的樣品送往青島市百邁客生物測序公司進行Illumina Novaseq 6000高通量測序,具體操作如下:首先將樣品進行DNA提取,按照實驗設計獲得相應的引物,并且在引物的最后位置加上所需要的測序接頭,在對引物進行PCR擴增后進行提純檢驗和使用量的定值設置,進而形成最終的測序文庫。測序文庫也要經過質量檢查才能進行最終的測序。

1.2 大數據結合下的生物數據

伴隨著高通量技術發展而產生的海量多元組學數據,為生物信息學的快速發展提供了豐富的數據資源。實驗基于大數據分析,基于binary jaccard、bray curtis、(un)weighted unifrac(限細菌)多種算法展示測序物種的多樣性并形成可視化的矩陣。分析主坐標并進行可視化展現,以及受到哪些環境因子影響、與該樣本中的組成間相關性如何等的分析算法,使用的都是排序分析。

1.3 信息分析

我們首先通過原始數據處理與樣品序列統計對16S rDNA高變區序列測序,測序區域為v3+v4_b區;對測序得到的Raw Reads進行過濾,目的是實現所得引物的序列可以被識別到。根據實驗需求,我們隊引物的序列進行了篩選,這一步是為了獲得Clean Reads,即沒有引物后的序列。接下來,我們用overlap方法拼接對每一個測序樣本的Clean Reads,同時選擇測序樣本中所需要的長度進行相應的篩選,在去除嵌合體序列后得到有效數據。我們利用有效數據就可以應用相應軟件進行數據的計算和分析了,例如對樣本的多樣性進行分析、對不同樣本間的差異進行分析、對各個樣本間的相關性與差異性進行分析等。最后,我們根據所獲得的Reads讀數,在97.0%的相似度下進行物種的聚類,從而得到OTU值,進一步進行獲得想要的多樣性測序。

2.結果與討論

2.1 OTU分析

大數據數據庫的選擇可以對生物序列分析起到直觀、精確的作用。Venn圖的作用是:一方面可以展示測序樣本自身特殊的特征數目,另一方面能直觀地展示各個樣本間相同特征的重疊部分,如圖1所示。

大數據可視化將生物數據以三維方式呈現,將復雜的數字可視化,利用相關軟件呈現物種豐度,從而更直觀地展現物種的不同程度。由圖1可以看出,A組總的特征個數>B組的特征個數>C組的特征個數,垃圾填埋場中的土壤微生物特征含量大于普通土壤微生物特征含量。A、B、C三組之間共有的OTUs個數達到了1442個,A組特有的OTUs個數最高,有104個;C組特有的OTUs個數最少,只有59個。結果說明,在垃圾填埋場土壤中的微生物OTUs高于校園里土壤中微生物OTUs的含量。從A組組間分析可以看出:A1、A2、A3共有的OTU數是1269個,A3特有的OTU含量最高,達到了172個;B組組間共有的OTU數為1524個,其中B1特有的OTU最高,108個;C組組間共有的OTU特征數是1338個,其中C2特有的OTU最高,109個。結果表明,生活垃圾中所含有的物質對周圍土壤生物多樣性有促進作用。同時,這也體現出生物信息學作為新型交叉學科,能夠利用大數據分析來提高研究效率。

2.2 物種分布圖

如何從已有的生物數據中有效獲取到信息,需要利用數據挖掘工具。數據挖掘工具是基于大數據中存在的海量資源,獲取所需的實驗數據。由圖2可知,各土壤樣品中包含最多的微生物是變形菌門(Proteobacteria),其 次 是酸桿菌門(Acidobacteria);相對于B組和C組,A組擬桿菌(Bacteroidetes)高于B組和C組土壤樣品中的擬桿菌。擬桿菌具有纖維素降解和發酵產酸的能力,在垃圾填埋場中占據絕對優勢,對垃圾降解能起到非常大的作用。大多數擬桿菌存在于人體中,其可能的原因是:垃圾填埋場大多數是生活垃圾,經過垃圾滲濾液長期侵蝕,造成伴生土壤中的擬桿菌數量高于其他土壤。己科河菌門(Rokubacteria)、匿桿菌門(Latescibacteria)、硝 化 螺旋菌門(Nitrospirae)在A組中幾乎不存在,但在B組中的比例相對來說是最大的,這與賀曉凌等人的研究結果一致。其原因可能是:A組的伴生土壤已經有5年以上,其中的垃圾差不多已經被降解,土壤中的N03--N、NH4+-N的濃度受垃圾滲濾液的影響效果不大;而B組土壤距垃圾填埋場只有約50米遠,垃圾滲濾液經過地下徑流仍然對周圍土壤中的微生物多樣性產生了影響。例如在參與亞硝酸鹽氧化的過程中,由于是異養菌群,己科河菌門通過醋酸或脂肪酸的降解來獲取能量。垃圾填埋場中大多數是生活垃圾(包括廚余垃圾),在發酵過程中會產生大量的乳酸;其余生活垃圾厭氧發酵也會產生一些腐殖酸;擬桿菌門發酵膳食纖維產生丁酸、丙酸和乙酸這些短鏈脂肪酸,且大多數來源于人體中,所以在A組、B組中的含量明顯高于C組。酸桿菌門適合在pH濃度較低的環境中生長,C組土壤雖然是山上的,但是經常有人在上面活動,動物產生的糞便也在一定程度上影響了土壤性質。

2.3 Alpha多樣性指數分析

伴隨著生物信息大數據的發展,在生物信息學作為多學科交融的歷程中,生物學數據多樣性分析和數據可視化在生物信息學中急速發展。以Alpha多樣性(Alpha diversity)為例,它可以呈現每一個樣品的物種豐富程度和該物種的各個數值的多樣性情況,如表1所示。

由表1可知樣品的有效序列數。另外,計算機科學與技術也在生物信息學中起著至關重要的作用,例如數據公示的計算和可視化。比較各樣品ACE值和Chao1值,得到的結果是樣品B>樣品A>樣品C,物種豐富度總體表現為:靠近垃圾填埋的地方,土壤的微生物多樣性要高于距離垃圾填埋較遠的土壤中的微生物多樣性。公式為:

表1 Alpha多樣性指數統計

[其中,H=樣品的信息含量(彼得/個體)=群落的多樣性指數;S代表在這個群落中物種的豐富度值,即物種有多少類型;pi代表物種i的相對豐度值;x一般取2或e]。如果是完全均勻的群落(上式中,pi=1/s),Shannon指數的值能達到最大。

3.結語

生物數據分析依賴于大數據平臺的發展?;贗llumina Novaseq6000高通量測序平臺對采集樣品測序顯示,物種豐富度總體表現為:靠近垃圾填埋的地方,土壤的微生物多樣性要高于距離垃圾填埋較遠的土壤中的微生物多樣性,垃圾滲濾液通過地表徑流對土壤微生物多樣性產生直接影響。各土壤樣品中包含最多的微生物是變形菌門,其次是酸桿菌門。FCPU426、纖維桿菌門(Fibrobacteres)、藍 細 菌(Cyanobacteria)和BRC1是A組伴生土壤中獨有的優勢細菌。B1中含量較突出的新型細菌門植物鈣化物(Calditrichaeota)能為垃圾填埋場滲濾液對土壤微生物多樣性研究提供有力支持。

猜你喜歡
填埋場高通量測序
兩種高通量測序平臺應用于不同SARS-CoV-2變異株的對比研究
高通量衛星服務專用網絡的應用模式探索
新一代高通量二代測序技術診斷耐藥結核病的臨床意義
安徽安慶某飛灰填埋場邊坡工程地質特征與穩定性評價
生物測序走在前
外顯子組測序助力產前診斷胎兒骨骼發育不良
高通量血液透析臨床研究進展
比較高通量血液透析與血液透析濾過在尿毒癥患者中的應用效果
How To Sort The Trash Around Us
龐大垃圾填埋場提前25年被填滿
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合