?

納米孔測序技術在微生物基因組學研究中的應用

2021-04-17 23:25王東帥師丹陽
解放軍預防醫學雜志 2021年1期
關鍵詞:基因組學堿基基因組

王東帥, 師丹陽, 金 敏

(軍事科學院軍事醫學研究院環境醫學與作業醫學研究所,天津市環境與食品安全風險監控技術重點實驗室,天津,300050)

自從17世紀Leeuwenhoek使用自制顯微鏡發現微生物以來,經過幾個世紀的研究,已經發現了八大類幾萬種微生物。傳統微生物研究方法以分離培養純菌為主,但99%以上〔1〕的原核微生物因培養技術有限而無法得到。20世紀90年代后期興起的微生物基因組學研究,從對微生物完整的全基因核苷酸測序入手,在分析基因結構的基礎上,認識微生物的完整生物學功能。使用微生物基因組學研究方法,將從本質上揭示和分析大量迄今未被認識的微生物新的基因,以及它們所編碼的具有新功能的蛋白質和新的基因調控元件,從而進一步研究微生物相互之間、微生物與環境之間的關系。 微生物基因組學提供了一種新的微生物研究方法,但傳統的一、二代測序技術對微生物完整的全基因核苷酸測序方面存在較多缺陷,第三代測序技術因其超長測序讀長、直接測序、快速測序等特點,推動了微生物基因組學發展。

1 納米孔測序技術簡介

1.1 測序技術的發展1953年,Watson、Crick發現了DNA雙螺旋結構,人類對于遺傳信息的研究深入到分子層面,為探究隱藏在基因內部的生物學信息,基因測序技術飛速發展。以Sanger雙鏈終止法〔2〕為代表的第一代測序技術,開創了生命科學研究中的基因組學時代。雖然第一代測序技術優點明顯(精度達99.999%、讀長達1000-1500bp),但其高成本和低通量限制了其大規模應用。21世紀初,以瑞士羅氏(Roche)的454〔3〕、美國應用生物系統(ABI)的SOLID〔4〕和美國因美納(Illumina)的Solexa、Hiseq〔5〕等測序儀器為代表的第二代測序技術(Next-Generation Sequencing Technology,NGS)大幅壓縮了測序成本和測序時間,使得基因測序成功進入高通量測序時代。但是第二代測序技術存在著儀器昂貴、讀長短(250-300bp)、PCR擴增易引入錯配堿基等缺點,無法滿足人們對于全基因組測序的需求。第三代測序技術以單分子測序為特點,完美解決了上述問題,其代表有美國太平洋生物科學(PacBio)的SMRT(Single-molecule Real-time sequencing)技術和英國牛津納米孔(ONT)的Nanopore技術。相對于前兩代測序技術,第三代測序技術具有高效、高通量、長讀長等特點,被認為是測序技術的發展方向〔6〕,促進了微生物基因組學的研究發展。

1.2 納米孔測序技術原理納米孔測序技術的本質是利用電信號進行測序〔7〕。在一層高電阻率的薄膜上鑲嵌大量蛋白質構成的納米孔(nanopore),薄膜兩側浸沒于離子溶液中,在膜兩側電壓作用下,離子通過納米孔從一側移動到另一側產生電流。對核酸分子測序時,薄膜上的接頭將待測序核酸分子引入馬達蛋白,馬達蛋白具有解螺旋和限制核酸分子通過速度兩種功能,并能與納米孔的通道蛋白結合,待測核酸分子解鏈形成單鏈分子穿過納米孔。由于四種堿基的空間構象不同,通過納米孔時會產生不同的離子流波動,通過分析離子流波動峰值就能判斷出對應的堿基,實現高速實時測序。

1.3 納米孔測序技術特點納米孔測序技術是根據待測核酸分子通過納米孔引起的電流信號波動而進行測序,因此原則上其測序長度沒有限制〔8〕,最新文獻記載的最大讀長達到了2.2M〔9〕,為全基因組測序提供了可能。同時,納米孔測序可以直接對DNA或RNA進行測序〔10, 11〕,無需對樣品進行PCR擴增或逆轉錄,不僅節約了操作時間,也降低了測序成本。此外,納米孔測序設備簡單,ONT開發的MinION測序儀重量不足100g,僅需連接電腦就能開始測序工作,且測序文庫簡單易制備,具有極佳的便攜性,可在極地〔12〕、叢林〔13〕、海洋〔14〕甚至太空〔15〕等各種地點完成實時測序,使研究工作不再局限于傳統實驗室。然而納米孔測序也存在總體測序錯誤率高的缺點(約為11%〔16〕),主要是由插入和刪除堿基引起,但其測序錯誤隨機發生,可通過增加覆蓋度來降低錯誤率,經糾正后的測序正確率可達99.8%〔8〕。

2 納米孔測序技術在微生物基因組學研究中的應用

2.1 環境微生物種群分布的快速識別在微生物組學研究中發現,已有參考基因組的微生物數量遠低于自然界存在的微生物數量,這是因為過去的微生物研究方法多依賴于單菌種純化培養,2006年Sabet等〔17〕在北美的Mono湖中發現大量無法培養的微生物,揭示出以往微生物研究存在著盲區。納米孔測序無需對微生物進行培養,可對環境中所有微生物的全基因組進行測序,為微生物研究開辟了新的路徑。Nicholls等〔18〕針對納米孔測序技術制定出了微生物菌群標準數據集,能通過比對樣本環境的測序結果,實現特定環境微生物種群分布的快速識別。利用此項技術,Hamner等〔19〕對美國蒙大拿州一條河流中的微生物病原體進行了快速檢測,該研究結果展示了納米孔測序技術未來應用于公共衛生監測的廣闊前景。

2.2 微生物種屬的精準鑒定16S和18S rRNA基因分別存在于所有原核和真核生物的基因組中,16S/18S rRNA基因是目前研究微生物系統發育和分類鑒定的最常用的分子標記〔20〕,其高變區能反映出微生物間的進化差異,對16S/18S rRNA分析就能實現不同微生物種屬的分類鑒定。傳統二代測序因讀長短,往往只能獲得1-2段高變區域,納米孔測序技術的長讀長能實現高變區域的全長測序,實現混合微生物群落中微生物種屬的精確鑒定。Moon等〔21〕將納米孔16S擴增子測序應用于臨床診療中,從細菌性腦膜炎患者腦脊液中快速鑒定出了細菌種類,針對性應用抗生素,提高了治療效果。Kai等〔22〕利用16S rRNA基因分析的測序方法,構建出一套臨床致病微生物快速檢測流程,提高了臨床檢測效率。此外,納米孔測序技術還能對RNA病毒直接測序,無需進行逆轉錄,Wongsurawat等〔10〕建立了一種RNA直接測序方案,能同時檢測多種RNA病毒。Kafetzopoulou等〔23〕利用納米孔測序技術,在2018年尼日利亞爆發的拉薩熱中快速識別了致病病毒分型,有效指導了疫情的處置。納米孔測序技術的微生物種屬鑒定簡單易操作,未來檢測技術會因此發生質的飛躍。

2.3 微生物遺傳信息功能區的定位解析要深入研究微生物遺傳信息不同區域的功能,就必須完整表征出微生物的基因組。研究表明〔24〕,微生物基因組中的高重復區域和高GC區域對于理解其基因組功能至關重要,但傳統二代測序讀長短,組裝后基因組中常存在很多缺口。納米孔測序技術的長讀長能實現基因組的無偏倚組裝〔8〕,從而更好地分析微生物遺傳信息各區域的不同功能。Somerville等〔25〕發現,僅使用短讀長的Illumina法進行基因組組裝時容易遺漏較多區域,而具有長讀長特點的第三代測序技術能有效覆蓋遺漏區域。利用納米孔測序的長讀長序列組裝和二代測序技術的短讀長序列糾錯,既能保證基因序列的完整性,又能保證其準確性,為深入研究微生物遺傳信息不同區域的功能創造了條件。Moss等〔26〕開發的Lathe測序流程,結合了長讀組裝和短讀糾錯功能,在混合菌群實驗和人類糞便實驗中均較好的實現了細菌基因組組裝,可研究基因組中重復區域在微生物功能中的作用。

2.4 微生物基因組轉錄本的功能探究轉錄組學是在RNA水平上研究基因表達的情況,是研究細胞表型和功能的重要手段。納米孔測序技術的長讀長能夠對全長RNA轉錄本進行直接測序,既減少了測序時間,也提高了測序準確率,有助于微生物群落的基因表達研究。Jenjaroenpun等〔27〕對RNA直接測序,對包括非翻譯區(UTR)在內的RNA全長轉錄本進行了測序,還鑒定了許多聚腺苷酸化非編碼RNA,包括rRNA、端粒酶RNA和長鏈非編碼RNA,為深入研究微生物轉錄本提供了方法。Bolisetty等〔28〕發現納米孔測序技術能克服外顯子距離過大時短讀長出現的連接性問題,可以對選擇性剪接轉錄本實現精確解析,全長比對的平均一致性達到了90%以上。Zhang等〔29〕依據環狀RNA與線性mRNA相似性特點,使用納米孔測序技術開發出了CIRI-long方法,通過確定一種能夠表現出特殊的剪接和表達模式的新型內含子自連接環狀RNA,實現了無偏倚的重建全長環狀RNA序列,為研究轉錄本的功能開創了新的途徑。隨著轉錄本研究的不斷深入,RNA直接測序將會成為未來“完整基因組時代”轉錄組分析的一項多功能工具。

2.5 微生物基因組修飾堿基的識別分析幾乎所有微生物基因組都涉及堿基修飾,研究微生物基因組的修飾堿基對于深入了解微生物遺傳信息有著重要意義,修飾堿基能通過影響基因表達來影響表觀遺傳信息。傳統測序技術的測序過程需要進行核酸擴增,進而會刪除堿基修飾,納米孔測序不需要擴增或鏈合成,可以直接檢測到單個堿基修飾,為修飾堿基的功能檢測提供了條件。Rand等〔30〕利用納米孔測序技術繪制出了胞嘧啶和腺嘌呤的甲基化圖譜框架,能夠有效定位出微生物堿基修飾中的甲基化位點。Simpson等〔11〕通過MinION量化了DNA堿基修飾的電流信號強度,實現了5-甲基胞嘧啶(5-mC)的快速檢測。Tourancheau等〔31〕集合了大量細菌數據構建出了微生物甲基化檢測標準數據集,能夠對微生物基因組甲基化快速鑒定,為研究微生物基因組修飾堿基的功能提供了條件。

3 未來的展望

近年來,微生物基因組學研究成為生命科學研究的一個熱點,而對微生物基因組學的深入研究和認識得益于測序技術的快速發展。納米孔測序技術的出現實現了很多技術上的突破:(1)全基因組測序無需對微生物進行純化和培養,使微生物種群分布檢測更加簡單、全面;(2)直接的RNA測序,不僅能快速實現RNA病毒的檢測,也可以依托16S/18S rRNA靶向測序實現微生物種屬快速鑒定;(3)直接RNA測序還能實現微生物轉錄本直接測序研究,為研究微生物基因表達開辟了新途徑;(4)超長讀長使微生物基因檢測更加連貫,更容易發現微生物遺傳信息序列中的功能區,為基因組功能區的定位和解析創造條件;(5)全長測序可以避免核酸擴增,能夠直接對基因組堿基修飾進行測序分析,為表觀遺傳學研究提供了方法。

然而,納米孔測序仍然存在一些局限性,如堿基錯誤率高和生物信息軟件不足等。雖然納米孔測序的錯誤率很高,但是通過增加覆蓋度(30X或更高)能夠明顯降低錯誤率,糾正后錯誤率由11%〔16〕可降至0.2%以下〔8〕。此外,納米孔測序技術常與傳統的第二代測序技術結合使用,即利用納米孔測序讀全,利用第二代測序校準,提高測序準確性。另一個重要限制因素是生物信息軟件不夠豐富,納米孔測序數據的計算需要大量的數據存儲和計算成本。近年來,大量新技術應用到測序數據分析中來,新的下游校正軟件、變量調節軟件、可視化工具等,都有效提高了數據處理能力〔32〕,進一步提高了測序的準確性〔33〕。

相信在不久的將來,納米孔測序技術的應用范圍和應用規模會越來越大,基于納米孔測序技術的微生物基因組學研究能夠獲得更高質量的基因測序結果,進而促進人們對生命科學的進一步了解,推動公共衛生和醫學領域的全面發展。

猜你喜歡
基因組學堿基基因組
牛參考基因組中發現被忽視基因
基于基因組學數據分析構建腎上腺皮質癌預后模型
應用思維進階構建模型 例談培養學生創造性思維
系統基因組學解碼反芻動物的演化
中國科學家創建出新型糖基化酶堿基編輯器
生命“字母表”迎來4名新成員
生命“字母表”迎來4名新成員
營養基因組學——我們可以吃得更健康
基因組DNA甲基化及組蛋白甲基化
有趣的植物基因組
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合