?

核線粒體DNA對線粒體DNA二代測序數據分析的影響

2022-08-17 02:13蘇麗萍郭姍姍陳雅婧朱盈霏邢金良郭海濤
空軍軍醫大學學報 2022年3期
關鍵詞:線粒體測序基因組

蘇麗萍,郭姍姍,劉 洋,陳雅婧, 朱盈霏, 邢金良,郭 旭,郭海濤

(空軍軍醫大學基礎醫學院: 1生理與病理生理學教研室, 2學員二大隊,陜西 西安 710032)

人的線粒體DNA(mitochondrial DNA,mtDNA)是由16 569個堿基組成的雙鏈環狀閉合DNA[1]。mtDNA包括37個基因,分別負責編碼13種蛋白質、22種tRNA和2種rRNA,具有多態性程度高、拷貝數多、母系遺傳等特點[2]。mtDNA變異包括遺傳性突變和體細胞突變。研究報道線粒體的遺傳性突變與癌癥發生發展相關,如mtDNA單倍群與腸癌等癌癥的發生有關[3-4]。mtDNA體細胞突變參與多種疾病和衰老的發生和進展[5-6]。此外,與核基因組的兩個拷貝相比,線粒體基因組在細胞中以多個拷貝的形式存在。研究表明mtDNA的拷貝數異常變化與多種癌癥的發生相關聯[7]。近年來,DNA的片段分布規律在癌癥研究中受到廣泛關注[8-9]。因此,準確定量和定性分析mtDNA的變異、拷貝數和DNA片段分布對后續研究結果的準確性具有重大意義。

遺傳物質從線粒體轉移到細胞核并將其整合到核基因組的過程中,mtDNA片段被合并為非編碼序列,這樣的片段稱為核線粒體DNA(nuclear mitochondrial DNA,NUMT)[10-11]。NUMT片段是線粒體基因向核基因組轉移造成的,在這些核基因組上與mtDNA高度相似的DNA片段容易被通用mtDNA引物擴增出來,并被錯誤地當成mtDNA進行后續分析。顯而易見NUMT的存在給mtDNA的研究帶來潛在的影響[12]。目前,mtDNA檢測最常見的方法是二代測序。在mtDNA二代測序分析過程中主要通過比對的方法來減少NUMT的影響。而比對的方法主要是將測序reads同時與線粒體參考基因組和核參考基因組進行比對,比對到核基因組的reads可能是NUMT,并在后續分析過程中過濾掉這些reads[13-14]。本研究根據該方法得到不包含NUMT的測序數據。目前尚無研究表明NUMT在mtDNA二代測序數據中的影響。因此,本研究旨在從mtDNA的變異、拷貝數、單倍群和片段分布的角度來研究NUMT對于mtDNA二代測序分析的影響,減少mtDNA二代測序數據分析過程中因NUMT的影響導致的誤差。

1 材料與方法

1.1 材料

本研究對2020年8月至2020年12月從空軍軍醫大學西京醫院收集的20例卵巢癌組織樣本進行mtDNA捕獲測序,并通過空軍軍醫大學倫理委員會批準(許可證號:KY20193029),且已獲得每位患者的書面同意。

1.2 方法

1.2.1 mtDNA的靶向捕獲測序 對20例卵巢癌組織樣本進行全基因組DNA提取、文庫構建、mtDNA的靶向捕獲及測序,具體過程見已報道的研究[15]。捕獲后的DNA產物在Illumina HiSeq X Ten平臺上進行雙端150 bp(PE150)測序。

1.2.2 mtDNA突變分析 使用fastp 0.20.0軟件去除原始測序reads中低質量reads(質量分數<30)以及接頭序列。接著,使用Burrows-Wheeler-Alignment 0.7.17-r1188軟件將reads比對到參考基因組上,獲取每個reads在基因組的位置信息。采用Picard 1.81軟件將比對結果進行排序和去重。由于mtDNA的插入缺失會導致比對錯誤,故用GATK 3.2-2軟件進行局部重比對。隨后,統計mtDNA 16 569個堿基的主、次要等位堿基位于正反義鏈的reads數,計算每個位點的突變頻率,根據一系列的過濾條件進行過濾,獲得mtDNA突變結果。過濾條件是:①突變頻率≥1%;②不考慮錯配數>3的reads;③位點深度≥100;④正反義鏈上突變的reads數同時≥3;⑤不考慮重復區域(66~71,303~311,514~523,12 418~12 425,16 184~16 193)上的突變位點。根據上述步驟最終獲得mtDNA突變結果[16]。

1.2.3 mtDNA拷貝數分析 為了計算mtDNA的拷貝數,根據文獻[17]方法進行mtDNA拷貝數的計算,其計算公式為:mtDNA拷貝數=(mtDNA的平均測序深度×2)/核基因組DNA的平均測序深度。

本研究對mtDNA采用的測序方法是mtDNA的捕獲測序而不是全基因組測序,而已有研究應用6個核基因組區域的平均測序深度代表整個核基因組DNA的平均測序深度[17]。故本研究在計算mtDNA拷貝數的過程中,應用6個核基因組區域的平均測序深度來表示核基因組DNA的平均測序深度。

1.2.4 mtDNA單倍群分析 本研究利用mitotool 1.1.2工具[18]對20例卵巢癌組織樣本的測序數據進行單倍群分析。使用的PhyloTree版本為17[19]。

1.2.5 計算mtDNA片段數目 使用Picard 1.81軟件中的CollectInsertSizeMetrics.jar程序計算每個樣本中各個mtDNA片段大小的數目。將20例卵巢癌組織樣本在各個mtDNA片段大小的數目取平均值,得到平均mtDNA片段數目。

1.2.6 包含和不包含NUMT測序數據的獲取 NUMT序列因與mtDNA的相似性,采用只比對到線粒體參考基因組的比對方法,NUMT容易被錯誤地當成mtDNA比對到線粒體基因組。因此,包含NUMT的測序數據是在比對的過程中僅將reads比對到修訂的劍橋參考序列上,而不包含NUMT的測序數據(指在比對過程中將reads同時比對到核基因組hg19和線粒體基因組修訂的劍橋參考序列上),通過過濾比對到核參考基因組的reads減少了NUMT的影響。根據這兩種不同的比對方式分別獲得包含和不包含NUMT的測序數據。

1.2.7 統計學分析 使用GraphPad Prism 8.0軟件進行統計學分析。使用配對t檢驗對具有連續變量的兩組之間進行比較,P<0.05表示差異有統計學意義。

2 結果

2.1 NUMT影響mtDNA的測序深度

為了研究NUMT對mtDNA測序數據平均測序深度的影響,本研究對20例卵巢癌組織樣本mtDNA捕獲測序數據進行分析,結果發現,包含NUMT的卵巢癌組織樣本測序數據mtDNA的平均測序深度顯著高于不包含NUMT的測序數據(P<0.01,圖1)。該結果說明NUMT增加mtDNA的測序深度,其可能影響mtDNA測序數據的下一步分析。

bP < 0.01 vs不包含NUMT。圖1 包含NUMT和不包含NUMT測序數據的mtDNA測序深度比較

2.2 NUMT對線粒體變異位點檢測影響小

上述分析發現NUMT顯著增加mtDNA測序數據的測序深度,為了進一步探究NUMT是否會影響mtDNA變異位點,本研究通過對20例卵巢癌組織樣本mtDNA捕獲測序數據進行分析,發現包含NUMT的測序數據與不包含NUMT的測序數據之間,mtDNA變異位點數量無顯著性差異(P> 0.05,圖2A),兩種測序數據同時檢測到的變異位點頻率無顯著性差異(P> 0.05,圖2B)。該結果說明NUMT對mtDNA的變異位點影響較小。

圖2 包含NUMT和不包含NUMT測序數據的mtDNA變異數量(A)及頻率(B)比較

2.3 NUMT影響mtDNA拷貝數分析

為了進一步研究NUMT是否對mtDNA拷貝數產生影響,本研究對20例卵巢癌組織樣本mtDNA捕獲測序數據進行分析,結果發現,與不包含NUMT的樣本相比,包含NUMT的測序數據的mtDNA拷貝數顯著增高(P<0.05,圖3)。這說明了NUMT的存在影響二代測序數據中mtDNA拷貝數的計算。

aP<0.05 vs不包含NUMT。圖3 包含NUMT和不包含NUMT測序數據的mtDNA拷貝數比較

2.4 NUMT對線粒體單倍群分析影響小

mtDNA的單倍群分析是mtDNA二代測序數據分析的常見內容。為了進一步分析NUMT是否會影響mtDNA單倍群的計算,本研究通過對20例卵巢癌組織樣本的mtDNA捕獲測序數據分析發現,無論是包含NUMT還是不包含NUMT的mtDNA測序數據,mtDNA的單倍群并沒有發生改變,說明NUMT的存在對二代測序mtDNA單倍群分析結果影響較小(表1)。

表1 包含NUMT和不包含NUMT測序數據的mtDNA單倍群比較

2.5 NUMT對DNA片段分布有影響

為了研究NUMT是否會影響二代測序數據中mtDNA片段分布,我們對20例卵巢癌組織樣本的mtDNA捕獲測序數據進行了分析,結果發現,在包含NUMT和不包含NUMT的測序數據中,mtDNA的片段分布具有顯著性差異(P<0.01)。雖然兩組數據的DNA片段分布峰值所在DNA片段大小的差異不明顯,但在包含NUMT的測序數據中,分布在150~300 bp之間的mtDNA片段數量明顯高于不包含NUMT的測序數據(圖4),由此說明NUMT的存在影響mtDNA的片段分布。

bP<0.01 vs不包含NUMT。圖4 包含NUMT和不包含NUMT測序數據的mtDNA片段分布比較

3 討論

二代測序作為研究mtDNA變異、拷貝數和片段分布的常見方法,NUMT在其中的影響尚未闡明。因此,本研究對20例卵巢癌組織樣本的mtDNA捕獲測序數據進行分析,比較了包含NUMT和不包含NUMT的測序數據對mtDNA的測序深度、變異、拷貝數、單倍群和片段分布分析的影響。結果顯示,NUMT的存在對mtDNA的變異和單倍群的分析影響較小,而對mtDNA的測序深度、拷貝數和片段分布有較大影響。

由于本研究運用嚴格的多重過濾條件進行mtDNA突變的過濾和篩選,因此NUMT的存在對mtDNA突變分析影響較小。由于mtDNA單倍群是基于mtDNA的變異位點進行計算的,因此NUMT的存在對mtDNA單倍群分析的影響也較小。而二代測序reads較短,使得原本與mtDNA相似的NUMT更容易在比對的過程中被錯誤地當成mtDNA,因此包含NUMT測序數據的mtDNA平均測序深度會高于不包含NUMT的測序數據。mtDNA的平均測序深度作為計算mtDNA拷貝數的重要組成部分,也會影響mtDNA拷貝數的計算,因此包含NUMT測序數據的mtDNA拷貝數會高于不包含NUMT的測序數據。此外,測序深度存在的差異可解釋為包含NUMT的測序數據中mtDNA片段數目較不包含NUMT測序數據高。

然而,本研究也存在一定的局限性:第一,與以往研究中有使用全基因組測序研究mtDNA突變的相關報道[20]相比,本研究使用的測序數據為mtDNA捕獲測序數據,尚未考慮到全基因組測序數據中NUMT對mtDNA分析的影響。第二,本研究采用的樣本類型是組織樣本,尚未考慮不同的樣本類型(如血漿)中NUMT存在對測序結果的影響。第三,近年來,mtDNA的甲基化也逐漸成為一個研究熱點[21-22],由于受到實驗條件的限制,尚未研究NUMT對于mtDNA甲基化的影響,其有待后續的研究開展。第四,本研究是基于比對的方式來減少測序數據中的NUMT,無法完全去除測序數據中的NUMT。由于NUMT的研究較少,目前尚未找到完全去除測序數據中NUMT的方法。

綜上所述,本研究探討了 NUMT 的存在對mtDNA二代測序數據分析的影響,為后續基于二代測序的mtDNA相關研究的開展奠定了基礎,為準確分析mtDNA變異、拷貝數和片段分布提供了方向,推動了mtDNA相關研究的進展。

猜你喜歡
線粒體測序基因組
線粒體自噬在腸缺血再灌注損傷中的作用及機制研究進展
不同組織來源線粒體提取效率和質量的差異研究
線粒體自噬在纖維化疾病中作用的研究進展
“植物界大熊貓”完整基因組圖譜首次發布
我國小麥基因組編輯抗病育種取得突破
新一代高通量二代測序技術診斷耐藥結核病的臨床意義
宏基因組測序輔助診斷原發性肺隱球菌
生物測序走在前
MFN2調控線粒體動態變化的研究進展
基因測序技術研究進展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合