?

整合位點分析技術的研究進展

2024-05-09 17:32張永紅李巖異張衛婷
生物技術進展 2024年1期
關鍵詞:逆轉錄基因組位點

張永紅,李巖異 ,張衛婷

華北制藥金坦生物技術股份有限公司,石家莊 050035

病毒基因組整合到宿主基因組中形成原病毒,是所有逆轉錄病毒復制的重要步驟。然而,不同類型的逆轉錄病毒整合位點的分布不同。例如,包括人類免疫缺陷病毒1 亞型(human immunodeficiency virus type 1,HIV-1)在內的靈長類慢病毒優先整合到基因密集區域處表達基因;嵌合抗原受體T 細胞免疫療法(chimeric antigen receptor T-cell immunotherapy,CAR-T)作為基因編輯性細胞治療方法,采用慢病毒整合性載體,將外源基因插入并整合到細胞基因組中[1]。某些位置的插入,可能會誘導原癌基因的激活、抑癌基因的失活、基因融合等,引起成瘤風險。在持續的細胞治療過程中,這種潛在的成瘤性,往往具有明顯的滯后性且很難預測。因此,CAR-T 治療需要評估潛在的插入突變風險和致癌風險[2]。

載體整合位點檢測已成為CAR-T 治療方法臨床試驗的安全性評估要求。2020年9月國家藥品監督管理局藥品審評中心(Center for Drug Evaluation,CDE)發布的《細胞治療產品申請臨床試驗藥學研究和申報資料的考慮要點》中關于“生產工藝開發的技術要求”及“質量研究和質量控制中的安全性研究”部分要求:提供目的基因在染色體中的整合情況及對細胞惡性轉化(成瘤性和致瘤性)進行安全性研究和內容評估。2020 年2 月CDE 發布的《免疫細胞治療產品臨床試驗技術指導原則(試行)》中規定:探索性臨床試驗的安全性和耐受性要考慮“外源基因隨機整合到細胞基因組形成插入突變,導致成瘤性和惡性轉化等”。對確證性臨床試驗的療效和安全性要求“繼續監測安全性風險,分析重要的已知和潛在的風險信息,包括遲發性不良事件(如致瘤性)的發生率、嚴重性和危險因素等,并有必要采取措施使風險最小化”。2021 年2 月CDE 發布的《基因修飾細胞治療產品非臨床研究與評價技術指導原則(試行)》則明確將“插入突變風險評估”作為非臨床安全性研究的內容,并詳細規定了關鍵風險因素的評估要點。由此可見,慢病毒載體整合位點檢測已經成為細胞治療產品新藥臨床試驗申請(investigational new drug,IND)及臨床試驗安全性評估的必檢內容。

1 整合位點的分析技術

由于基因重組技術帶來的潛在危害,科學家利用現代基因測序技術,對外源基因整合位點進行分析,并用于生物安全性評價。

慢病毒進入易感靶細胞后,逆轉錄酶將病毒核糖核酸(ribonucleic acid,RNA)基因組的兩個正義拷貝復制成線性雙鏈DNA 分子,每個分子都包含病毒長末端重復序列(long terminal repeat,LTR)。病毒整合酶完成病毒DNA(viral DNA,vDNA)整合,包括 HIV-1 在內的慢病毒可以有效地感染非分裂靶細胞,而以γ-逆轉錄病毒莫洛尼鼠白血病病毒為代表的其他類型的逆轉錄病毒則不能感染[3]。提取受感染細胞原病毒 DNA 和繪制整合位點等技術,經歷近40年的發展,已日趨成熟[4]。

1.1 Southern 雜交技術

通過使用限制性核酸內切酶消化感染細胞病毒基因組DNA(genomic DNA,gDNA)片段,證實病毒基因插入宿主細胞基因組中[5]。由于雜交顯現出多個條帶,證明整合可以發生在宿主基因組的多個位點。利用消化和電泳分離宿主gDNA 后,使用病毒DNA 探針進行Southern 雜交印跡時,實驗分辨率得到進一步增強。多項研究已證實,逆轉錄病毒可以整合到gDNA 多個位置,但無法判斷這種整合是否為隨機整合。通過對宿主gDNA 進行分級分離(例如長度或GC 含量),結果顯示整合位點傾向分布于富含GC 的gDNA 區域[6]。

DNA 測序技術的廣泛應用,對整合位點的序列分析起到了推動作用。研究中主要通過Maxam Gilbert 化學法[7]或雙脫氧測序法[8],對使用限制性核酸內切酶消化后的分級gDNA 片段進行測序,從而確定逆轉錄病毒整合位點的初始序列。這些研究為不同逆轉錄病毒靶位點重復(targetsite duplications,TSD)的分類奠定了重要基礎,并且已知轉座會產生位于這些移動遺傳元件兩側的短TSD[9],由此首次發現了整合與 DNA 轉座有關。聚合酶鏈式反應(polymerase chain reaction,PCR)的進一步發展,為逆轉錄病毒整合位點選擇的新興領域提供了技術支持,且該技術大大簡化了對特定vDNA-gDNA 的研究。

1.2 反向 PCR檢測技術

反向 PCR[10]是整合位點測序中早期應用的一種技術,用于vDNA-gDNA測序之前使用與已知序列(例如病毒 LTR)互補的外向引物擴增自連接的gDNA 片段。這種方法早期用于細胞與猿猴空泡病毒40(simian vacuolating virus 40,SV40)多瘤病毒共感染細胞來提供具有特征性轉座子DNA(transferred DNA,tDNA)底物的鼠白血病病毒(moloney murine leukemia virus,Mo-MLV),SV40 多瘤病毒作為細胞核中的未整合附加體達到高拷貝數[11]。SV40 特異性引物可與 Mo-MLV LTR 引物串聯使用,以放大出現在該過量tDNA源中的整合位點。此外,病毒共感染的替代方案涉及設計引物,當整合恰好發生在范圍內時,會偽隨機啟動gDNA 序列[12],這種方法是藤黃節桿菌(Arthrobacter luteus,Alu)分泌型核酸限制性內切酶識別重復序列實時 PCR 檢測的基礎,用于確定細胞培養物和患者樣本中 HIV-1的整合水平。

1.3 配體介導的PCR檢測技術

隨著連接介導的 PCR 或配體介導的PCR(ligationr-mediated,LM-PCR)的發展,單個整合位點的回收效率取得了重大突破[13]。在這種方法中,gDNA 被限制酶消化,將包含“粘性”末端的寡核苷酸盒(也稱為接頭)連接到所有消化片段上,然后使用與病毒 LTR 和接頭序列互補的引物完成整合位點的 PCR 擴增。隨著人類、小鼠和其他宿主基因組參考序列的完成,這種文庫構建和 DNA測序的結合可以用于對不同類型逆轉錄病毒的整合位點分布的研究。到目前為止,載體-基因組連接的下一代測序(next generation sequencing,NGS)技術允許對體內和體外的整合庫進行復雜研究。例如,研究人員探索了使用 Illumina MiSeq個人測序儀平臺對線性擴增介導的 PCR(restrictive linear amplification mediated PCR,LAM-PCR)和非限制性線性擴增介導的 PCR(non restrictive linear amplification mediated PCR,nrLAM-PCR)擴增的載體整合位點(integration site,IS)進行測序。其中,基于MiSeq 的高質量 IS 序列檢索是通過引入雙條形碼策略來實現的,與傳統使用的單條形碼協議相比,該策略大大減少了IS 序列沖突的頻率。

LM-PCR 擴增與強大的NGS 平臺的結合,例如454 Life Sciences 的焦磷酸測序和 Illumina 基于 DNA 簇的測序,使整合位點的檢測數量猛增,由使用NGS 之前的數百個到最終的數十萬和數百萬[14]。用超聲法代替限制性核酸內切酶消化gDNA 片段的方法[15],實現了對獨特 gDNA 來源的相同逆轉錄病毒整合位點的監測。由于在超聲處理中被研究群體的不同細胞之間存在完全相同的整合位點,以相對序列獨立的方式切割 gDNA,可以識別具有相同整合位點的多個序列讀數上的獨特接頭連接點[16]。

1.4 基于CRISPR/Cas9基因編輯技術

NGS 檢測慢病毒整合的方法受短讀長和PCR偏差的限制,導致產量低[17]。Van Haasteren等[18]發現了一個使用免擴增技術對IS進行測序的新整合位點測序(amplification-free integration site sequencing,AFIS-Seq)方法。AFIS-Seq 是基于無擴增、Cas9 介導的高分子量染色體 DNA 富集,適用于Nanopore MinION測序。這種易于使用且低成本的方法可生成長讀長,從而在短時間內能夠確定IS。有研究通過在多種細胞模型中繪制慢病毒載體的IS 來進行概念驗證,報告信號富集高達 1 600 倍。該方法還可以進一步擴展到 Cas9 介導的基因整合測序和 IS體內分析。AFIS測序使用長讀長測序可以提供更有信心的IS 分析,促使臨床前慢病毒載體基因療法的安全性通過評估[18]。

為了確定宿主基因組中的病毒整合位點,已經開發了幾種基于PCR 的方法。然而,基于PCR的方法靈敏度高度依賴于引物序列,因此需要針對單個目標位點進行引物設計優化。為了解決這個問題,Kiml 等[19]開發了一種用于對病毒插入位點進行全基因組定位的方法——增強型病毒整合位點測序(CRISPR-enhanced viral integration site sequencing,CReVIS-seq)。該方法基于以下連續步驟:基因組DNA 片段化,體外環化,以CRISPR指導RNA(single guide RNA,sgRNA)特異性方式切割靶序列,以無差別線性化DNA 片段進行高通量測序以及通過序列分析鑒定病毒插入位點。經過設計,CReVIS-seq 不受富集步驟中通過使用位點特異性引物的PCR 擴增引入的偏差的影響。此外,研究發現使用不同的sgRNA 集合的多重CReVIS-seq,可以同時識別單細胞克隆和異源細胞群體中的多個靶位點和結構變異[19]。

2 生物信息分析技術的應用

對基因治療數據中的病毒整合位點進行分析和監測,對于評估基因治療的安全性和有效性至關重要?;蛑委熤胁《据d體分布的整合位點分析和克隆性分析是監測細胞動態、評估惡性轉化風險和建立載體生物安全的關鍵因素。Afzal等[20]開發了基因整合位點(genome integration site,GENE-IS,https://github.com/G100DKFZ/gene-is)分析工具用于高效、準確地檢測基因治療數據中基于NGS的病毒載體整合位點。它是第一個具有雙重分析模式的工具,可以對基于 PCR 方法,如LAM-PCR 和靶向測序(如agilent sure select)技術生成的數據進行IS分析[3]。GENE-IS是一種可擴展、強大、精確且可靠的工具,用于大規模臨床前和臨床數據分析,為用戶提供靈活性的分析,可配置更多的參數[20]。

Peters 等[21]開發了基于網絡的生物信息學工具,可以促進逆轉錄病毒整合位點(retroviral integration site,RIS)的識別,但不足以以高通量方法快速繪制和表征 RIS。根據細胞群內插入位點的頻率以及運行的樣本數量,單次測序生成的結果中單個RIS 的覆蓋范圍可能為 50~5 000 倍。SeqMap 2.0 提供了一種可擴展的序列匹配、聚類和比對的方法(網址為http://seqmap.compbio.iupui.edu/)。

SeqMap 2.0 工作流程分為3 個階段:①序列處理,包括載體特征的識別和屏蔽以及將序列讀數分配到多重標識符(multiple identifiers,MID)/條形碼特定組中;②序列聚類和比對;③數據可視化和存儲以供進一步分析[21]。

病毒載體的表征和分析是開發安全基因治療產品、闡明載體潛在的遺傳毒性和免疫原性作用,并建立其安全性的重要組成部分。VSeq Toolkit(https://github.com/CompMeth/VSeq-Toolkit)是利用Perl 和Bash 編程語言開發的[22],為病毒基因治療數據提供了不同的分析模式:第1 種模式確定不期望的已知污染物及其在病毒制劑或其他測序數據中的頻率;第2 種模式用于分析載體內融合位點;第3 種模式用于揭示病毒-宿主融合事件分布。工具包的分析模式可以獨立執行,也可以一起執行,并允許同時分析多種病毒載體。它被設計和評估用于分析短讀高通量測序數據,包括全基因組或靶向測序。

整合病毒載體成為宿主基因組的一部分,使其成為臨床基因治療的關鍵因素。然而,病毒整合有相關風險,例如致癌基因的無意激活可能導致癌癥。因此,分析逆轉錄病毒載體的整合位點是開發更安全的治療載體的關鍵步驟[23]。VIS Mapper 是一個載體整合分析網站[24](http://vismapper.babelomics.org),用于分析逆轉錄病毒載體整合的NGS測序數據。VIS Mapper使用了新的映射算法,比以前的可用程序明顯更快,并且提供了一個有用的圖形界面來分析在基因組背景下發現的整合位點[24]。

感染的病毒整合到人類基因組中,是各種人類惡性腫瘤的重要風險因素。Virus Clip(https://github.com/dwhho/Virus-Clip)是一種檢測病毒片段的病毒整合位點工具。該工具利用從片段測序讀取中提取的信息來識別整合事件中人類和病毒斷點的確切位置。通過與病毒參考基因組的初始讀取比對及簡化程序,Virus Clip 為病毒整合位點檢測提供了一個簡單、快速和內存高效的解決方案[25]。此外,它還可以自動注釋與相應的受影響人類基因的整合事件。通過全轉錄組測序數據驗證病毒片段,并驗證其具有非常良好的靈敏度和特異性。與現有的工具相比,檢測性能顯著提高。此外,它還具有廣泛的功能,包括全基因組測序、全轉錄組測序和靶向測序[25]。

分析細胞基因組中新整合的DNA 位點十分重要,但分析和可視化這些數據的方法目前仍處于開發階段。Sherman 等[26]開發了用于數據分析和可視化的工具[26]——雙端測序,其不僅可以推斷轉導細胞的數量以及目標基因組中整合位點的分布,還可以將整合位點的分布與基因組特征進行比較。此外,為了總結人類基因治療樣本的整合位點數據,研究者開發了一種可對樣本群體結構、縱向動態和癌癥相關基因附近的整合頻率進行分類的工具[27],該工具可以對治療嚴重聯合免疫缺陷-X1(severe combined immunodeficiency-X1,SCID-X1)患者進行持續的縱向表征[26]。

3 降低基因重組風險的策略

CAR-T 細胞療法在治療B 細胞惡性腫瘤方面取得了重大進展,但實體瘤治療方面仍具有重大挑戰[28]。CAR-T技術中病毒載體的應用不僅受到監管限制,同時其高昂的成本也阻礙了基因工程概念轉化為臨床應用的可能。非病毒方法,例如轉座子/轉座酶和規律成簇的間隔短回文重復序列(clustered regularly interspaced short palindromic repeats,CRISPR)/Cas 系統,提供了CAR-T 細胞的另一種策略,該策略的出現,增加了CAR-T 細胞療法的可及性和效率[29]。但該策略仍然面臨許多挑戰,如敲除效率低、轉基因表達水平低、整合率低等[30]。mRNA 技術在很大程度上能降低基因重組的風險,隨著該技術的發展,未來在基因重組領域,將會受到更廣泛的關注和應用[31]。

3.1 非病毒轉導系統的應用

在CAR-T 細胞治療中,非病毒遞送平臺提供了一種有前景的替代方案,以解決病毒遞送技術方面的限制。病毒載體具有免疫原性高、有限的插入尺寸和生產成本高等缺點。相比之下,非病毒載體具有更低的細胞毒性和免疫原性[32],同時可以更好地保護外源基因,并提高基因轉導效率。非病毒基因遞送技術可以分為瞬時基因表達和穩定轉基因整合技術。非病毒穩定的基因整合技術可以通過Piggy Bac 或CRISPR/Cas9 系統完成,CRISPR/Cas9 系統通常使用線性化DNA(雙鏈或單鏈)或環狀DNA[31,33]。

3.2 低整合型病毒的利用

慢病毒載體是一種高效遞送基因進入靶向細胞的病毒載體。通過慢病毒載體,將遺傳物質轉導整合到細胞基因組,使宿主細胞獲得新功能,修復自身缺陷并刺激某些細胞功能恢復。由于慢病毒載體的潛在風險,加快整合酶缺陷型病毒的開發。整合酶缺陷型慢病毒載體系統(integrase deficient virus vector,IDLV)降低了轉基因整合到宿主基因組中的概率。整合酶缺陷病毒載體具有更高的安全特性,利用該特征整合酶缺陷型慢病毒載體更有利于治療的實施和臨床應用的拓寬,特別是在基因治療、定點基因編輯、細胞治療重編程等領域。

盡管 IDLV 以某種方式消除了轉基因整合到細胞基因組中的現象,但其不良反應仍然困擾著臨床應用,例如轉導效率低、表達水平低等。經過科學家的努力,IDLV 轉導效率較低的問題已在一定程度上得到解決,后續研究將繼續克服其他不良現象[34]。鑒于低整合型病毒其致癌整合風險低的特點,IDLV 是現有細胞產品轉導過程中病毒載體的最理想替代品。

4 展望

基因載體整合到宿主的基因組中,表達治療性轉基因藥物,在宿主體內實現治療效果。然而,慢病毒的RNA 基因組首先被逆轉錄為DNA,然后以看似隨機的方式整合到細胞基因組。為了避免慢病毒整合影響細胞功能,當整合發生在癌基因附近或關鍵基因內時,應在慢病毒感染靶細胞后進行慢病毒整合位點鑒定。所選擇的整合位點對轉基因的表達和宿主細胞的表型都具有重要的影響。整合位點分析是評估基因治療載體的生物安全性和轉基因細胞在體內克隆追蹤命運的關鍵工具。隨著近代生物測序技術的迅猛發展及基因重組技術的廣泛應用,基因整合分析將為生物安全提供更多有價值的參考,為降低細胞及基因治療產品的用藥安全保駕護航,慢病毒載體將成為細胞穩定遺傳修飾中重要的基因遞送載體。

猜你喜歡
逆轉錄基因組位點
鎳基單晶高溫合金多組元置換的第一性原理研究
牛參考基因組中發現被忽視基因
CLOCK基因rs4580704多態性位點與2型糖尿病和睡眠質量的相關性
抗逆轉錄病毒治療對艾滋病患者腦灰質體積的影響
病毒如何與人類共進化——內源性逆轉錄病毒的秘密
二項式通項公式在遺傳學計算中的運用*
鯉春病毒血癥病毒逆轉錄環介導等溫擴增(RT—LAMP)檢測方法的建立
高中生物教材中幾個疑難點的解讀
基因組DNA甲基化及組蛋白甲基化
有趣的植物基因組
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合