王新俊,黃伊鑫
(1.貴州醫科大學附屬醫院臨床醫學研究中心,貴州貴陽 550004;2.貴州醫科大學附屬醫院肛腸外科,貴州貴陽 550004)
結直腸癌(colorectal cancer, CRC)是世界范圍內最常見的腫瘤疾病之一,據估計,2020年發生的新結直腸癌病例超過190萬例,死亡93.5萬人,約占癌癥病例和死亡的十分之一[1]。許多研究表明,結腸直腸癌的發生和發展可能與遺傳、生活方式、不健康飲食、缺乏運動和環境因素有關,但確切的病因和機制尚不清楚[2]。手術切除聯合放療和化療作為輔助或新輔助管理仍然是治療結腸癌的主要方式[3]。晚期結直腸癌患者的總生存率較低,治療效果往往不理想,因此,需要探索新的治療靶點,以提高結直腸癌的療效和預后。
目前,微陣列技術廣泛應用于分子機制的探索,在分子生物學中有著廣泛的應用。它為系統篩選腫瘤相關基因和利用生物信息學識別其調控機制提供了一種有效的方法[3]。
本研究采用生物信息學方法篩選CRC差異表達基因,并對差異表達基因進行基因本體(gene ontology,GO)分析和京都基因基因組百科全書(Kyoto Encyclopedia of Genes and Genomes, KEGG)分析。構建蛋白相互作用(p r otein- protein interaction,PPI)網絡,篩選出與結直腸癌發生密切相關的基因,然后,我們對候選基因進行了生存分析篩選出與結直腸癌預后相關的核心基因。研究結果可能為結直腸癌潛在的治療及預后相關生物標志物的研究提供新的見解。
本研究從GEO數據庫(https://w w w.ncbi.nlm.nih.gov/geo/)中下載提取結直腸癌3個基因表達譜數據集(GSE106582、GSE44861、GSE113513),其中GSE106582包括77個腫瘤樣本和117個正常樣本;GSE44861包括56例腫瘤樣本和55例正常樣本;GSE113513包括14例腫瘤樣本和14例正常樣本。
通過GEO2R (http s://w w w.ncbi.nlm.nih.gov/geo/geo2r)在線分析工具分析CRC樣本與正常樣本之間的差異基因(DEGs)。篩選條件為P<0.05和|log(FC)|>1。然后,利用R軟件(Version 3.6.3)對3個GEO數據集的DEGs結果進行分析及可視化處理。
本研究采用R軟件(Version 3.6.3)對差異表達基因進行GO功能富集分析和KEGG通路富集分析。P<0.05認為差異具有統計學意義。并將分析結果進行可視化。
應用在線數據庫STRING (version 11.0)對差異基因進行分析,設置交互作用得分≥0.4,構建蛋白質相互作用網絡(PPI)。使用Cytoscape軟件(3.6.0版本)對PPI網絡進行可視化,使用插件CytoHubba識別PPI網絡中的中心節點基因,然后將中心節點基因作為候選核心基因進行分析。并通過插件MCODE篩選關鍵模塊進行進一步分析。
利用在線工具GEPIA 2(http://gep ia2.cancer-pku.cn/)分析篩選出的核心基因表達水平與結直腸癌患者總生存期(overall survival,OS)的相關性。根據結直腸癌患者差異表達基因的表達情況及中位值分為高表達組和低表達組,繪制生存曲線,篩選具有預后價值的基因。
通過在線分析工具GEO2R進行基因表達譜GSE106582、GSE44861和GSE113513分析(圖1A-C),共鑒定篩選出具有顯著差異的基因212個(圖1D),其中上調基因55個(圖1E),下調基因157個(圖1F)。
圖1 差異基因分析
利用R軟件(Version 3.6.3)對獲得的DEGs進行功能富集分析。GO富集分析上調差異基因主要與細胞外基質分解、膠原代謝過程,膠原三聚體復合物、趨化因子活性,細胞因子活性等生物學過程有關。下調差異基因主要富集在細胞對銅離子反應、碳酸氫根轉運、頂端質膜、微絨毛膜、氧化還原酶活性、氯離子跨膜轉運活性等生物學過程中。
KEGG通路分析顯示,上調差異基因主要參與IL-17信號通路、NF-κB信號通路、TNF信號通路等信號通路,下調差異基因主要參與在氮代謝、礦物質吸收等信號通路。
圖2 差異表達基因功能分析
利用S T R I N G數據庫對獲得的2 1 2個DGEs構建PPI網絡,并確定核心基因。使用Cytoscape 3.8.2軟件進行分析和蛋白網絡可視化,cyto Hubba插件分析篩選出前15個基因(圖3)。TIMP1、CXCL8、CXCL1、MMP1、CXCL12、MMP3、CXCL2、CXCL5、MYC、P L A U、M M P 7、M M P 1 2、C O L 1 A 1、COL1A 2、BMP2。使用 MCODE 插件分析出最顯著的相互作用的兩個模塊,其中一個模塊由11個關鍵基因組成(TIMP1、CXCL1、MMP1、CXCL12、MMP3、CXCL2、CXCL5、P L A U、M M P 7、M M P 1 2、C O L 1 A 1、COL1A 2),另外一個模塊由4個關鍵基因組成(MMP3、COL1A1、COL1A2、BMP2)。
圖3 差異基因PPI網絡和核心基因模塊分析
我們利用GEPIA 2數據庫對15個中心基因進行結直腸腺癌的總生存期和無病生存期分析。我們發現,在15個中心基因中,TIMP1、CXCL8和COL1A 2與結直腸腺癌的總生存率相關(P<0.05)。
圖4 核心基因的預后基因特征分析
在本研究中,我們從GEO數據庫中獲得了結直腸癌基因譜GSE113513、GSE106582和GSE44861。通過GEO2R在線分析,篩選出差異表達基因(DEGs)。隨后,對這些差異基因進行GO和KEGG通路富集分析、通過蛋白相互作用PPI網絡構建篩選出15個核心差異候選基因。然后,我們對核心基因進行了總體生存分析發現CXCL8、COL1A 2和TIMP1在結直腸癌總生存期中發揮重要作用。這些可能是未來臨床應用的潛在治療靶點。
TIMP1是金屬蛋白酶(TIMP)家族的組織抑制劑之一,調控基質金屬蛋白酶(MMPs)和解離素金屬蛋白酶[5]。TIMP1的異?;钚耘c多種癌癥的進展有關。TIMPs通過多種機制參與細胞粘附過程及隨后的細胞生長調控,包括調節細胞骨架組織、與細胞粘附分子的直接相互作用或調控特定ECM組分的表達[6]。TIMP1表達增加預示喉癌[7]和黑色素瘤[8]的預后更差。通過誘導TIMP1特異性調控的FAK-PI3K/AKT和MAPK通路增加細胞凋亡[9]。TIMP1通過正常結直腸粘膜-腺瘤-癌序列呈現順序上升的趨勢,并且TIMP1的上調表明生存預后不良[10]。TUC338通過靶向TIMP1促進宮頸癌細胞的遷移和侵襲[11]。TIMP1不僅可以通過抑制MMP的表達和激活來抑制腫瘤,還可以通過促進血管生成、細胞生長和腫瘤炎癥來促進腫瘤的發生[12]。這些研究都表明TIMP1在癌癥發展中發揮著復雜的作用。
COL1A 2是編碼Ⅰ型膠原α2鏈的重要基因,參與細胞外基質的形成,主要通過細胞外基質受體途徑和局部粘附途徑影響細胞增殖、分化、粘連和轉移。COL1A 1和COL1A 2的異常表達水平已被報道在幾種類型的癌癥中[13]。COL1A 2在原發性CRC組織中顯著下調,CRC組織中COL1A 2 m RNA水平與腫瘤分化、侵襲、淋巴結轉移相關[13]。COL1A 1和COL1A 2在非小細胞肺癌和食管鱗癌腫瘤中的表達水平高于正常組織,Ⅰ型膠原的低表達與較差的總體生存和癌細胞分化顯著相關[15]。COL1A 2通過PI3k/Akt信號通路抑制胃癌細胞凋亡,促進胃癌細胞增殖、侵襲和遷移[16]。COL1A 2基因甲基化是頭頸癌的獨立不良預后因素[17]。
CXCL8是一種來自CXC組的趨化因子,也稱為白細胞介素-8 (IL-8)。一些研究表明CXCL8促進癌癥進展,并與不良預后有關[18]。CXCL8通過激活JAK/STAT1/HIF-1α/Snail信號轉軸促進膠質瘤的進展[19]。大量研究表明,CXCL8在內皮細胞、腫瘤相關巨噬細胞和癌細胞中均有表達[20]。CXCL8的過表達促進CRC細胞的增殖、遷移和侵襲,與CRC血管生成、轉移、預后差、無病生存率差密切相關[21]。在肺癌[22]、胃癌[23]患者中高表達的CXCL8與預后呈負相關,相關研究結果表明CXCL8作為一種重要的多功能趨化細胞因子,與多種腫瘤的發生、轉移、耐藥及預后相關。
綜上所述,我們通過整合生物信息學分析,確定了三個與結直腸癌相關的核心基因,我們的研究發現CXCL8、COL1A 2和TIMP1的表達特征可能對結腸癌具有預后價值,可能成為結腸直腸癌治療的靶點,它們在結直腸癌中的作用機制有待進一步研究。