?

膀胱癌關鍵基因的篩選及預后相關性分析

2022-02-13 10:50張淑芳
感染、炎癥、修復 2022年3期
關鍵詞:差異基因膀胱癌關鍵

高 鑫 張淑芳

(1. 中南大學湘雅醫學院附屬??卺t院中心實驗室,海南 ???570208;2.中國醫學科學院北京協和醫學院(清華大學醫學部)研究生院,北京 100005;3.吉首大學附屬第四醫院懷化市第一人民醫院檢驗科,湖南 懷化 418000)

膀胱癌是男性的第四大常見癌癥,也是全球女性的第7位常見的實體瘤[1]。近年來,膀胱癌發病率仍有不斷上升趨勢,而且具有較高的復發率。在膀胱癌中非肌肉浸潤性膀胱癌約占75%,其中約80%的患者在初始治療后5年內復發;另25%為肌肉浸潤性膀胱癌,即使在進行根治性膀胱切除術后,該類患者的預后仍然很差[2]。膀胱癌局部浸潤轉移是膀胱癌復發和致死的重要原因[3]。然而,膀胱癌發生、發展和復發的機制仍不完全清楚,因此,探討膀胱癌細胞凋亡、增殖、轉移和侵襲所涉及的分子機制對于膀胱癌預防、診斷和治療具有重要價值?;蛐酒卜Q微陣列,近年來得到了極大發展,現已成為腫瘤機制研究的新方法。GEO(Gene Expression Omnibus)數據庫是龐大的基因芯片表達譜數據庫,可以提供大量具有挖掘價值的高質量芯片表達譜數據集。本研究中我們先通過GEO數據庫發掘具有研究價值的基因表達譜數據集,篩選與膀胱癌發生發展相關的差異基因并取交集,得到共同差異基因,然后借助DAVID在線分析工具對共同差異基因進行功能及通路富集分析,并通過STRING數據庫構建蛋白質-蛋白質互作網絡(protein protein interaction network,PPI網絡)來篩選關鍵基因,最后通過Oncomine數據庫和GEPIA在線分析工具分別對關鍵基因進行表達分析和預后分析,旨在了解所篩選的關鍵基因在膀胱癌中的作用和預后意義,為尋找膀胱癌治療靶點和藥物開發提供重要參考。

1 資料與方法

1.1 芯片數據的獲取 在GEO數據庫(https://www.ncbi.nlm.nih.gov/geo/)中使用關鍵詞“bladder cancer”檢索膀胱癌相關的基因表達譜芯片數據集,挑選按照正常組織和膀胱癌組織分組的數據集,下載它們的基因表達譜矩陣文件,同時下載相應數據集的平臺文件。在得到原始矩陣文件后使用Perl語言將基因ID與平臺文件的Gene symbol進行轉換,得到含有國際標準化基因名的表達矩陣,以便于后續差異基因分析。

1.2 差異基因篩選 使用R語言軟件3.5.0(http://bioconductor.org/biocLite.R)對兩套數據集進行標準化處理,然后通過R語言limma包(http://www.bioconductor.org/)對兩個數據集分別進行差異基因篩選,并繪制韋恩圖(Venn diagram),取交集,得到兩個數據集共同差異表達的基因。差異基因篩選條件設置為矯正P值(djustP)<0.05且取|log2FC|>1,其中FC為變化倍數(fold change)。

1.3 差異基因GO和KEGG通路富集分析 使用DAVID數據庫6.7版(https://david.ncifcrf.gov/)這一目前常用的基因功能注釋數據庫,將所得的共同差異基因進行GO功能注釋和KEGG通路富集分析,GO分析分為生物學過程(biological process,BP)、 分 子 功 能(molecular function,MF)和細胞組分(cellular component,CC)3個部分。分析完成后下載分析結果進行后續分析處理,結果均以P<0.05為差異有統計學意義。

1.4 PPI網絡構建及關鍵基因挑選 使用STRING數據庫(https://string-db.org/)分析蛋白質間的相互作用關系。將共同差異基因數據導入STRING數據庫進行PPI網絡分析,下載分析結果數據,使用Cytoscape 3.6.1對結果進行可視化,按照度數(degree)、貼近度(closeness)和中介度(betweenness)條件篩選各自的排名前10位的基因,最后取交集,得到同時出現在3個篩選條件排名前10位的基因即為關鍵基因[4]。

1.5 關鍵基因的膀胱癌表達分析 基于癌癥基因組 圖 譜(the cancer genome atlas,TCGA)數據庫中膀胱癌標準化的mRNA表達值計算關鍵基因在膀胱癌和正常組織的表達差異。通過t檢驗估計P值并通過錯誤發現率(false discovery rate,FDR)進一步校正。

1.6 關鍵基因與膀胱癌患者的預后分析 在得到關鍵基因后需要進一步了解其在臨床的預后意義,以便于分析其在臨床的應用價值。預后分析采用由北京大學開發的GEPIA在線分析工具(http://gepia.cancer-pku.cn/index.html)分 析,該分析工具可將TCGA數據庫和基因-組織表達(genotype-tissue expression,GTEx)項目的數據聯合起來分析。采用Kaplan-Meier法計算生存率,應用Log Rank法比較生存率,可信區間為95%,P<0.05為差異具有統計學意義。

2 結 果

2.1 獲取的芯片數據 在GEO數據庫中按照研究條件選擇GSE37815數據集和GSE65635數據集,正常組織一共10個樣本,腫瘤組織一共26個樣本。GSE37815的平臺為GPL6102,GSE65635的平臺為GPL14951,見表1。

表1 GEO數據集信息

2.2 差異基因的篩選 在對兩個表達譜數據集標準化后,按照djustP<0.05且|log2FC|>1條件篩選各個數據集的差異基因。GSE37815數據集共得到780個差異基因,其中包括247個上調表達基因,533個下調表達基因。GSE65635數據集共得到1 759個差異基因,其中包括773個高表達基因,986個低表達基因。通過繪制Venn圖篩選兩個數據集共同差異基因,共同上調表達差異基因為113個,共同下調表達差異基因為274個,見圖1。

圖1 GSE37815和GSE65635共同差異基因篩選

2.3 共同差異基因GO功能和KEGG通路分析通過使用DAVID數據庫對共同差異基因進行GO功能注釋,選擇BP、CC和MF 3個部分各自排名前5位的富集項目,發現共同差異基因在BP中主要富集在調節細胞增殖(regulation of cell proliferation),CC中主要富集在質膜(plasma membrane),MF中主要富集在細胞骨架蛋白結合(cytoskeletal protein binding)。GO前15個富集結果見圖2。KEGG通路富集主要涉及的前5位的通路有黏著斑通路(focal adhesion)、血管平滑肌收縮(vascular smooth muscle contraction)、緊密連接(tight junction)、細胞周期(cell cycle)和補體-凝血級聯(complement and coagulation cascades),見圖3。

圖2 共同差異基因排名前15位的GO功能富集結果

圖3 共同差異基因KEGG通路富集

2.4 PPI網絡分析和關鍵基因篩選 利用STRING數據庫對共同差異基因進行PPI網絡分析后,使用Cytoscape 3.6.1軟件按照度數、貼近度和中介度3個條件篩選各自前10位的基因,然后取交集,得到4個關鍵基因,分別為血管內皮生長因子A(vascular endothelial growth factor A,VEGFA)、拓撲異構酶Ⅱα[topoisomerase(DNA) Ⅱ alpha ,TOP2A]、細胞周期蛋白 B1(cyclin B1,CCNB1)和α-平滑肌肌動蛋白(actin α 2, α-smooth muscle actin,ACTA2),見表2。PPI網絡見圖4。

表2 3個篩選條件下得到的4個關鍵基因

圖4 共同差異基因的PPI網絡(劃線標記為關鍵基因所在位置)

2.5 關鍵基因的表達分析 CCNB1和TOP2A在膀胱癌組織中顯著高表達(FDR分別為0.000 32和0.000 045);ACTA2在膀胱癌中顯著低表達(FDR=0.008 7);VEGFA在膀胱癌中的表達與正常組織相比差異并無顯著性(FDR=0.83),見圖5。

圖5 關鍵基因在膀胱癌組織和正常組織中表達的分析結果

2.6 關鍵基因與膀胱癌患者預后相關性分析 采用GEPIA在線分析工具分析,根據4個關鍵基因分別在膀胱癌中表達的中位值,將膀胱癌患者分為201例高表達患者和201例低表達患者,分別分析這些基因在膀胱癌中的預后作用,從而了解關鍵基因在膀胱癌患者臨床預后判斷中的應用價值。該分析工作的數據來源和臨床資料均來自于TCGA數據庫。分析結果顯示,4個關鍵基因中有2個關鍵基因的表達與膀胱癌患者預后相關,分別為ACTA2(P=0.007 6)和VEGFA(P=0.019 0),見圖6。

圖6 關鍵基因ACTA2(A)和VEGFA(B)的表達與膀胱癌患者預后分析

3 討 論

膀胱癌是一種常見的惡性腫瘤,具有高侵襲性和高復發率,往往導致患者預后較差。生物信息學是一門計算機與醫學結合的綜合性學科,在近年隨著基因芯片技術的迅速發展和大數據時代的來臨而得到廣泛應用。膀胱癌基因水平的生物信息學分析可以對該疾病的發生和發展機制的研究提供新的角度。

在本研究中,我們使用GEO數據庫中的膀胱癌微陣列數據集GSE37815和GSE65635篩選出了兩個數據集中的共同差異基因。在GO分析中我們發現,共同差異基因在BP中主要富集在調節細胞增殖,CC中主要富集在質膜,MF中主要富集在細胞骨架蛋白結合,提示這些差異基因主要影響膀胱癌細胞的增殖和轉移功能。KEGG分析主要涉及的前5位的通路有黏著斑通路、血管平滑肌收縮、緊密連接、細胞周期和補體-凝血級聯。黏著斑是一種具有將肌動蛋白細胞骨架和整聯蛋白鏈接并與細胞外基質鏈接的質膜相關大分子集合,在維持細胞在運動過程中的張力以及細胞生存的信號傳遞中發揮重要作用。眾多研究表明,黏著斑相關結構分子參與調控腫瘤細胞上皮-間質轉化(epithelialmesenchymal transition,EMT)進程,促進腫瘤侵襲和轉移[7-9]。Kong等[10]研究表明,黏著斑激酶可參與膀胱癌侵襲和遷移的致癌信號轉導。緊密鏈接在人體中不僅起到屏障作用,還可控制離子和溶質的細胞旁擴散,在維持細胞間黏附作用和組織完整性方面發揮重要作用[11]。緊密連接蛋白1(tight junction protein 1,TJP1)是一種膜相關蛋白,在調節細胞-細胞接觸中發揮作用。Tsai等[12]發現,TJP1高水平表達與淋巴結轉移和預后不良顯著相關,敲低TJP1基因表達可導致膀胱癌T24細胞的生長和侵襲能力顯著降低。以往的研究同樣發現補體-凝血級聯通路在膀胱癌發展中發揮了調控作用[13-14]。綜上所述,我們篩選的共同差異基因主要通過影響黏著斑通路、血管平滑肌收縮、緊密連接、細胞周期和補體-凝血級聯通路參與了膀胱癌細胞的生長周期調控和膀胱癌的進展,本研究結果有助于我們進一步了解膀胱癌進展的相關機制。

此外,我們還通過構建PPI網絡篩選出4個關鍵基因VEGFA、TOP2A、CCNB1和ACTA2。生存分析發現,ACTA2和VEGFA的表達與膀胱癌患者預后相關。VEGFA能夠促進血管新生,在血管生成中的功能最明確,占有最重要的地位[15]。Pignot等[16]的研究結果提示,VEGFA在膀胱癌組織中高表達,T3~T4期膀胱腫瘤和VEGFA過度表達的患者最有可能從抗血管生成療法中受益。VEGFA是一種很有前景的治療靶點,因而可能是肌肉浸潤性膀胱癌的良好預后因素。本研究的定量分析結果顯示,VEGFA在膀胱癌組織中的表達水平是高于正常組織的,但差異無顯著性,可能是由于本研究使用了更為嚴格的FDR校正的P值。TOP2A是一種在轉錄過程中控制和改變DNA拓撲狀態的酶。Kim等[17]發現TOP2A的增強表達與非肌肉浸潤性膀胱癌的高復發率和進展率呈正相關,TOP2A可能成為非肌肉浸潤性膀胱癌的預后監測標志物。但TOP2A在膀胱癌的發生和進展中的確切作用機制仍需進一步研究。CCNB1屬于細胞周期蛋白(CCN)基因家族。研究表明,CCNB1在多種腫瘤(如乳腺癌、結直腸癌和肝細胞癌)中過表達并促進腫瘤增殖[18-19]。ACTA2有助于維持細胞產生的機械張力和細胞形狀。ACTA2已被發現在肺癌中與腫瘤進展有關[20],但ACTA2在膀胱癌中的具體調節作用機制及預后尚不完全清楚,仍需進一步研究。

我們還注意到,目前國際上也有與我們類似的研究發表。Sarafidis等[21]通過薈萃分析,將來自GEO數據庫的18個微陣列基因表達數據集整合成一個合并的數據集,確定了815個穩健的差異表達基因。然后同樣通過基于差異表達基因的PPI和WGCNA分析,篩選了膀胱癌患者尿液和血漿樣品中關鍵基因作為標志物,其中包括了VEGFA和TOP2A。此外,Zheng等[22]用類似的方法鑒定出包括CCNB1在內的膀胱癌患者預后關鍵基因。與類似的研究得到類似的研究結果,說明我們的結果是可靠的,與這些研究存在不同結果的可能原因是不同的研究采用的數據來源和算法有所不同,引入的批次效應不同,從而造成結果和結論并不完全一致。不過,我們的研究和前人的研究均證實了所篩選出的關鍵基因和通路在膀胱癌患者預后中的重要性。

總之,本研究通過生物信息學對膀胱癌進展相關的差異基因和通路進行了深入分析,篩選出了幾個關鍵基因和通路,有助于我們對膀胱癌發生和發展機制的理解,為臨床尋找膀胱癌治療靶點提供了重要的理論基礎,同時也為將來膀胱癌的研究提供了思路。本研究的局限性在于樣本量較少并缺少實驗驗證相關結果,未來還將進行大量樣本研究驗證。

猜你喜歡
差異基因膀胱癌關鍵
硝酸甘油,用對是關鍵
新形勢下深化改革開放的關鍵一招
VI-RADS評分對膀胱癌精準治療的價值
高考考好是關鍵
基于RNA 測序研究人參二醇對大鼠心血管內皮細胞基因表達的影響 (正文見第26 頁)
Analysis of compatibility rules and mechanisms of traditional Chinese medicine for preventing and treating postoperative recurrence of bladder cancer
膀胱癌患者手術后癥狀簇的聚類分析
miRNA-148a在膀胱癌組織中的表達及生物信息學分析
SSH技術在絲狀真菌功能基因篩選中的應用
生意無大小,關鍵是怎么做?
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合