?

基于生物信息學方法篩選前列腺癌中的關鍵表達基因及其對預后影響的分析

2023-03-05 12:11張冠楊登科
現代泌尿生殖腫瘤雜志 2023年3期
關鍵詞:差異基因前列腺癌生化

張冠 楊登科

前列腺癌是男性泌尿生殖系統最常見的惡性腫瘤之一,其發病率呈逐年升高趨勢,很多患者在初診時已屬中晚期。臨床診療中,患者在接受常規的內分泌治療無效后會面臨疾病進展、生活質量下降、生存期縮短等問題[1],一部分病例經內分泌治療、手術治療或化療后仍存在生化復發或轉移可能。本文旨在通過基因芯片技術和生物信息學方法,分析前列腺癌中的關鍵表達基因、信號通路以及蛋白質相互作用網絡,并進行前列腺癌生化復發和轉移事件的生存分析和Cox回歸分析,從而尋找潛在的治療靶點,為前列腺癌的生化復發和轉移事件提供新的診療思路。

對象與方法

一、數據來源

從基因表達綜合(Gene Expression Omnibus, GEO)數據庫(https://www.ncbi.nlm.nih.gov/geo/)中下載前列腺癌相關的基因芯片數據集(GSE200879和GSE116918)。GSE200879發表于2022年5月,包含由實驗平臺GPL32170提供的137例臨床樣本,其中正常樣本9例,前列腺癌樣本128例。GSE116918發表于2018年7月,包含由實驗平臺GPL25318提供的248例前列腺癌樣本,并對其進行前列腺癌生化復發和轉移事件的隨訪。

二、數據標準化

利用R軟件對基因芯片數據集(GSE200879和GSE116918)進行初步處理及標準化。首先,使用平臺文件將基因探針轉換為基因名,并對相同基因的表達量取平均值,然后使用“最近鄰居法”補充缺失值,最后使用標準化函數對數據進行標準化,并用箱線圖對標準化后的數據進行可視化檢驗,以確保后續數據生物信息學分析的有效性和可靠性。

三、篩選差異基因

利用limma包并使用過濾條件(差異表達倍數的對數絕對值>2,并且調整后的P<0.05),篩選出GSE200879中正常樣本和前列腺癌樣本的差異表達基因。

四、基因功能富集分析和信號通路富集分析

使用clusterProfiler包進行基因本體(Gene Ontology, GO)及京都基因和基因組百科全書(Kyoto Encyclopaedia of Genes and Genomes, KEGG)分析,然后使用過濾條件(調整后的P<0.05)篩選差異基因主要富集的功能和通路,并繪制柱狀圖對結果進行可視化。

五、構建蛋白質相互作用網絡

利用在線分析工具STRING網站(https://cn.string-db.org/)和Cytoscape軟件對篩選出的差異基因構建蛋白質相互作用網絡,并篩選出關鍵靶點。

六、差異基因對前列腺癌生化復發和轉移事件的影響分析

提取標準化后的GSE116918中差異基因的表達量,根據基因表達的中位值將前列腺癌患者分為低表達組和高表達組,并與生化復發和轉移事件的數據關聯。然后使用survival包和survminer包分析差異基因對前列腺癌生化復發和轉移事件的影響,生存分析采用Kaplan-Meier法,并繪制生存曲線。

七、前列腺癌生化復發和轉移事件的多因素Cox回歸分析

使用函數cox.zph驗證PH假設,然后使用survival包和survminer包構建多因素Cox回歸模型,因變量為前列腺癌生化復發和轉移事件的隨訪時間和隨訪狀態,自變量為年齡、PSA值、T分期、Gleason評分和差異基因(TDRD1、CRISP3、OR51E2、SIM2、HPN、PGM5-AS1、BMP5、PCAT4、KRT15、KRT13、KRT5、VSNL1、GSTM1、OLFM4、SLC14A1、CYP3A5),最后繪制森林圖。

結 果

一、篩選差異基因

從GSE200879中篩選出3 314個差異表達基因,其中1 664個基因表達下調,1 650個基因表達上調。進一步使用過濾條件篩選出22個基因,其中15個基因表達下調,7個基因表達上調。按照差異表達倍數由大到小排列,15個下調基因依次排序為SCGB1A1、CYP3A5、SLC14A1、OLFM4、GSTM1、UPK1A、VSNL1、CD177、GPX2、KRT5、KRT13、KRT15、PCAT4、BMP5、PGM5-AS1;7個上調基因依次排序為PCA3、TDRD1、CRISP3、AMACR、OR51E2、SIM2、HPN。對篩選出的22個差異基因進行相關性分析,發現表達上調的基因與其他上調基因呈正相關關系,而與下調基因呈負相關關系,表明這些差異基因可能存在共表達或表達調控關系。

二、基因功能富集分析和信號通路富集分析

GO分析發現,KRT5、KRT13、KRT15基因主要富集在中間絲組織、中間絲細胞骨架組織和基于中間絲的生物過程;CYP3A5、GSTM1基因主要富集在分解代謝過程;HPN、BMP5基因主要富集在激素代謝過程和上皮向間充質轉化的負調控過程。KEGG分析發現,GPX2、GSTM1基因主要富集在谷胱甘肽的代謝過程;CYP3A5、GSTM1基因主要富集在化學致癌、細胞色素P450藥物代謝及其對外源物質的代謝過程;KRT13、KRT15基因主要富集在金葡菌感染、雌激素的信號通路過程。

三、蛋白質相互作用網絡構建

使用過濾條件(差異表達倍數的對數絕對值>1.5,并且調整后的P<0.05)篩選出97個差異基因,基于STRING網站和Cytoscape軟件構建蛋白質相互作用網絡圖。我們發現上調基因中,HPN、AMACR、CRISP3基因表達的蛋白質間存在相互作用,下調基因中KRT5、KRT13、KRT15、UPK1A、SCGB1A1、CYP3A5、GSTM1、GPX2基因表達的蛋白質間存在相互作用。

四、差異基因對前列腺癌生化復發和轉移事件的影響分析

分析發現,PGM5-AS1、CD177、GSTM1、SLC14A1、OR51E2、KRT13基因高表達患者的無生化復發生存率顯著高于低表達患者;PGM5-AS1、CD177、GSTM1、SLC14A1、KRT15、KRT5基因高表達患者的無轉移生存率顯著高于低表達患者。

五、前列腺癌生化復發和轉移事件的多因素Cox回歸分析

使用函數cox.zph驗證PH假定,我們發現納入的變量均符合PH假定。多因素Cox回歸分析結果顯示,SIM2基因(HR=0.405,95%CI:0.245~0.670,P<0.001)是前列腺癌生化復發事件的保護因素,T分期(HR=1.649,95%CI:1.051~2.588,P=0.030)和BMP5基因(HR=1.907,95%CI:1.006~3.614,P=0.048)是前列腺癌生化復發事件的危險因素;SIM2基因(HR=0.385,95%CI:0.173~0.858,P=0.020)是前列腺癌轉移事件的保護因素,HPN基因(HR=7.513,95%CI:1.886~29.924,P=0.004)是前列腺癌轉移事件的危險因素。

討 論

關于前列腺癌的分子機制和診療靶點,國內外已有很多相關研究,但均缺乏足夠的理論支撐和證據等級,這也限制了相關研究在臨床實踐中的應用。我們使用生物信息學方法篩選出前列腺癌中的差異表達基因,其中7個基因表達上調,按照差異表達倍數由大到小依次排序為PCA3、TDRD1、CRISP3、AMACR、OR51E2、SIM2、HPN。通過查閱文獻發現,PCA3基因在大多數前列腺癌細胞中高表達,且有研究認為PCA3的表達水平與病情進展呈正相關,可以作為前列腺癌診斷的標志物[2]。最近的一項研究表明,PCA3作為前列腺癌的標志物,具有良好的特異性和敏感性,并且PCA3與PSA聯合在前列腺癌的診斷中發揮著重要作用[3]。TDRD1是原發性前列腺癌中ERG過表達的直接上調靶基因,可以作為一種新的前列腺癌生物標志物[4-5]。此外,作為前列腺癌的原癌基因,CRISP3與前列腺癌的侵襲和進展關系密切,被證實為前列腺癌的潛在治療靶點[6]。CRISP3是前列腺癌的上調基因之一,其在前列腺癌細胞中的表達具有雄激素依賴性,CRISP3啟動子受雄激素受體的表觀遺傳調控[7]。CRISP3高表達是前列腺癌生化復發預后不良因素之一[8]。有學者對AMACR基因在前列腺癌中的作用進行了研究,認為敲除AMACR會導致細胞增殖能力下降、凋亡率增加,AMACR基因在前列腺癌的進展中可能發揮著致癌作用[9]。也有報道指出,對于精液中的AMACR蛋白檢測可成為前列腺癌診斷中的一種非侵入性檢查[10]。不僅如此,OR51E2激動劑可通過激活前列腺癌中的細胞外信號調節激酶1和2發揮致癌作用[11]。OR51E2基因在人前列腺癌上皮細胞中特異性高表達[12],能促進前列腺癌的侵襲和轉移[13]。有研究表明SIM2是前列腺癌顯著上調基因之一,并且其表達與臨床病理因素相關[14]。HPN基因是前列腺癌常見的高表達基因,一項研究指出HPN基因的變異可能與前列腺癌的發生風險有關[15]。綜上,本研究篩選出的上調差異基因與既往的相關研究相符,進一步驗證了本研究的有效性與可靠性。

在下調基因中,PGM5-AS1、GSTM1、SLC14A1基因在前列腺癌的發生、發展中起著十分重要的作用。有研究表明,PGM5-AS1通過競爭性結合miR-587,從而上調GDF10基因的表達,抑制前列腺癌細胞的增殖并促進其凋亡[16]。此外,有研究認為GSTM1基因缺失與亞洲人群前列腺癌的發病風險增加顯著相關[17]。最近的一項研究指出,與正常前列腺上皮細胞相比,SLC14A1基因在前列腺癌細胞中的表達顯著降低,并且Kaplan-Meier生存分析顯示,SLC14A1高表達可延長前列腺癌患者的無生化復發生存時間[18],這與本研究的結果相符。

在信號通路的相關研究中,雄激素依賴性的信號通路在前列腺癌內分泌治療中發揮著重要作用,此外雄激素非依賴性的信號通路也參與了前列腺癌的進展。有研究認為松弛素與雄激素在胞內信號通路中存在著相互作用,并且可能是雄激素非依賴性前列腺癌新的治療靶點[19]。WNT信號通路在前列腺癌的進展中也發揮著重要作用[20]。有研究表明脂質代謝通路與前列腺癌的侵襲和進展密切相關[21]。綜上,多種信號通路共同調控前列腺癌的發生和進展。在對差異基因對前列腺癌生化復發和轉移事件的影響分析中,我們發現PGM5-AS1、CD177、GSTM1、SLC14A1基因高表達能顯著延長前列腺癌患者無生化復發生存率和無轉移生存率。在前列腺癌生化復發和轉移事件的多因素Cox回歸分析中,我們發現SIM2基因表達是前列腺癌生化復發和轉移事件的保護因素。以上結果可為前列腺癌的臨床診療提供新的診療思路。

本研究也存在一些局限性。首先,本研究所選取的樣本來源于歐洲人群,所得結論是否適用于我國前列腺癌患者還需要進一步論證;其次,本研究數據來源于公共數據庫,其有效性和可靠性尚需進一步驗證;此外,尚需結合多中心的臨床數據來進行進一步的論證和預后分析。

猜你喜歡
差異基因前列腺癌生化
前列腺癌復發和轉移的治療
關注前列腺癌
認識前列腺癌
基于RNA 測序研究人參二醇對大鼠心血管內皮細胞基因表達的影響 (正文見第26 頁)
從廢紙簍里生化出的一節美術課
前列腺癌,這些蛛絲馬跡要重視
誰是半生化人
《生化結合治理白蟻》
《生化結合治理白蟻》
紫檀芪處理對釀酒酵母基因組表達變化的影響
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合