?

基底膜相關基因風險模型在胃癌中的分析應用

2022-02-11 01:50李鴻昊許鳴韓美霞鄧媛媛黎麗旋
現代消化及介入診療 2022年9期
關鍵詞:基底膜胃癌通路

李鴻昊,許鳴,,韓美霞,鄧媛媛,黎麗旋,

【提要】目的 分析基底膜(BM)相關基因在胃癌中的表達意義。方法 從公共數據庫下載BM相關基因、胃癌轉錄組數據與臨床信息;基于TCGA篩選BM差異基因后進行COX和Lasso回歸分析構建風險模型,分析風險評分與生存預后以及臨床特征之間的關系, GSE26253隊列驗證其預測生存預后的準確性。功能富集、GSVA分析風險基因潛在的作用通路。計算免疫細胞浸潤與風險評分之間的關系,基于風險基因模型發掘胃癌相關的免疫檢查點。結果 基底膜相關基因高風險評分是胃癌患者生存預后的獨立危險因素;風險基因與免疫功能密切相關(P<0.05); 風險基因相關的免疫檢查點及相關通路存在關聯(P<0.05)。結論 基底膜相關風險基因模型在胃癌中具有重要的臨床應用價值。

據最新調查顯示,胃癌的發生率和死亡率均位列于所有腫瘤類型的前列[1-2]。近些年來,隨著高通量測序技術不斷進步,越來越多的基因在胃癌中的表達作用被逐漸挖掘[3]。多數胃癌患者在被診斷時已處于中晚期階段,預后較差。因此,積極探索與胃癌相關的潛在預測及預后基因具有重要的價值[4-5]?;啄?(BM) 是最古老的動物細胞外基質 (ECM),其周圍圍繞大多數組織和上皮細胞,形成片狀結構。其中包含層粘連蛋白和膠原分子,對于細胞的粘附和轉移起到至關重要的作用[6]。研究表明BM相關基因與腫瘤細胞脫落、轉移存在緊密關聯因此,理解BM相關基因在腫瘤的發展進程中具有重要意義[7]。

本次研究基于公共數據庫的發掘,首次從BASE數據庫中下載BM相關基因[8],研究其在胃癌中的表達意義。首先篩選在胃癌中差異倍數較大的BM相關基因,構建風險模型?;陲L險模型對患者進行風險評分,從而評價風險模型在胃癌中的臨床應用。同時采用基因功能富集分析其在生物學功能方面的應用,以及探討風險模型與胃癌免疫系統之間的關系,發掘潛在的免疫檢查點,旨在臨床方面為胃癌的治療尋求新的思路。

1 材料與方法

1.1 使用數據庫網站

TCGA(https://www.cancer.gov/);BASE (https://bmbase.manchester.ac.uk);GEO(https://www.ncbi.nlm.nih.gov/geo);MSigDB(https://www.gsea-msigdb.org/gsea/msigdb);GEPIA(http://gepia.cancer-pku.cn/);KM-plot(http://kmplot.com/analysis/)。

1.2 數據下載

從TCGA官網STAD-counts平臺下載胃癌轉錄組數據及臨床信息。從GEO數據庫下載GSE26253芯片數據。從BASE數據庫中下載BM相關基因。

1.3 篩選基底膜相關差異基因

基于TCGA隊列基因表達數據,利用R中limma包進行數據整理,篩選BM相關差異基因。設置條件為|LogFC|>2,矯正后的P值FDR<0.05。使用R對差異基因進行單因素COX回歸預測,對具有預后價值的差異基因進行LASSO-Cox回歸分析構建風險預后模型。

1.4 建立風險預后模型

基于上述差異基因,采用 R 軟件 glmnet包進行 LASSO-Cox回歸分析,構建風險模型。風險模型通過以下公式計算:風險模型=(系數1 * mRNA1基因表達量) + (系數2 * 基因表達量 mRNA2) + (系數n * mRNAn基因表達量)。 根據風險模型表達公式,對TCGA數據庫中每個胃癌病人進行風險評分。根據風險評分的中位數將患者分為高風險組和低風險組,繪制Kaplan-Meier生存曲線。此外,分析TCGA隊列患者臨床特征與風險評分之間的相關性。對GSE26253芯片數據進行整理,得到433個胃癌術后患者的基因表達數據和術后無瘤生存時間,使用風險評估模型對每個胃癌患者進行風險評分,根據風險評分的中位數將患者分為高風險組和低風險組,繪制Kaplan-Meier生存曲線。

1.5 受試者操作特征(ROC)與列線圖

利用R中survivalROC包繪制受試者工作特征(ROC)曲線判讀風險模型預測患者第1、3、5年生存率的敏感性和特異性,評估風險模型預測的準確性。PCA 分析探討高低風險組病人的分布范圍。使用臨床特征與風險模型構建列線圖,預測胃癌患者第1-,3-,5-年的生存率,C指數與校準曲線評估列線圖的準確性。

1.6 基因功能富集分析與GSVA

通過R中ClusterProfiler包進行GO分析,包括分子功能(MF),生物學途徑(BP),細胞組分(CC)。并使用同樣的方法計算KEGG富集通路分析。篩選條件為LogFC>1,FDR<0.05。GSVA進一步探索風險基因潛在的作用通路。

1.7 免疫浸潤與免疫檢查點

腫瘤的進展與免疫浸潤密切相關,我們對于免疫浸潤在高低風險組的病人進行了進一步分析。CIBERSORT計算基于風險模型評分分組的高低風險組病人的免疫細胞浸潤水平間的差異,分析免疫功能與風險評分之間的關系。另從文獻中整理已發表的免疫檢查點,用于分析風險模型與免疫檢查點的關聯。

1.8 統計學分析

所有的統計學分析基于R軟件包(R 4.2.1.)計算,P<0. 05表示差異具有統計學意義。

2 結果

2.1 從BASE數據庫下載224個BM相關基因

從TCGA中下載胃癌的轉錄組數據集臨床信息(臨床信息見表格1),得到375例胃癌組織及32例正常組織樣本。從GEO中下載了從GEO數據庫下載GSE26253芯片數據,得到433個胃癌患者組織樣本的基因表達數據及胃癌患者術后隨訪時間。

表1 TCGA胃癌轉錄組的臨床樣本特征

2.2 篩選BM相關差異基因

如表2所示,在TCGA隊列中,通過與正常組織做比較,在224個BM相關差異基因中,共篩選出22個差異基因(|LogFC|>2, FDR<0.05),其中COL4A6、UNC5D、AMTN在胃癌組織中表達下調,19個基因在胃癌組織中表達上調。

表2 TCGA-STAD隊列中差異表達4倍及以上的BM相關差異基因

圖1 胃癌患者的BM相關差異基因的篩選 A:22個BM相關基因構成的基因熱圖;B:22個BM相關基因構成的火山圖

2.3 構建基底膜相關基因風險模型

使用R survival對上述22個差異基因進行單因素COX回歸預測(圖2A),對具有預后價值的差異基因進行LASSO-Cox回歸分析構建了BMS-GE風險模型(圖2B和2C):風險模型=(VCAN*0.13435+ADAMTS18*0.06122)。采用風險模型計算公式,在TCGA-STAD隊列中,對每個樣本進行風險評分,以風險評分中位數為臨界值,將隊列患者分為高風險組(n=185)和低風險組(n=186),Kaplan-Meier曲線顯示高風險組生存時間明顯縮短(圖3A);使用風險評估模型對GSE26253隊列中樣本進行風險評分,以風險評分中位數為臨界值,結果顯示高風險組患者無瘤生存期明顯低于風險組患者(圖3B)。分析風險模型與臨床特征的相關性,結果顯示:G3組風險評分明顯大于G2組;N3組風險評分大于N1組風險評分;StageⅡ/StageⅢ組風險評分均大于StageI組風險評分;T2/T3/T4組風險評分均大于T1組風險評分,T4組評分大于T3組風險評分(P<0.05)。

圖2 COX-LASSO回歸分析 A:COX回歸森林圖 22個基底膜相關差異基因進行分析得到4個具有預后價值的基因;B:Lasso回歸選擇最合適的λ值,4個危險基因的Lasso系數路徑圖;C:Lasso回歸交叉驗證

圖3 風險模型與胃癌生存預后及臨床特征之間的關系 A.TCGA隊列中高風險組的總生存率明顯短于低風險組患者;B.GSE26253隊列中,高風險組的術后無瘤生存率明顯短于低風險組患者。C:風險模型與TCGA隊列臨床特征之間的關系

2.4 ROC 曲線和PCA分析

繪制ROC曲線結果顯示:1年時的曲線下面積(AUC)為0.606,3年時AUC為0.608,5 年時AUC為0.773(圖 4A)。PCA分析能夠準確區分高低風險組的分布范圍(圖4B)。結果提示BM相關基因風險模型在預測胃癌患者的生存預后方面具有一定價值。

圖4 ROC曲線與主成分分析 A:風險模型評價ROC曲線,AUC曲線下面積均大于60%;B:胃癌患者的生存時間及生存狀態;C:PCA分析能夠準確區分高低風險組患者的分布

2.5 獨立預后分析

COX回歸分析風險評分是否能夠成為獨立預后危險因素。單因素結果顯示年齡、腫瘤分期、風險評分為生存預后相關因素(圖5A);多因素結果顯示年齡、 腫瘤分期、風險評分為獨立預后危險因素(圖5B)。

圖5 對胃癌臨床特征及風險評分急性COX回歸分析 A:單因素COX回歸森林圖;B:多因素COX回歸森林圖

2.6 構建列線圖

基于TCGA隊列,納入多個預后因素(年齡、性別、分級、分期以及T分期、M期、N分期、風險評分),采用風險模型計算公式對患者進行風險評分,預測胃癌患者的生存率。從圖中可以看出第1年、5年的預測能力與預測曲線幾乎重合,第3年的預測能力與預測曲線略有偏差(圖6A)。校準曲線評估列線圖的準確性,C指數為0.681,提示列線圖具有較準確的預測能力(圖6B)。

圖6 列線圖評估胃癌患者預后生存率 A:列線圖預測第1-,3-,5-的生存率;B:校準曲線預測第1-,3-,5-的生存率

2.7 功能富集分析

GO分析顯示來自TCGA隊列風險組間的差異基因主要富集于含膠原細胞外基質組織和細胞外部組織結構(表3和圖7)。KEGG 途徑分析顯示DEG主要富集在Neuroactive ligand-receptor interaction(腦組織神經活動配體-受體相互作用通路信號通路)及PI3K-Akt signaling pathway(絲氨酸/蘇氨酸激酶信號通路)(表4和圖7)。

表3 GO富集分析

表4 KEGG通路富集分析

圖7 GO富集分析與KEGG富集分析預測風險基因富集的相關通路 A:GO富集分析圈圖;B:GO富集分析柱狀圖; C:GO富集分析氣泡圖(BP代表生物學過程;CC代表細胞成分;MF代表分子功能 D:Kegg富集分析圈圖;E:Kegg富集分析柱狀圖;F:Kegg富集分析氣泡圖

2.8 GSVA

GSVA進一步闡明基于風險組的特征的分子機制。在TCGA隊列中,GSVA結果顯示TGFβ信號通路、粘著斑激酶信號通路、間隙連接通路、糖胺聚糖生物合成硫酸軟骨素通路主要富集在高風險組。藥物代謝-其他酶通路、視黃醇代謝通路、抗壞血酸和醛酸代謝通路、戊糖和葡萄糖醛酸相互轉化通路主要富集在低風險組。

圖8 GSVA/Kegg分析結果

表5 GSVA分析結果前十條通路集合

2.9 風險模型與免疫細胞浸潤之間的關系

根據CIBERSORT算法,計算高低風險組評分與免疫浸潤之間的關系(圖9)。CIBERSORT結果顯示M2巨噬細胞、單核細胞在高風險組中呈現高表達(P<0.05)。此外我們進一步探索了高低風險組與免疫相關功能之間的關系,趨化因子受體(CCR)在高風險中高表達,副炎癥相關反應(Parainflammation)、T細胞抑制功能(T_cell_co-inhibition)、I型干擾素相關功能在高風險組中高表達??紤]到免疫檢查點的重要性,我們進一步探索了高低風險組與免疫檢查點之間的關系,我們發現在高風險組中,多個免疫檢查點呈現高表達趨勢(ADORA2A、BTLA、CD27、CD28、CD40、CD40LG、CD44、CD48、CD8、CD86、CD400、CD200、CD200R1、CD244、CD274、CD276、CTLA4、HAVCR2、ICOS、LAIR1、NRP1、PDCD1LG2、TIGIT),其中包括TNF超家族/TNF受體超家族的多個成員(TNFRSF4、TNFRSF8、TNFRSF9、TNFSF4、TNFSF14、TNFSF18 TNFRSF5/CD40,TNFRSF7/CD27)。

圖9 風險基因模型與免疫浸潤之間的關系 A:免疫細胞浸潤在高低風險組間的差異;B:免疫功能在高低風險組間的差異

2.10 ADAMST18在胃癌中具有一定研究價值

GEPIA數據庫與Km-plotter數據庫均提示在胃癌中ADAMST18高表達預示較差的生存預后。

圖11 A:Km-plotter數據庫;B:GEPIA數據庫

3 討論

腫瘤的轉移是惡性腫瘤的基本生物學特征,是臨床上絕大多數腫瘤患者生存質量較差的原因[9]。腫瘤細胞脫落侵入基質是腫瘤轉移的重要環節,腫瘤細胞從原發灶脫離涉及多種復雜基質,多項研究表明基底膜在腫瘤細胞脫落過程中充當十分重要的介質[10-11]。胃癌是最常見的惡性腫瘤類型之一,預后較差。因此我們對基底膜相關基因在胃癌中的表達意義做出研究。

基于TCGA數據庫的研究,我們首次采用COX回歸及Lasso回歸分析方法成功構建了包含VCAN、ADAMTS18兩種基底膜相關基因的風險模型。使用GSE26253隊列中患者進行風險評分驗證,得出高風險評分預示較差預后生存。構建列線圖及ROC曲線發現風險模型可以成為胃癌的獨立預后風險因素且可以預測胃癌患者的生存期,此外風險評分與胃癌的分期、分級等臨床特征之間相關,具有臨床應用價值。

研究表明VCAN在消化系統腫瘤中具有重要的表達意義,其與TGF-β信號通路、EMT通路等相互作用,參與腫瘤細胞的血管生成、免疫抑制等多種生物學功能從而促進腫瘤的遷移與轉移,在胃癌中的研究也相對較多,同時有研究表明VCAN可作為胃癌的潛在治療靶點[12-14]。據報道,ADAMTS是一類具有鋅離子依賴性的分泌型基質金屬蛋白酶,其家族成員在不同類型腫瘤的形成過程包括腫瘤細胞的侵襲、轉移發揮作用以及與部分重要的癌癥相關的信號通路之間存在緊密關聯,ADAMTS18在食管癌、肝癌、肺癌、腎癌等均具有表達意義,但在胃癌中的研究報道相對較少[15-16]。我們使用KM-plotter數據庫與GEPIA數據庫初步探索了單基ADAMTS18在胃癌方面的生存預后價值,發現ADAMTS18高表達提示較差的胃癌生存預后,由此可見ADAMTS18在胃癌中具有潛在的研究價值,值得進一步探討。

進一步研究風險基因模型在生物功能學方面的作用時,我們發現風險基因主要富集于含膠原細胞外基質組織和細胞外部組織結構。GSVA顯示TGF/β通路、粘著斑激酶信號通路、縫隙連接通路參與胃癌發生發展,以上通路均與腫瘤細胞的脫落、侵襲與遷移緊密關聯[17-18]。KEGG 途徑分析顯示風險基因主要富集在腦組織神經活動配體-受體相互作用通路及PI3K-Akt信號通路。EMT過程作為腫瘤微環境的重要組成成分,是腫瘤加速進程的重要中間過程。研究表明,PI3K-Akt信號通路參與多種類型腫瘤的發展,其是EMT過程中的重要介質,腫瘤上皮細胞經歷EMT過程后,細胞間的粘附能力下降、侵襲能力增強,促進腫瘤細胞隨血液循環運動,加速腫瘤向全身轉移[19-20]。腫瘤細胞、微環境與宿主在動態演變中相互聯系、相互促進,加快腫瘤的發展。在這一過程中,細胞外基質充當重要角色,腫瘤的運動侵襲性、調節腫瘤微環境的能力以及在侵襲組織中定植生長均與基質相互關聯,降解細胞外基質是腫瘤侵襲和轉移的必經階段[21]。按分布部位來說,基底膜屬細胞外基質的一部分。通過以上的分析,因此我們理論上認為基底膜相關風險基因或許通過影響細胞外基質的行為功能而影響腫瘤微環境的變化促進胃癌的發生發展。此外,我們發現了腦組織神經活動配體-受體相互作用通路在胃癌中有所涉及,而腦組織神經活動配體-受體相互作用通路多在神經系統疾病包括腦神經膠質瘤中報道,在胃癌中少有報道[22-23]。早有研究報道胃部出現異常神經可導致胃癌的形成[24],由此可見神經系統與胃癌的發生具有一定關聯,腦組織神經活動配體-受體相互作用通路在神經系統疾病發揮重要作用,那么該通路是否在胃癌的發展進程中具有重要作用值得日后進一步研究。

免疫微環境作為腫瘤微環境有機整體的主要組成成分,是腫瘤領域研究的熱點,同樣在我們的研究中發現,M2巨噬細胞、單核細胞在高風險組中呈現高表達趨勢,已知巨噬細胞、單核細胞的預示胃癌患者的不良預后,這可能是高風險組預后差的重要影響因素;在免疫功能方面,高風險組中副炎癥相關反應(Parainflammation)、T細胞抑制功能(T_cell_co-inhibition)、II型干擾素相關功能高表達[25-26]。以上說明風險模型在胃癌免疫細胞浸潤中發揮十分重要的作用。腫瘤壞死因子受體超家族 (tumor necrosis factor receptor superfamily, TNFRSF)是一類可以通過半胱氨酸富集區域 (cysteine-rich domains, CRDs)與腫瘤壞死因子超家族 (tumor necrosis factors superfamily, TNFSF)結合的細胞因子受體超家族,TNF超家族/TNF受體超家族相互作用在多種類型腫瘤中的發生進程中發揮重要角色,其與免疫系統及免疫疾病的形成中也發揮重要角色[27]。當我們探索風險模型與免疫檢查點之間的關系時,我們發現在高風險組中,TNF超家族/TNF受體超家族的多個成員均呈現高表達。此外,在高表達風險組中,多種CD分化抗原呈現高表達趨勢,我們知道CD分化抗原多分布在一些免疫細胞上,在腫瘤進程中通過調節免疫系統成分而改變腫瘤微環境,促進腫瘤的發生發展。如 CD27作為腫瘤壞死因子受體超家族一員,表達在T 細胞、髓質胸腺細胞、B 細胞亞群和自然殺傷細胞,共刺激 B 細胞和 T 細胞激活,從而發揮重要的免疫功能[28]。因此我們推測風險模型可與TNF超家族/TNF受體或CD分化抗原存在某種關聯,共同促進腫瘤的發生發展。

綜上所述,基于數據庫建立的基底膜相關基因風險模型對胃癌的生存預后以及其與臨床特征之間的關系具有重要的臨床應用價值。在生物功能學方面,通過以上結果分析,我們推測,基底膜風險基因或許可通過與多條通路相互作用調節腫瘤微環境的變化而促進胃癌的發生發展。最后我們發現基底膜風險基因與胃癌的多個免疫檢查點相互作用,尤其與CD分化抗原與TNF超家族/TNF受體超家族緊密關聯,而CD分化抗原與TNF家族均是免疫系統的重要組成成分,基底膜風險基因是否是免疫系統的重要組成成分有待實驗進一步探索。腦組織神經活動配體-受體相互作用通路與ADAMTS18在胃癌領域具有潛在的研究價值。但本文的不足之處在于本研究基于公共數據庫進行分析,生物功能學分析多是基于已有文獻報道進行分析,缺乏一定的實驗支撐及機制探索,我們擬在未來會在實驗基礎上對機制進行進一步的探討。

猜你喜歡
基底膜胃癌通路
新生小鼠耳蝸基底膜的取材培養技術*
豚鼠耳蝸基底膜響應特性的實驗測試與分析
基于螺旋型耳蝸的數值分析
P53及Ki67在胃癌中的表達及其臨床意義
Kisspeptin/GPR54信號通路促使性早熟形成的作用觀察
胃癌組織中LKB1和VEGF-C的表達及其意義
proBDNF-p75NTR通路抑制C6細胞增殖
胃癌組織中VEGF和ILK的表達及意義
HGF/c—Met信號轉導通路在結直腸癌肝轉移中的作用
通路快建林翰:對重模式應有再認識
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合