?

基于生物信息學對胃癌預后基因的篩選

2021-01-12 06:19李高勤牛帆蘇歡李俊杰宋忠陽祁亞峰雍文興張志明
世界最新醫學信息文摘 2020年97期
關鍵詞:胞外基質膠原胃癌

李高勤,牛帆,蘇歡,李俊杰,宋忠陽,祁亞峰,雍文興,張志明*

(1.甘肅中醫藥大學,甘肅 蘭州;2.甘肅中醫藥大學附屬醫院,甘肅 蘭州)

0 引言

胃癌作為最常見的惡性腫瘤之一,據世界衛生組織( WHO)最新報道,在全球范圍內胃癌發病率位列第5 位,死亡率位列第3 位[1]。早發現、早診斷、早治療是提高胃癌患者生存時間的關鍵。隨著臨床診療方法和預后標志物的完善,胃癌患者的早期診出率得到明顯提高,但對胃癌患者預后標志物的研究仍存在不足。因此,應尋找更可靠的預后標志物,作為提高治療效果和延長患者生存時間的靶點?;蛐酒鳛橐环N可靠的技術,經過多年的應用,能夠快速檢測出差異表達的基因[2]。

本研究從GEO 數據庫中篩選出GSE19826、GSE54129 和GSE79973 三個同時含有腫瘤樣本與正常樣本的數據集。利用GEO2R 在線工具和Venn 作圖軟件,獲得上述三個數據集中差異表達基因(DEGs)。然后利用DAVID 數據庫對這些DEGs 進行分析,包括分子功能(MF)、細胞成分(CC)、生物過程(BP)與KEGG分析。接著通過STRING 在線工具建立了蛋白質相互作用(PPI)網絡,然后應用MCODE(分子復合物檢測)對DEGs 進行分析以確定其核心基因。然后,將這些核心DEGs 導入Kaplan-Meier Plotter 在線生存分析數據庫,以獲得顯著的預后信息(P<0.05)。采用基因表達譜交互分析(Gene Expression profiling interactive analysis GEPIA)對胃癌組織與正常胃組織間的DEGs 表達再次進行檢測(P<0.05)。最后,產生四個DEGs(COL1A2,BGN,THBS2,COL1A1)??傊?,本研究的生物信息學研究為胃癌患者提供了一些有用的生物預后標記物,可以作為胃癌患者的有效靶點。

1 資料與方法

1.1 資料來源

NCBI-GEO 是一個免費的基因芯片/ 基因圖譜公共數據庫,我們獲得了GSE19826、GSE54129 和GSE79973 在胃癌和正常胃組織中的基因表達譜。GSE19826、GSE54129 和GSE79973 的基因芯片數據均基于GPL570 平臺([HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array),分別包括12 個正常組織和12 個胃癌組織、21 個正常組織和111個胃癌組織、10 個正常組織和10 個胃癌組織。

1.2 DEGs 的數據處理

用GEO2R 在線工具[3]按|logFC|>2 與P值<0.05 鑒定胃癌標本與正常標本之間的DEGs。然后,用VENN 軟件在線分析原始數據,找出三個數據集中的共同基因。logFC<0 的DEGS 為下調基因,logFC>0 的DEGS 為上調基因。

1.3 GO 功能分析與KEGG 通路富集分析

基因本體分析(GO)是定義基因及其RNA 或蛋白質產物以識別高通量轉錄組或基因組數據的獨特生物屬性的常用方法[4]。KEGG 是處理基因組、疾病、生物途徑、藥物和化學材料的在線數據庫[5]。David 是一個旨在識別大量基因或蛋白質的功能的在線生物信息學工具[6]。我們可以使用David 可視化顯示BP、MF、CC 和通路的DEGS 富集(P<0.0 5)。

1.4 PPI 網絡與模塊分析

本研究通過在線工具STRING(用于檢索基因相互作用的搜索工具)[7]來繪制PPI 網絡。然后,應用Cytoscape[8]中的STRING APP 來檢索這些DEG 之間的潛在相關性(最大交互作用數=0 和置信度分數≥為0.4)。此外,Cytoscape 中的MCODE 應用程序用于構建PPI 網絡的模塊(degree cutoff=2,max. Depth=100, k-core=2, and node score cutoff=0.2)。

1.5 核心基因的生存分析

Kaplan Meier-Plotter[9]是一個基于EGA、TCGA 和GEO數據庫來評估基因對生存的影響的網站工具。為了驗證這些設計,本研究應用GEPIA 網站對Kaplan Meier-Plotte 篩選的基因作二次驗證。

2 結果

2.1 胃癌中DEGs 的鑒別

本研究共有133 例胃癌組織和43 例正常組織。通過GEO2R在線工具,我們分別從GSE19826、GSE54129 和GSE79973 中提取80、768 和415DEGs。然后,利用Venn 圖軟件對三個數據集中的DEG 取交集。結果表明,共檢測到22 個DEGs,包括8 個下調基因(logFC<0;)和14 個上調基因(logFC>0;),下調基因有RDH12、AKR7A3、MFSD4A、DPCR1、VSIG1、MUC5AC、PSAPL1、RASSF6;上調基因有SULF1、FAP、INHBA、PDLIM7、SPP1、COL1A1、COL10A1、SFRP4、THBS2、BGN、COL1A2、MFAP2、ADAMTS2、COL8A1。

圖1 三組數據中有14個DEGs上調(logFC>0),8 個DEGs下調(logFC<0)

2.2 DEGs 基因在胃癌中的GO 與KEGG 通路分析

DAVID 軟件對22 個DEGs 進行了分析,GO 分析結果表明:對于生物過程(BP),上調的DEGs 在膠原纖維組織、皮膚形態發生、蛋白質異三聚、細胞粘附、內皮細胞分化等方面都有顯著的富集作用;細胞組分(CC)主要富集在蛋白質的細胞外基質、膠原三聚體、細胞外間隙、I 型膠原三聚體、細胞表面等方面;分子功能(MF)主要集中在細胞外基質結構組成方面,而下調基因無顯著性富集(表1)。

KEGG 分析結果如表2 所示,結果顯示,上調的DEGs 在ECM 受體作用、局灶性粘連、PI3K-Akt 信號通路、蛋白質消化吸收等方面尤為豐富,差異有統計學意義(P<0.05),而下調的DEGs 在信號通路中無明顯富集。

2.3 蛋白質相互作用網絡(PPI)構建

共有16 個DEGs 被導入DEGs-PPI 網絡復合體,其中包括16個節點和29 條邊,包括3 個下調基因和13 個上調基因(圖2a)。然后我們應用MCODE 插件進一步分析(degree cutoff = 2, node score cutoff = 0.2, k-core = 2, and max. Depth = 100),結果顯示在16 個節點中鑒定出5 個中心節點,這些節點都是上調基因(圖2b)。

2.4 Kaplan-Meier Plotter 和GEPIA 分析核心基因預后

利用Kaplan-Meier Plotter(http://kmplot.com/analysis)鑒定5個核心基因存活數據。結果發現,4 個基因的存活率明顯下降,而1 個基因的存活率則無顯著性差異(P>0.05,圖3)。然后,用GEPIA 方法檢測癌細胞與正常人之間4 個基因的表達水平。結果顯示,與正常胃粘膜樣本相比,COL1A2、BGN、THBS2、COL1A1 等4 個基因在胃癌樣本高表達(P<0.05,圖4)。

3 討論

本 研 究 以GSE19826、GSE54129 和GSE79973 三 個 數 據 為基礎,采用生物信息學方法,對胃癌的預后進行了研究。本研究共收集了133 例胃癌標本和43 例正常胃標本。通過GEO2R和Venn 軟件,我們發現共有22 個差異表達的DEG(|LogFC|>2,并調整P 值<0.05),包括14 個上調基因(logFC>0)和8 個下調基因(logFC<0)。然后,利用DAVID 方法對基因本體和途徑富集分析表明:對于生物過程(BP),上調的DEGs 在膠原纖維組織、皮膚形態發生、蛋白質異三聚、細胞粘附、內皮細胞分化等方面都有顯著的富集作用;細胞組分(CC)主要富集在蛋白質的細胞外基質、膠原三聚體、細胞外間隙、I 型膠原三聚體、細胞表面等方面;分子功能(MF)主要集中在細胞外基質結構組成方面,而下調基因無顯著性富集;在通路分析中,ECM 受體作用、局灶性粘連、PI3K-Akt 信號通路、蛋白質消化吸收上調的DEGs 尤其豐富,而下調的DEGs 則沒有顯著富集的信號通路(P>0.05)。其次,利用STRING 在線數據庫和Cytoscape 軟件構建了16 個節點、29 條邊的DEGs-PPI 網絡復合體。然后,通過MCODE 分析從PPI 網絡復合體中篩選出5 個核心的上調基因。此外,通過Kaplan-Meier Plotter 分析,我們發現5個基因中有4 個存活率明顯下降。而通過GEPIA 在線分析發現這4 個基因在正常人與胃癌患者中差異表達(P<0.05)。最后得出結論,這4 個基因可作為改善胃癌患者預后的新的有效靶點。

表1 胃癌差異表達基因的GO 分析

表2 胃癌差異表達基因的KEGG 通路分析

圖3 Kaplan-Meier Plotter 在線分析顯示COL1A1、BGN、COL1A2、THBS2 的生存率明顯下降(P<0.05)。

圖4 GEPIA 在線分析顯示上述4 個基因在胃癌患者高度表達(*表示P<0.05)。紅色表示腫瘤組織,灰色表示正常組織。

細胞外基質(ECM)是一個復雜的非細胞3D 網絡,由膠原、蛋白多糖/糖胺聚糖、彈性蛋白、纖維連接蛋白、層粘連蛋白和其他幾種糖蛋白組成[10]。細胞外基質的主要成分是膠原[11],I 型膠原存在于大多數結締組織和胚胎組織中[12]。通常,I 型膠原由I 型膠原α1 鏈(COL1A1)和一條I 型膠原α2 鏈(COL1A2)組成[13-14]。I 型膠原蛋白α1 鏈(collagen type I alpha 1chain,COL1A1),由COL1A1 基因編碼,它可以構成膠原纖維,并且參與細胞增殖、浸潤、轉移和血管生成,與多種類型腫瘤有關[15-17]。有研究表明I 型膠原蛋白形成的交叉網狀結構能夠支持卵巢癌細胞的生長[18],I 型膠原蛋白基因缺乏可促進乳腺癌細胞轉移[19],而在腦腫瘤中I 型膠原蛋白是腫瘤微環境的重要組成部分[20]。有報道稱,COL1A2與胰腺癌[21]、顱內動脈瘤關系密切[22],COL1A2 基因的突變與成骨不全的發生具有相關性[23]。

血小板反應蛋白 2 (thrombospondin-2,THBS2) 屬于凝血酶敏感蛋白(THBS/TSP)家族,由5 種鈣結合的基質細胞糖蛋白THBS1-THBS5 組成。根據寡聚狀態和結構域結構,它們可分為三聚體蛋白和五聚體蛋白兩個亞類。THBS1 和THBS2 是三聚體蛋白,而其他的是五聚體蛋白[24]。THBS2 與各種細胞表面受體、生長因子、細胞因子和蛋白酶相互作用,調節細胞-基質粘附、運動、趨化、傷口愈合、血管抑制等[25]。它主要通過抑制血管生成和負調控MMP-2 和MMP-9 參與腫瘤的發生[26]。在前列腺癌組織和細胞系中觀察到THBS2基因下調[27]。在Chijiwa 等人的研究中,肺腺癌的THBS2 轉錄水平反而顯著高于正常肺組織(P<0.0001)[28]。

雙鏈蛋白聚糖(biglycan,BGN)是一種細胞外基質(extracellular matrix ECM)蛋白,屬于富含亮氨酸的小蛋白聚糖家族[29]。BGN在人體幾乎每個器官中都有發現,但在每個器官中分布并不均勻。BGN 在細胞表面表達,有時在一系列特殊細胞類型的細胞外基質中表達[30]。最近的研究表明,與鄰近的正常組織相比,BGN 在腫瘤組織中的表達顯著增高,包括子宮內膜癌、胰腺癌、結腸癌和腫瘤血管以及食管鱗狀細胞癌[31-35]。BGN 在腫瘤組織中的異常表達提示BGN 在腫瘤的發生、發展中具有重要意義。

圖2 a.PPI 網絡中共有16 個DEGs;b.MCODE 插件獲得5 個核心基因

4 結論

綜上所述,本研究通過生物信息學分析研究基于三個微陣列數據集,在胃癌組織和正常胃組織之間鑒定出四個DEGs(COL1A2,BGN,THBS2,COL1A1)。這些差異基因在胃癌組織高度表達,且與胃癌患者不良預后具有密切關系,因此表明,這4 個基因可能在胃癌的發生發展中起關鍵作用。這些數據可能會為研究胃癌的潛在生物標志物和生物學機制提供一些有用的信息和方向。

猜你喜歡
胞外基質膠原胃癌
黃芪對細胞毒素相關蛋白A 誘導的大鼠系膜細胞外基質分泌的影響
碘-125粒子調控微小RNA-193b-5p抑制胃癌的增殖和侵襲
黑魚膠原溶液的流變、熱穩定性及化學交聯改性研究
基于“土爰稼穡”探討健脾方藥修復干細胞“土壤”細胞外基質紊亂防治胃癌變的科學內涵
脫細胞外基質制備與應用的研究現狀
青年胃癌的臨床特征
運動對衰老的骨骼肌中MMPs及TIMPs的影響
內鏡黏膜下剝離術在早期胃癌診療中的應用
胃癌組織中LKB1和VEGF-C的表達及其意義
響應面法優化可口革囊星蟲膠原抗氧化肽的制備研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合