?

生物信息學方法分析CLDN9基因在子宮內膜癌中表達對生存率的影響

2023-06-05 02:01諸充康樂瞿曉燕楊尚閆薔許浩宇和斌
東南大學學報(醫學版) 2023年2期
關鍵詞:內膜通路樣本

諸充,康樂,瞿曉燕,楊尚,閆薔,許浩宇,和斌,

(同濟大學1.附屬楊浦醫院臨床研究與轉化醫學中心,2.附屬第一婦嬰保健院生殖醫學中心,上海 200120)

近年來,子宮內膜癌(uterine corpus endometrial carcinoma,UCEC)的發病率逐年升高,UCEC是發達國家最常見的婦科癌癥,在發展中國家發病率僅次于宮頸癌[1]。目前對UCEC的治療提倡早期診斷、早期治療,晚期UCEC患者的治療效果和預后情況并不樂觀[2]。因此,探索UCEC新的預后指標及治療靶點具有重要的臨床意義。腫瘤微環境(tumor microenvironment,TME)是近年來的研究熱點,指由細胞外可溶性化合物、基質細胞、免疫細胞、腫瘤細胞組成的復雜生態系統[3-5],與腫瘤有著密切關系,是腫瘤細胞的“庇護所”,其中的各種成分與腫瘤細胞的增殖、侵襲等有著密切關系[6-8],從而影響癌癥的發生發展。因此,通過靶向調節癌基因和相關信號通路來重塑TME成為了治療腫瘤的新策略。在本研究中,我們通過R軟件對TCGA數據庫中UCEC樣本的基因表達數據進行挖掘分析,鑒定出與UCEC的免疫微環境相關的關鍵基因,分析其與UCEC的臨床病理特征、生存預后、TME中的免疫細胞浸潤的關系,探尋潛在的分子機制以及UCEC腫瘤免疫治療的新靶點,提高其診治率。

1 資料與方法

1.1 資料

從UCEC XENA(https:∥xena.ucsc.edu/)數據庫下載TCGA數據庫中UCEC組織和正常子宮內膜組織的基因表達、臨床特征和生存數據。

1.2 方法

主要通過R軟件(4.2.1版本)進行統計分析、可視化分析。

1.2.1 分析鑒定差異基因(differentially expressed genes,DEGs)、GO/KEGG富集分析 通過R軟件中Estimate包(1.0.13版本)對腫瘤樣本免疫浸潤、腫瘤純度進行評分,以樣本的免疫細胞與基質細胞綜合評分(ESTIMATE Score)的中位值將樣本分為ESTIMATE Score高、低兩組。以DESeq2包版本(1.36.0版本)、tidyvers包(1.3.2版本)計算組間DEGs,兩組DEGs取并集。通過org.Hs.eg.db包(3.15.0版本)、clusterProfiler包(4.4.4版本)對DEGs進行GO/KEGG富集分析。

1.2.2 加權基因共表達網絡分析(WGCNA)富集分析、鑒定關鍵基因 通過R軟件中WGCNA包(1.71版本)對DEGs進行聚類分析,分析聚類的基因模塊中基因與UCEC的病理分級、患者生存時長之間的關系。通過DESeq2包(1.36.0版本)、tidyverse包(1.3.2版本)分析關鍵基因在UCEC組織和正常內膜組織中的表達水平,結合基因表達水平和在UCEC、正常內膜組織中差異表達程度確定目的基因。

1.2.3 分析目的基因與UCEC的病理特征、患者生存的關系 以目的基因的表達水平(FPKM值)的中位值為界值,將UCEC樣本分為目的基因表達高、低兩組。分析不同分期(Ⅰ、Ⅱ、Ⅲ、Ⅳ期)、分級(1、2、3、高級別)的UCEC中目的基因的表達水平差異。LinkedOmics(http:∥linkedomics.org/login.php)數據庫下載不同組織學分型的UCEC中目的基因的表達數據,并進行分析,以上分析結果通過ggplot2包(3.3.6版本)可視化。

1.2.4 生存曲線 以目的基因在UCEC中表達水平(FPKM值)的1/4界值將樣本分為兩組,survival包(3.3-1版本)對兩組的生存資料進行分析并可視化。

1.2.5 GSEA富集分析、構建目的基因蛋白互作網絡 GSEA官網(https:∥www.gsea-msigdb.org/gsea/index.jsp)下載msigdb_v7.5.1_GMTs文件,應用org.Hs.eg.db包(3.15.0版本)、clusterProfiler包(4.4.4版本)進行GSEA富集分析,結果通過enrichplot包(1.16.1版本)進行可視化。String數據庫(https:∥cn.string-db.org/)構建目的基因蛋白互作網絡。

1.2.6 免疫浸潤分析 依據目的基因表達水平(FPKM值)的中位值將UCEC分為高、低表達組,分析兩組的免疫評分(Immune Score)、基質評分(Stromal Score)、腫瘤細胞豐度(Tumor Purity)的差異。TISIDB官網(http:∥cis.hku.hk/TISIDB/index.php)下載TILs.txt文件整理為cellMarker文件,通過GSVA包(1.44.2版本)對兩組進行定量免疫浸潤分析,結果通過ggplot2(3.3.6版本)可視化。通過Corrplot包(0.92版本)分析目的基因的表達與免疫細胞浸潤水平的相關性并進行可視化。

2 結 果

2.1 DEGS的鑒定及GO/KEGG富集分析

樣本由533個UCEC樣本、35個正常內膜組織樣本的基因表達數據組成。ESTIMATE包計算得到UCEC樣本的ESTIMATE Score區間,為-3 205.840 811~3 976.557 046。以ESTIMATE Score的中位值(-614.951 2)分組,計算組間DEGs(log2FoldChange絕對值>1,P<0.05)取并集,得到1 068個DEGs。對DEGs進行GO功能注釋和KEGG途徑富集分析。GO功能分析結果顯示,DEGs在生物過程(BP)方面主要富集在白細胞介導的免疫、細胞活化正向調節、白細胞-細胞黏附、單核細胞分化、淋巴細胞介導的免疫反應、T細胞活化調節、免疫效應過程的調節、白細胞增生、細胞殺傷等通路上;在細胞成分(CC)方面主要富集在質膜外側、細胞外基質、內吞小泡等通路及MHC蛋白復合體、內質網膜腔側等;分子功能(MF)方面主要富集在免疫受體活性、碳水化合物結合、細胞因子結合、細胞因子受體活性、趨化因子受體結合、趨化因子活性、MHC蛋白復合物結合、G蛋白-偶聯化學吸引受體活性、趨化因子受體活性,見圖1。KEGG分析結果顯示,DEGs主要富集在細胞因子-細胞因子受體相互作用、趨化因子信號通路、細胞黏附分子、病毒蛋白與細胞因子和細胞因子受體的相互作用、細胞吞噬體等信號通路上,見圖2。

圖1 GO富集分析

圖2 KEGG富集分析

2.2 WGCNA聚類分析結合UCEC和正常內膜組織基因表達水平確定目的基因CLDN9

為了找出與UCEC的病理特征及患者生存相關的DEGs,對1 068個DEGS進行WGCNA,得到10個基因模塊。其中包含77個DEGs的棕色(brown)模塊與UCEC的分期、分級、生存時間顯著相關(圖3)。進一步分析這77個DEGs在UCEC、正常內膜組織中的表達水平,DESeq2包對這77個DEGs差異分析的結果中baseMean值前10位基因為CLDN6、HMGA2、SST、FBN3、EGFL6、CLDN9、NKAIN4、PNMA3、CRTAC1、CTCFL(表1)。綜合考慮目的基因表達水平和在UCEC、正常內膜組織中差異表達程度,我們將CLDN9作為研究對象,對CLDN9在537個UCEC樣本和35個正常內膜組織樣本表達水平進行分析后發現CLDN9在UCEC組織中的表達水平顯著升高(圖4)。

A.最佳軟閾值(Soft Threshold)的確定

D.不同基因模塊與腫瘤分期、分級、生存的相關性圖3 WGCNA富集分析

表1 UCEC和正常內膜組織中baseMean值前10 位基因

圖4 CLDN9在UCEC和正常內膜組織中的表達情況

2.3 CLDN9與UCEC病理特征、患者生存時間的相關性

為了進一步分析CLDN9與UCEC病理特征的相關性,我們將UCEC樣本按照分期(Ⅰ、Ⅱ、Ⅲ、Ⅳ期)、分級(1、2、3、高級別)進行分組。并對各組中CLDN9的表達水平進行了分析統計可視化(圖5),結果顯示不同分期、分級的UCEC組織間CLDN9的表達差異顯著,與病理分級呈正相關(P<0.05)。我們還通過LinkedOmics數據庫下載了不同組織學分型的UCEC中CLDN9的表達數據,并通過ggplot2包進行可視化,結果顯示CLDN9在子宮內膜樣子宮內膜腺癌、漿液型和子宮內膜型混合、漿液性子宮內膜腺癌中的表達差異具有統計學意義,其中漿液性子宮內膜腺癌中CLDN9的表達水平最高(圖6)。接著我們分析統計UCEC患者的生存數據,并以患者CLDN9的表達水平的中位值(1.203 173)為界值將患者分為CLDN9高、低表達組,構建兩組患者的生存曲線(圖7),結果顯示CLDN9高表達組的生存比率顯著低于低表達組(P<0.05)。

a P<0.05;b P>0.05圖5 不同分期、分級UCEC中CLDN9的表達水平

a P<0.05;b P>0.05圖6 不同組織學類型的UCEC中CLDN9的表達水平

圖7 CLDN9的表達水平與UCEC患者生存期的關系

2.4 CLDN9相關的蛋白互作網絡

為了了解CLDN9在子宮內膜癌TME及免疫浸潤中可能存在的調控機制及相關蛋白,我們基于String數據庫對CLDN9為核心的蛋白網絡進行了預測(圖8),與CLDN9存在互作可能的相關蛋白包括OCLN、TJP3、CLDN23、CLDN10、CLDN22、CLDN12、TJP1、CLDN16、CLDN11、CLDN1。

圖8 CLDN9蛋白互作網絡

2.5 GSEA富集分析

以腫瘤樣本中CLDN9的表達水平(FPKM值)的中位值(1.203 173)作為界值,將樣本分為CLDN9高、低表達組,分析鑒定組間DEGs(log2FoldChange絕對值>0,P<0.05),對得到的DEGs進行GSEA基因集富集分析。結果顯示CLDN9高表達組DEGs主要富集在KRAS基因(KRAS基因是一種在腫瘤細胞生長以及血管生成等過程的信號傳導通路中起著重要調控作用的基因)激活下調的信號通路、骨骼肌發育、雄性配子(精子)發生相關信號通路以及免疫相關的外周血中抑制CD8+T細胞免疫反應的生物學通路,CLDN9低表達組DEGs主要富集在異生代謝、脂肪酸代謝、雄激素反應相關信號通路中(圖9)。

圖9 CLDN9的GSEA富集分析結果

2.6 UCEC中CLDN9與免疫細胞浸潤的關系

為了進一步了解CLDN9表達與UCEC免疫微環境之間的關系,通過CLDN9表達水平的中位值將樣本分為CLDN9高、低表達組,分析兩組的免疫評分(Immune Score)、基質評分(Stromal Score)、腫瘤細胞豐度(Tumor Purity)的差異性(圖10)。在R中通過GSVA包對UCEC中28種免疫細胞的浸潤情況進行了計算分析,以CLDN9表達水平的中位值為界值分組,分析兩組間免疫細胞浸潤情況的,結果顯示CLDN9的低表達組有著更高的免疫細胞浸潤水平,差異具有統計學意義(P<0.05),包括被激活的CD4+細胞、CD8+T細胞、CD56自然殺傷細胞、未成熟樹突狀細胞、巨噬細胞、肥大細胞以及2、17型輔助T細胞。尤其是CD4+、CD8+T細胞浸潤水平增高在腫瘤免疫治療中具有重要意義(圖11)。

圖10 CLDN9的表達與免疫、基質評分以及腫瘤細胞豐度的關系

圖11 CLDN9表達與UCEC腫瘤微環境中CD4+、CD8+ T細胞浸潤水平的關系

3 討 論

UCEC起源于子宮內膜,是全球常見的婦科惡性腫瘤[9],雖然早期UCEC的治療效果比較好,但因復發率高、死亡率高,UCEC的整體預后仍然較差[10]。因此,研究UCEC預后相關分子及免疫治療靶點具有深刻的意義。

TME在腫瘤發生的開始和發展中發揮不可忽視的作用。腫瘤的免疫療法通過調節抗原釋放、抗原呈遞、抗原識別和免疫細胞運輸來增強抗腫瘤免疫反應改善癌癥患者的預后。然而,TME中的多種成分可能通過缺氧、代謝功能障礙、免疫細胞表型轉移和腫瘤來源的外泌體等途徑形成免疫抑制微環境[11-14],導致腫瘤細胞的免疫逃逸,從而促進腫瘤進展。

CLDN9是屬于Claudin蛋白家族的一種細胞黏附因子,Claudins蛋白是膜蛋白和細胞間緊密連接鏈的組成部分。緊密連接鏈可作為物理屏障,防止溶質和水自由通過上皮或內皮細胞片之間的細胞旁空間,并且在維持細胞極性和信號轉導方面也起著關鍵作用。CLDN9蛋白是丙型肝炎病毒侵入肝細胞的輔助因子之一[15-16]。Zhu等[17]研究發現CLDN9在宮頸癌組織及癌旁組織的表達水平發生改變,與宮頸癌的淋巴轉移相關。Hong等[18]發現CLDN9的過表達與垂體瘤癌細胞的侵襲性有關。Zavala-Zendejas等[19]研究發現過表達CLDN9可以增強AGS細胞(胃腺癌細胞系)的侵襲性、遷移性和增殖率。我們的富集分析結果顯示,CLDN9高表達組的DEGs被富集在KRAS基因激活的相關通路、骨骼肌發育等相關通路上,低表達組DEGs富集在異生代謝、脂肪酸代謝、雄激素反應代謝通路中,尤其是在免疫學相關通路中,CLDN9高表達組的DEGs富集在外周血中抑制CD8+T細胞免疫反應的生物學通路上。

在本研究中,我們通過生物信息學分析的方法發現CLDN9與UCEC病理特征、生存預后、免疫浸潤密切相關。我們的結果顯示,隨著UCEC的進展,CLDN9的表達水平呈增高趨勢,在3種組織學分型的UCEC中,漿液性子宮內膜腺癌中CLDN9表達水平相對更高。CLDN9的高表達水平對UCEC患者的生存及預后是一種不利因素。CLDN9在UCEC中的表達與免疫細胞CD4+、CD8+T細胞的浸潤呈負相關,CD4+、CD8+T細胞在TME中的抗腫瘤作用是眾所周知的,因此我們推測CLDN9在UCEC的TME中會減弱免疫細胞對腫瘤殺傷作用。

我們對UCSC Xena數據庫中整合的TCGA UCEC樣本進行分析鑒定,得到與UCEC的分期、分級、患者生存相關聯的基因CLDN9。進一步分析發現,CLDN9的表達與UCEC的TME相關聯。我們的分析結果顯示,CLDN9的表達與UCEC的發生、發展呈正相關,與腫瘤中免疫細胞的浸潤呈負相關。因此,CLDN9可能成為一種新的UCEC生物學標志物及腫瘤免疫治療新靶點。

猜你喜歡
內膜通路樣本
用樣本估計總體復習點撥
推動醫改的“直銷樣本”
隨機微分方程的樣本Lyapunov二次型估計
村企共贏的樣本
子宮內膜癌組織URG4表達及其臨床意義
Kisspeptin/GPR54信號通路促使性早熟形成的作用觀察
proBDNF-p75NTR通路抑制C6細胞增殖
通路快建林翰:對重模式應有再認識
Hippo/YAP和Wnt/β-catenin通路的對話
豬子宮內膜炎的防治
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合