?

整合生物信息學分析基底型乳腺癌的核心基因

2024-02-27 11:02曹家興劉九洋吳高松
醫學研究雜志 2024年1期
關鍵詞:黑色調控乳腺癌

曹家興 張 旺 劉九洋 吳高松

乳腺癌是世界范圍內最常見的惡性腫瘤之一,也是女性癌性死亡的主要原因[1]。GLOBOCAN 2020年統計數據顯示,全球女性乳腺癌新發病例為226萬例,死亡病例為68萬例,分別占女性癌癥新發和死亡病例的24.5%和15.5%[2]。乳腺癌是一種高度異質性疾病,基于分子表達差異可將其分為管腔上皮A型(Luminal A)、管腔上皮B型(Luminal B)、生長因子受體(HER-2)過表達型(HER-2 enriched)、基底型(basal-like breast cancer, BLBC)和正常乳腺樣型(normal-like)5種類型[3]。其中BLBC約占乳腺癌的15%,且具有發病年齡低、進展快、易轉移和預后差的特點[4]。此外,BLBC多表達基底細胞角蛋白CK5/17,而激素受體(hormone receptor,HR)、HER-2表達較低,故對內分泌治療、HER-2靶向治療反應較差[4, 5]。因此,探索BLBC核心基因對理解腫瘤進展、尋找新的治療靶點至關重要。

加權基因共表達網絡分析(weighted correlation network analysis, WGCNA)是一種尋找高度相關的基因模塊并將模塊與性狀關聯的生物學方法,已廣泛用于篩選核心基因和治療靶點[6]。腫瘤免疫浸潤數據庫TIMER2.0基于6種算法探索基因表達與免疫浸潤的關系,為探索腫瘤免疫浸潤提供了新思路[7]?;贕SE78958構建基因共表達網絡,篩選出在BLBC高表達并與生存相關的核心基因[8]。此外,利用多種生信工具分析了核心基因表達和免疫浸潤、免疫檢查點的相關性。探索BLBC預后相關的生物學標志物并分析其潛在機制將有助于靶向藥物的開發及提高患者的生存時間。

材料與方法

1.數據獲取與處理:首先,從基因表達數據庫(gene expression omnibus, GEO)下載GSE78958芯片數據,GSE78958由GPL571 [HG-U133A_2] Affymetrix Human Genome U133A 2.0 Array測序完成。然后對芯片數據進行基因注釋以獲得基因表達譜。最后,根據基因表達差異按照標準差從大到小排序,并提取樣本中差異最大的前50%基因進行下一步分析。

2.加權基因共表達分析:利用Sangerbox在線網站中的“WGCNA”工具剔除離群基因和樣本并構建無尺度共表達網絡,高度協同的基因被劃分為同一模塊[9]。然后將各個模塊與乳腺癌分型相關聯。選擇與BLBC相關性強的模塊繼續分析。

3.模塊基因功能富集分析:用R軟件包“clusterProfiler(version 3.14.3)”探索黑色模塊基因的生物學功能和信號通路。具體而言,設置P<0.01,并利用R包“ggplot 2”進一步篩選出前10個結果并對其進行可視化。

4.PPI網絡分析和核心基因的識別:為了進一步篩選核心基因,將黑色模塊基因上傳至STRING數據庫用于構建PPI網絡[10]。然后,將評分(0.4的差異基因納入Cytoscape(v3.9.1)軟件進行分析,利用插件cytohubba基于度算法提取黑色模塊中差異最大的10%基因[11]。根據cytohubba分析結果,黑色模塊中共80個基因作為候選基因繼續分析。接下來,利用bc-GenExMiner對候選基因進行生存分析和表達分析,以P<0.05為差異有統計學意義[12]。

5.免疫細胞浸潤分析:TIMER2.0免疫相關模塊可探究BLBC乳腺癌核心基因表達與免疫細胞浸潤的相關性?!澳[瘤純度”是該分析中的主要混雜因素。由于大多數免疫細胞類型與腫瘤純度呈負相關,研究選擇了“純度調整”選項,該選項使用Spearman偏相關性檢驗進行分析。

6.腫瘤免疫相關分析:腫瘤和免疫系統相互作用在癌癥的發生、發展和治療中起著至關重要的作用。TISIDB是腫瘤免疫系統相互作用的集成儲存庫門戶,可探索中樞基因表達和免疫抑制劑、免疫刺激劑和MHC分子及趨化因子之間的相關性[13]。

7.構建轉錄因子-核心基因調控網絡:為了探索調節中樞基因表達的轉錄因子(transcription factor, TF)并揭示它們的調節關系,借助Cytoscape插件iRegulon預測核心基因上游TF并構建基于核心基因和TF的調控網絡。

結 果

1.共表達網絡的構建和模塊的識別:對GSE78958進行基因注釋后,獲得424例乳腺癌患者表達數據和分子分型信息,其中Luminal A 226例,Luminal B 43例,Her-2過表達50例,BLBC 99例,normal-like 6例。提取方差較大的前50%(6717)基因進行WGCNA。通過平均連鎖聚類將具有相似表達模式的差異基因劃分為不同的模塊。選擇相關系數為0.87時的軟閾值5,設置模塊最小基因數為30,合并閾值為0.5。最終確定了14個模塊,其中灰色模塊是無法分配給任何的模塊基因集合。通過計算模塊與乳腺癌亞型的相關性,結果顯示黑色模塊與BLBC呈正相關且相關性最強(圖1)。因此,選擇黑色模塊作為BLBC的關鍵模塊進行下一步分析。

圖1 加權基因共表達分析

2.黑色模塊富集分析:接下來研究對黑色模塊基因進行GO(gene ontology)富集和KEGG(kyoto encyclopedia of genes and genomes)通路分析以探索其生物功能。就GO而言,生物過程(biological process, BP)主要富集于細胞周期、細胞分裂過程;細胞成分(cellular component, CC)多富集于染色質、微管等區域,而分子功能(molecular function, MF)主要富集于核苷酸結合、酶結合等(圖2中A、B、C)。此外,KEGG通路結果表明黑色模塊基因通過細胞周期和腫瘤通路等發揮作用(圖2D)。

圖2 黑色模塊基因GO富集分析和KEGG通路分析圖

3.PPI網絡構建及核心基因的識別:基于STRING數據庫和Cytoscape軟件,黑色模塊中總共891個基因被映射到PPI網絡中,包括812個節點和12050條邊。隨后,使用Cytoscape軟件中的cytohubba插件基于度排序,選擇PPI網絡中排名前10%的80個基因作為候選基因(圖3A)。為了進一步縮小范圍并驗證研究結果,使用bc-GenExMiner對候選基因進行生存分析和表達分析。結果表明,80個候選基因中7個與無病生存期(disease free survival, DFS)相關,僅ESPL1和CCNB2同時與BLBC總生存期(overall survival, OS)和DFS相關(圖3中B~E)。此外,表達分析表明,ESPL1和CCNB2在BLBC中表達高于其他分型(圖3中F、G)。研究還發現,兩個核心基因在BLBC中的表達水平彼此呈正相關,這表明兩者存在潛在的共同調劑網絡(圖3H)。因此,以上結果表明,ESPL1和CCNB2可作為BLBC的核心基因。

圖3 核心基因的識別和驗證

4.核心基因免疫細胞浸潤分析:為了確定核心基因表達和腫瘤免疫細胞浸潤之間是否存在相關性,通過TIMER分析了BLBC多種免疫細胞的浸潤水平。在兩個核心基因的表達水平和Th2細胞、CD8+T細胞正相關,與腫瘤相關成纖維細胞、內皮細胞呈負相關(圖4)。此外,TISIDB被用于檢測核心基因和免疫調節劑之間相互作用關系。ESPL1和CCNB2均與趨化因子(CCL7、CCL18、CXCL10)及免疫調節劑的表達呈正相關,包括免疫刺激因子(PVR、ULBP1)及MHC分子(TAP1、TAP2)和免疫抑制因子(LAG3),詳見圖5~圖7。

圖4 兩個核心基因表達水平與免疫細胞浸潤關系

圖6 乳腺癌中ESPL1的表達與免疫調節劑的關系

圖7 乳腺癌中CCNB2的表達與免疫調節劑的關系

5.核心基因上游轉錄調控網絡:最后,利用Cytoscape插件iRegulon構建了基于核心基因和上游TF的轉錄調控網絡。共有56個TF參與了ESPL1和CCNB2的調節。值得注意的是,其中22個TF參與兩者的共同調控。關注共同TF有助于理解BLBC進展中的激活表達模式(圖8)。

圖8 上游轉錄因子與兩個核心基因調控網絡

討 論

由于缺乏有效的治療靶點,BLBC極易轉移和復發,在所有亞型中預后最差[4, 5, 14]。目前BLBC的治療主要包括手術和放化療,迫切需要探索新的分子標志物和靶向藥物[14]。因此,本研究應用WGCNA、TIMER及TISDB等在線網站證實ESPL1和CCNB2在BLBC中高表達且與預后密切相關,并初步探索了兩者共同的潛在作用機制。

外紡錘體極體1(extra spindle poles-like 1, ESPL1)基因編碼的分離酶可切割姐妹染色體間的粘連蛋白RAD21促進染色體分離,此外,分離酶還參與 DNA損傷修復和包膜運輸過程[15,16]。ESPL1過表達導致基因突變和染色體錯誤分裂從而促使惡性腫瘤的發生[15,17]。近年來研究顯示,ESPL1與膠質瘤、子宮內膜癌的預后相關[16,18]。分離酶抑制物Sepins可通過非競爭性的方式抑制分離酶活性以及癌細胞生長、細胞遷移和傷口愈合[19]。

細胞周期蛋白2(cyclins B2, CCNB2)通過調節細胞周期蛋白依賴性激酶CDC2的活性調節有絲分裂G2/M周期轉變[20, 21]。CCNB2高表達與多種腫瘤的直徑、淋巴結轉移、遠處轉移及臨床分期呈顯著正相關[22]。此前研究證實,CCNB2過表達與多種惡性腫瘤的不良預后相關[23~25]。

有研究表明,細胞周期調控通路還與代謝重塑和免疫浸潤有關。筆者的分析結果也提示兩個核心基因表達與多種腫瘤免疫細胞浸潤呈正相關,包括Th2細胞、CD8+T細胞、巨噬細胞和調節性T細胞。此外,兩個核心基因轉錄表達水平均與趨化因子如CCL7、CCL10和CCL18呈正相關,其由腫瘤細胞分泌并將免疫細胞募集到腫瘤免疫微環境。免疫細胞成分很大程度上決定了微環境的炎性環境,并能調節腫瘤的進展。Th1/Th2比值升高提示著較好的預后,而Th2細胞升高與腫瘤轉移與較高的病死率有關[26]。Th2細胞可分泌IL-4、IL-5和IL-13促進腫瘤的轉移[27]。此外,Th2細胞還與腫瘤免疫逃逸相關[28]。相似的,調節性T細胞(regulatory cell,Treg)也可通過調節免疫監視并抑制抗腫瘤免疫反應促進腫瘤進展[27]。Treg水平升高與乳腺癌腫瘤患者疾病進展和生存期縮短有關[29]??傊?兩個核心基因可能通過BLBC免疫細胞浸潤過程調控腫瘤的進展及預后。

上游調控網絡分析提示22種TF同時靶向調節兩個核心基因,其中大多數TF在乳腺癌中高表達。這些上調的TF可能通過激活兩個核心基因調控BLBC細胞周期及免疫反應。借助生物信息學,初步證實ESPL1和CCNB2是BLBC潛在預后和治療靶點。同時,兩個基因受共同的上游TF的調控并與BLBC患者免疫狀態相關。

猜你喜歡
黑色調控乳腺癌
絕經了,是否就離乳腺癌越來越遠呢?
如何調控困意
經濟穩中有進 調控托而不舉
乳腺癌是吃出來的嗎
胸大更容易得乳腺癌嗎
別逗了,乳腺癌可不分男女老少!
黑色
順勢而導 靈活調控
黑色星期五
SUMO修飾在細胞凋亡中的調控作用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合