?

加權基因共表達網絡分析慢性鼻竇炎伴鼻息肉發病機制

2022-07-27 09:35劉萌芷葉林峰
武漢大學學報(醫學版) 2022年5期
關鍵詞:鼻息肉鼻竇炎細胞因子

陳 哲 肖 偉 劉萌芷 彭 濤 葉林峰

武漢大學中南醫院耳鼻咽喉-頭頸外科 湖北 武漢 430071

加權基因共表達網絡分析(weighted gene co-expression network analysis,WGCNA)是一種分析多個樣本的基因表達模式的方法。主要采用將表達模式類似的基因進行聚類,形成一系列模塊(module),隨后將模塊與特定性狀或表型間的關聯進行進一步分析得到有生物學意義的數據。該分析方法通過尋找協同表達的基因模塊,計算基因網絡與關注的表型之間的相關度,發現網絡中的與其他基因連接度最高且與相應的臨床特征關系最為密切的核心基因(Hub genes)。本研究擬結合WGCNA 方法計算并篩選出慢性鼻竇炎伴鼻息肉發病過程中的關鍵模塊,挖掘核心基因。對核心基因進行基因本體分類(gene ontology,GO)分析和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析,了解其分子功能和生物學過程。

1 資料與方法

1.1 數據收集從美國國立生物信息技術中心(National Center for Biotechnology Information,NCBI)的基因表達綜合數據庫(Gene Expression Omnibus,GEO)網站下載表達譜數據GSE36830,數據集在Affymetrix 人類基因組U133 Plus 2.0 陣列平臺上執行。其中包含24 個樣本,正常對照組鉤突,慢性鼻竇炎不伴息肉組鉤突,慢性鼻竇炎伴息肉組鉤突及息肉各6 例樣本。

1.2 構建加權基因共表達網絡主要采用R 包“WGCNA”,依據使用要求并結合GSE36830 樣本基因表達及樣本分組相關數據進行分析。

1.2.1查看樣本數據的完整性,剔除離群值 為了避免離群值對后續計算的影響,在構建加權共表達網絡前需保證樣本數據的一致性,當樣本中存在顯著的離群值時將其剔除。采用WGCNA 包自帶函數驗證樣本的完整性,剔除存在過多缺失值和顯著脫離其他樣本的離群樣本。

1.2.2確定軟閾值、構建共表達矩陣及模塊識別WGCNA 算法采用相關系數加權值,使得網絡中的基因之間的連接服從無尺度網絡分布(scale-free networks)。利用“WGCNA”包中pickSoftThreshold函數來進行軟閾值(soft threshold power)的確定,本研究中將相關系數R2>0.9 作為確定軟閾值β的標準。采用一步法構建共表達矩陣,得到表達模式相似的模塊,并將其可視化。

1.2.3識別與臨床分組相關的模塊,核心基因篩選 分別計算不同模塊與各臨床分組間的相關性,從中篩選與相關疾病相關性高的模塊。計算被選中的模塊中的基因與臨床疾病的相關性,并依據模塊身份(module membership,MM)與基因顯著性(gene significance,GS)進一步篩選核心基因。以|MM|>0.8 且|GS|>0.2 作為標準篩選核心基因。

1.3 核心基因GO 分析對進一步篩選出的核心基因進行功能注釋,即GO 分析。分別從生物學過程(biological process,BP)、細胞成分(cellular component,CC)及分子功能(molecular function,MF)三個層面來分析核心基因的作用。本研究中采用R軟件中的“cluster Profiler”包對篩選的所有核心基因進行GO 富集分析。

1.4 核心基因KEGG 分析KEGG 是從分子水平,特別是以基因組測序以及其他高通量測序技術的結果建立的數據庫資源。KEGG 通路分析對分子間相互作用的網絡通路有較好的呈現。對上述篩選的模塊中的核心基因,利用R 軟件中的“Cluster Profiler”包進行KEGG 通路分析。

1.5 核心基因差異表達分析對篩選出的核心基因的表達量進行差異分析,采用R 軟件中limma 包篩選核心基因中差異表達的基因[1]。比較慢性鼻竇炎伴鼻息肉中息肉組織與其他各組鉤突組織的基因表達量。其中以表達量倍數(fold change,FC)為上 調 或 下 調 2 倍 即 |log2FC| ≥1,調 整 后P(adj.P)<0.05 作為存在差異表達的核心基因。

2 結果

2.1 構建無尺度網絡及模塊分類計算任意兩個基因間的相關系數,設置閾值進行篩選,使得基因之間的連接符合無尺度網絡分布。隨后將基因按表達模式進行模塊分類。以相關系數R2>0.9 為標準,選擇合適的軟閾值,本研究中的軟閾值β=3(圖1A、1B),并依據此值建立臨近矩陣及拓撲矩陣。當β=3 時,計算每個基因的連接度。在無尺度網絡中的連接度存在冪律分布,本研究中k 與p(k)之間存在負相關,因此構建的網絡符合無尺度網絡分布(圖1C、1D)。構建共表達矩陣后,可以發現所有基因依據其表達類型的相似性被歸為不同的模塊,共27 個模塊(圖1E)。

圖1 構建無尺度網絡及模塊分類

2.2 慢性鼻竇炎伴鼻息肉相關模塊的篩選依據模塊的特征向量,計算模塊與慢性鼻竇炎伴鼻息肉的關系,與之相關性最大的模塊為棕色模塊,共包含392 個基因,相關性為0.68(P<0.01)(圖2A)。同時將不同模塊基因特性與性狀進行聚類分析后,并進行熱圖可視化,也可發現慢性鼻竇炎伴鼻息肉與棕色模塊高度相關(圖2B)。隨后分別對所有模塊包含的基因與該模塊進行相關性分析,其中棕色的相關性仍為最高(圖2C)。以|MM|>0.8 及|GS|>0.2 作為棕色模塊中核心基因的篩選條件,共篩選出24 個基因(圖2D,右上象限)。

圖2 慢性鼻竇炎伴鼻息肉相關模塊的篩選

2.3 核心基因GO 分析對篩選出的核心基因進行GO 分析。其中BP 與細胞免疫關系密切,CC 顯示核心基因主要作用于細胞膜,MF 分析可看出核心基因與細胞因子、趨化因子的活性及相關受體等密切相關(圖3)。

圖3 GO 分析結果

2.4 核心基因KEGG 分析從KEGG 分析結果來看,核心基因主要作用于造血細胞譜系、病毒蛋白與細胞因子和細胞因子受體的相互作用、阿米巴病、細胞因子與細胞因子受體的相互作用、Th1 和Th2 細胞分化、緊密連接、JAK-STAT 信號通路、趨化因子信號傳導途徑等(圖4)。

圖4 KEGG 分析結果

2.5 核心基因的表達量差異分析通過R 軟件“limma”包對核心基因進行表達量差異分析后,以表達量差異倍數為2,調整后P<0.05(|log2FC|≥1,adj.P<0.05),共篩選出15 個差異表達的基因(CCL22、GFI1B、ITGAM、FCER2、CLEC4GP1、CD1E、ALPK2、VSTM1、AOC1、MGARP、IL2RA、COL6A5、CD1A、CLC、SIGLEC8)(圖5)。

圖5 棕色模塊核心基因中差異表達基因的表達量熱圖

3 討論

慢性鼻竇炎(chronic rhinosinusitis,CRS)是耳鼻咽喉頭頸外科臨床常見疾病之一。流行病學調查顯示我國慢性鼻竇炎總體患病率約為8.0%,影響了約1.07 億人,帶來了嚴重的經濟及社會負擔[2]。慢性鼻竇炎伴鼻息肉(chronic rhinosinusitis with nasal polyps,CRSwNP)是慢性鼻竇炎的一種常見類型,患者臨床癥狀一般較重,相較于不伴鼻息肉的慢性鼻竇炎患者,術后復發相對較高。由此可以推斷慢性鼻竇炎不同的臨床分型其內在的分子生物學機制可能存在差異。針對不同疾病類型的患者進行個體化的醫療過程的精準醫療將會成為疾病治療的趨勢。精準醫學的發展離不開基因測序技術快速進步以及生物信息與大數據科學的交叉應用。生物信息學技術可以從數量巨大的測序數據中對有效數據進行整合及分析,計算出可能在生理和病理過程中發揮重要生物學功能的數據。

采用生物信息學方法挖掘慢性鼻竇炎伴鼻息肉的關鍵基因能為疾病的發病機制的研究提供新的思路。WGCNA 算法被應用在多種疾病中應用廣泛,如肺癌[3]、乳腺癌[4]及變應性鼻炎[5]等。本文通過WGCNA 方法分析出在慢性鼻竇炎伴鼻息肉中存在顯著生物學意義的基因,篩選出在該疾病表型中表達模式類似的基因模塊,并通過進一步的篩選,找出模塊中的核心基因。通過對核心基因進行GO 分析,可以看出核心基因主要作用于細胞膜,與細胞免疫關系密切,通過調節細胞因子、趨化因子的活性及相關受體等發揮生物學作用。KEGG 分析則可以預測慢性鼻竇炎伴鼻息肉的發生可能與細胞因子與細胞因子受體的相互作用、Th1 和Th2細胞分化、緊密連接、JAK-STAT 信號通路、趨化因子信號傳導途徑密切相關。

對核心基因進行更進一步表達量分析,發現15個在慢性鼻竇炎伴鼻息肉組與其他組間存在顯著表達差異的基因。其中CCL22、ITGAM、CD1A、CLC、SIGLEC8 參與了慢性鼻竇炎的發病過程[6-9]。而尚未發現GFI1B、FCER2、CLEC4GP1、CD1E、ALPK2、 VSTM1、 AOC1、 MGARP、 IL2RA、COL6A5 在該疾病中的相關研究。進一步的文獻研究發現GFI1B 是造血系統的關鍵調節因子[10];FCER2 編碼IgE 受體亞單位,可影響血清總IgE 水平[11];ALPK2 與心肌細胞及某些腫瘤關系密切[12];VSTM1 與白血病等有關[13];IL2RA 作用于T 細胞活化過程[14];MGARP 在類固醇生成組織和視覺系統中高度豐富;AOC1(ABP1)與組胺的產生及降解等 相 關[15];COL6A5 與 特 應 性 皮 炎 關 系 密 切[16]。CLEC4GP1 目前研究較少,可能與膠質母細胞瘤相關[17]。從相關基因在其他疾病中的研究可以推測大部分基因與造血細胞及免疫系統密切相關,與KEGG 預測的結果有較好的一致性。

綜上,可以推測加權基因共表達網絡分析可以通過相關計算,挖掘出在慢性鼻竇炎伴鼻息肉發病機制中可能存在重要生物學意義的新基因,并可以初步推斷出相關基因可能的作用機制,并從其他學者的研究中證實了相關基因的功能。在后續的工作中需進一步對上述未在慢性鼻竇炎伴鼻息肉中得到充分研究的相關基因進行探索。

猜你喜歡
鼻息肉鼻竇炎細胞因子
鼻內鏡手術聯合藥物治療慢性鼻竇炎伴鼻息肉的臨床療效
鼻內鏡手術治療老年慢性鼻竇炎鼻息肉的療效及安全性探討
成人HPS臨床特征及多種細胞因子水平與預后的相關性
鼻息肉到底要不要切
抗GD2抗體聯合細胞因子在高危NB治療中的研究進展
保守與手術治療鼻咽癌放療后慢性鼻-鼻竇炎的療效比較
抗生素(阿奇霉素)與鼻竇炎口服液治療小兒慢性鼻竇炎的效果觀察
慢性鼻-鼻竇炎患者血清IgE、IL-5及HMGB1的表達及其臨床意義
謹防鼻息肉術后復發
鼻炎通治療慢性副鼻竇炎128例
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合