?

基于RRA算法和生物信息學分析鑒定BUB1B是膽管癌中的關鍵預后相關基因

2021-06-09 01:49金宗睿吳國林韋明奇覃勇輝徐邦浩郭雅王繼龍朱海文張
世界最新醫學信息文摘 2021年32期
關鍵詞:絲氨酸膽管癌差異基因

金宗睿,吳國林,韋明奇,覃勇輝,徐邦浩,郭雅,王繼龍,朱海,文張

(廣西醫科大學第一附屬醫院肝膽外科,廣西 南寧 530021)

0 引言

膽管癌是繼肝細胞癌之后第二常見的肝臟惡性腫瘤,其總發病率一直在增加。膽管癌的早期診斷十分困難,大多數患者在早期沒有表現出任何突出的臨床特征,因此被眾多患者診斷時已處于晚期階段[1]。盡管近年來膽管癌的治療和診斷有所改善,但患者的預后仍較差。肝內和肝外膽管癌的5年生存率僅為15%和30%[2]。因此,探索新的特異性預后生物標志物對于膽管癌的診治具有重要意義?;虮磉_數據目前已成為人類癌癥基因研究的重要工具, 公共數據庫平臺包含了基因表達芯片技術生成的大量數據,這些數據的整合分析將有助相關癌癥的研究。RobustRankAggreg(RRA)算法用于整合幾個可排序的基因數據集。它使用概率模型對所有元素進行顯著排序,是整合來自不同技術檢測平臺和樣本背景的數據分析結果的高效方法[3]。本研究基于膽管癌GEO數據庫篩選了與膽管癌相關的差異基因(differentially expressed genes, DEG),并通過生物信息學方法對其進行了全面分析。目的是為膽管癌的診斷和治療提供新的生物標志物,特別是重要的治療靶點。

1 材料和方法

1.1 基因表達譜數據源

NCBI-GEO是一個開放和免費的基因表達譜公共數據庫,從中我們獲得了膽管癌和正常膽管中GSE22633,GSE26566和GSE32225的 基 因 表 達 譜。GSE22633包 含了59個膽管癌樣本和4個正常培養的膽管上皮細胞樣本。GSE26566包含了104個新鮮冷凍的腫瘤樣本和6個正常肝內膽管樣本。GSE32225包含149個肝內膽管癌樣本和6個正常膽管上皮細胞樣本。數據情況如表1所示。使用分位數標準化進行數據標準處理。

1.2 篩選DEG和整合微陣列數據

使用R語言的limma軟件包分析三個基因表達微陣列數據集,并獲得每個數據集的DEG。P值<0.05且表達對數倍數變化(logFC)>1的樣品被認為是差異基因。

表1 數據分析

1.3 整合微陣列數據

我們使用R運行RRA軟件,集成三個數據集的差異分析結果。RRA方法在網絡中是公開可用的(http://cran.r-project.org/)。

DEGS中GO和KEGG路徑的富集分析

GO是注釋基因功能和鑒定基因獨特生物學特征的常用方法。KEGG是一個整合了基因組,化學和系統功能信息的數據庫。DAVID(https://david.ncifcrf.gov/)是一個在線分析網站,可以全面分析基因和蛋白質的功能。我們使用DAVID可視化BP,MF,CC和途徑的DEG富集(P<0.05)。

1.4 PPI網絡和模塊分析

檢索相互作用基因的工具(STRING,http://string-db.org/)是一種經常用于評估涉及基因的PPI的在線軟件工具。將STRING結果導入Cytoscape以可視化蛋白質相互作用網絡(相互作用物的最大數量=0,置信度得分≥0.4)。Cytoscape軟件中的MCODE應用程序用于通過拓撲方法分析PPI網絡模塊。

1.5 關鍵基因的預后分析和表達驗證

GEPIA是基于GTEx項目和TCGA的在線分析網站,其中包含數千個樣本數據。我們用它來分析和鑒定關鍵基因的預后和表達水平,P值設置為<0.05。

1.6 單基因GSEA分析

使用GSEA研究與膽管癌預后相關的單個基因的生物學功能和信號通路。χ2的分子特征數據庫(c2.all.v6.2.symbols.gmt)用于評估低風險組和高風險組之間的功能差異。GSEA中達到P值<0.05和FDR<0.25的富集基因集被認為是顯著的。單個基因表達數據來自TCGA數據庫,包括36例膽管癌標本。用單基因表達的中位數值劃分高表達組和低表達組。數據采集 和應用符合TCGA發布指南和數據訪問要求。

2 結果

2.1 膽管癌中DEG的鑒定

將膽管癌的表達譜數據GSE22633,GSE26566和GSE32225標準化,通過limma軟件包(P<0.05,| FC |>1)從GSE22633數據集中篩選總共4831個差異基因。其中篩選出2617個下調基因和2214個上調基因。從GSE22633數據集中篩選出1061個差異基因,包括845個上調基因和216個下調基因。從GSE26566數據集中篩選出2916個差異基因,包括1514個上調基因和1402個下調基因(圖1A,B,C)。使用RRA算法整合3個數據集的差異基因,然后每個差異基因進行排名。P值越小,基因差異表達的可能性就越大。我們獲得了共93個差異基因。42個上調基因和51個下調基因(P<0.05)。整合后前20個上調和下調基因的P值量熱圖如圖1D所示。

圖1

2.2 膽管癌的DEG基因本體論和KEGG途徑分析

GO分析結果表明,DEG的富集生物過程,主要包括血管發育和DNA復制的正調節,細胞外基質分解和膠原分解代謝過程的正調節,以及白細胞遷移和膠原原纖維組織的調節。對于分子功能方面,DEG富集到了甘油三酯脂肪酶活性,絲氨酸型內肽酶活性,蛋白質絲氨酸和蘇氨酸激酶活性,絲氨酸型肽酶活性和細胞外基質結構成分。此外,細胞成分分析顯示DEG富集了細胞外空間,細胞外區域,I型膠原三聚體和細胞外基質。KEGG信號通路分析顯示DEGs主要富集胰腺分泌,脂肪消化吸收,蛋白質消化吸收,細胞周期,氰基氨基酸代謝和甘油脂代謝(圖1E-H)。

2.3 PPI網絡和關鍵網絡分析

將總共 50個基因導入DEG PPI網絡復合物,其包括28個下調的基因和22個上調的基因(圖2A)。Cytotype中的MCODE模塊用于深入分析蛋白質網絡(圖2B)。我們獲得了具有七個節點的關鍵網絡,并且這七個節點處的基因在腫瘤中上調(圖2C)。

2.4 GEPIA分析關鍵基因

GEPIA用于鑒定七種關鍵基因的預后和表達水平。膽管癌中基因的表達高于正常組織(圖3A-G)。BUB1B是七個關鍵基因中顯著的預后基因(P<0.05,圖3H-N)。

圖3

圖2

2.5 GSEA用于預后相關基因

GSEA對BUB1B高表達組和低表達組的分析支持了DEGs功能富集的一些結果。細胞周期相關途徑和DNA復制相關途徑顯著富集(P<0.05和FDR<0.25,圖3O-T)。該結果表明BUB1B可能對這些功能和途徑具有顯著影響。

3 討論

膽管癌是源自膽管上皮細胞的惡性腫瘤。根據膽管樹的不同解剖位置,膽管癌分為肝內,肝門周圍和遠端膽管癌。膽管癌是一種預后很差的侵襲性腫瘤,急需更有效的診治手段?;诟咄繙y序數據的生物信息學在癌癥研究中發揮了重要作用,其可以篩選出在腫瘤生物學過程中關鍵的基因。RRA算法保證了來自于不同數據集的mRNA表達譜的一致性。本研究依據多個數據集篩選出膽管癌中了7個關鍵基因,其中BUB1B與膽管癌的不良預后顯著相關。7個關鍵基因GO和KEGG的分析結果中,都呈現了大量與細胞分裂周期相關的生理過程和功能,例如DNA復制,絲氨酸型內肽酶活性。這可能與膽管癌活躍的細胞復制有關,GSEA的分析結果也支持了這點。其中蛋白質絲氨酸或蘇氨酸激酶活性的功能富集驗證了BUB1B在膽管癌中的重要生物特性。

有絲分裂檢查點絲氨酸或蘇氨酸激酶B(BUB1B)是真核細胞分裂過程中控制染色體行為的重要基因。紡錘體組裝檢查點(SAC)通過確保下一代細胞正確接收兩個姐妹染色體中的一個,幫助防止真核細胞分裂過程中產生非整倍體[4,5]。非整倍性在腫瘤中十分常見,BUB1B參與調節SAC的生物學功能,通過抑制后期促進復合物/環狀體(APC/C),確保每條染色體的正確組裝[6,7]。在肺腺癌,膀胱癌,肝細胞癌中均發現BUB1B過表達[8]。整個染色體的丟失和增加可能是腫瘤細胞改變原癌基因和抗癌基因的重要變異原因[9]。BUB1B與CDC20基因相互作用并阻斷APC/C,從而影響CCNB在細胞有絲分裂期的穩定表達。而CCNB1和CNB2在癌細胞中上調并且與不良預后相關。

盡管有證據表明BUB1B與各種類型腫瘤的進展和預后相關,但其在膽管癌中的作用尚未見報道。因此,我們的研究為膽管癌的治療和評估提供了新的生物標志物。

4 結論

我們使用生物信息學研究了來自NCBI GEO的三個獨立數據集,并獲得了七個關鍵DEG(BUB1B,KIAA0101,CDT1,MCM4,ASF1B,CHEK1,NUSAP1)。在這些基因中,BUB1B被鑒定為與膽管癌的不良預后顯著相關。我們的研究可能為膽管癌的診斷和治療提供新的生物標志物,其中BUB1B可能是潛在的治療靶點。

猜你喜歡
絲氨酸膽管癌差異基因
肝吸蟲感染致膽管損傷及膽管癌的相關研究進展
水相法合成磷脂酰絲氨酸體系的優化研究
肝臟里的膽管癌
褐飛虱絲氨酸蛋白酶抑制劑基因Nlserpin2的克隆及其功能分析
絲氨酸的生理功能及其在豬生產中的應用研究進展
聯合半肝切除與圍肝門切除治療肝門部膽管癌的療效
D-絲氨酸在抑郁癥中的作用研究進展
B7-H4在肝內膽管癌的表達及臨床意義
基于RNA 測序研究人參二醇對大鼠心血管內皮細胞基因表達的影響 (正文見第26 頁)
紫檀芪處理對釀酒酵母基因組表達變化的影響
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合