?

基于生物信息學分析探討CD59在肺癌中的表達及其臨床意義

2022-11-05 09:06王衛東董婧珂龔永生金艷霞
生命科學研究 2022年4期
關鍵詞:位點氨基酸肺癌

王衛東,董婧珂,龔永生,孫 慧,王 潔,金艷霞*

(1.湖北師范大學生命科學學院食用野生植物保育與利用湖北省重點實驗室特色野菜良種繁育與綜合利用湖北省工程技術研究中心生物學國家級實驗教學示范中心,中國湖北 黃石 435002;2.南京醫科大學附屬蘇州醫院,中國江蘇 蘇州 215008;3.武漢大學生命科學學院,中國湖北 武漢 430072;4.華中科技大學同濟醫院,中國湖北 武漢 430030)

肺癌具有高度侵襲性和轉移性,是發病率和死亡率很高的惡性腫瘤[1]。肺癌主要分為非小細胞肺癌(non-small cell lung cancer,NSCLC)和小細胞肺癌(small cell lung cancer,SCLC),其中NSCLC約占肺癌數目的85%[2]。根據組織亞型,NSCLC主要分為肺腺癌(lung adenocarcinoma,LUAD)、肺鱗癌(lung squamous cell carcinoma,LUSC)和大細胞癌(large cell carcinoma,LCC)三類。約70%肺癌患者確診時已有局部或遠處轉移,失去根治性治療機會,預后差;而早期NSCLC患者手術治療后5年生存率可達到80%左右[3],因此,早診早治可顯著提高肺癌患者的生存率。

臨床上肺癌篩查常見的血清腫瘤標志物有癌胚抗原(carcinoembryonic antigen,CEA)、鱗狀細胞抗原(squamous cell carcinoma antigen,SCCA)和細胞角蛋白19片段(cytokeratin 19 fragment,CYFRA21-1)等,但總體上現有診斷技術的靈敏度和特異性效果還不理想,并且在肺癌早診應用中還有一定的局限性,因此,迫切需要高效、靈敏的早診標志物用于肺癌篩查。

腫瘤抗原對腫瘤診斷和治療具有重要作用。臨床上可聯合多種血清腫瘤標志物用于腫瘤的早期診斷以及確定腫瘤亞型,如:人附睪蛋白4(human epididymis protein 4,HE4)和 CYFRA21-1 及胃泌素釋放肽前體(pro-gastrin releasing peptide,ProGRP)聯合有望區分肺癌和良性疾病,以及區分肺癌組織亞型[4]。肺癌早期患者的免疫系統識別腫瘤細胞表面相關抗原并產生自身抗體,這種自身抗體在血液中能長時間穩定存在[5],可作為早期肺癌篩查標記物[6]。Pei等[7]用血清學cDNA表達文庫(serological analysis of recombinant cDNA expression libraries,SEREX)和Oncomine數據庫分析鑒定了腫瘤自身抗體anti-TOP2A和anti-ACTR3,并用酶聯免疫吸附試驗(enzyme linked immunosorbent assay,ELISA)對其進行了檢測,發現它們診斷早期肺癌的曲線下面積(area under the curve,AUC)分別為0.758和0.787,可作為早期肺癌血清標志物。Jiang等[8]報道,新型的自身抗體用于早期肺癌免疫診斷具有高效性。此外,在肺癌早期中,與免疫相關的分子也發生變化,Ye等[9]通過對早期NSCLC血清中外周血白細胞進行轉錄組測序分析發現,與免疫相關的分子即酸性糖蛋白1(alpha-1-acid glycoprotein 1,AGP1),在早期NSCLC的診斷中效果較好,且酸性糖蛋白與轉化生長因子-β(transforming growth factor-β,TGF-β)聯合診斷可有效區分IA期NSCLC患者和健康對照者,AUC為0.985。因此,腫瘤免疫診斷有潛力作為靈敏檢測早期NSCLC的有效方法。

基于前期測定的早期NSCLC患者外周血中白細胞的轉錄組數據[9],本研究進行了深入挖掘,采用GO注釋分析了參與免疫應答過程的差異表達基因(differentially expressed genes,DEGs),篩選出免疫相關分子CD59,并利用Oncomine、GEPIA、UniProt、COMSIC、SWISS-MODEL、STRING 和Kaplan-Meier Plotter等數據庫分析了CD59在肺癌中的表達、蛋白質結構變化及其與患者生存之間的關系,為探索CD59參與肺癌發生機制和預后判斷提供了參考依據。

1 方法

1.1 轉錄組數據分析

本研究所用的早期NSCLC患者外周血中白細胞的轉錄組測序數據已提前發表,具體見參考文獻[9]。測序后的RNA-seq reads數目用TopHat(v2.0.10)與人的基因組進行比對,再用Cufflinks軟件(v2.1.1)分析DEGs。人參考基因組(GRCh38)及其注釋文件從Ensembl網站(http://www.ensembl.org/index.html)下載?;虮磉_的相對轉錄本豐度用FPKM(fragments per kilobase of exon model per million mapped fragments)來表征。

1.2 生物信息分析

將DEGs進行GO(Gene Ontology)功能注釋(http://wego.genomics.org.cn/document),分析轉錄組測序數據中參與免疫相關功能的差異表達分子;利用Oncomine(https://www.oncomine.org/resource/login.html)和GEPIA數據庫(http://gepia.cancer-pku.cn)分析CD59在肺癌組織中的mRNA表達變化[10];利用COSMIC數據庫(http://cancer.sanger.ac.uk,GRCh38 COSMIC v92)分析CD59在肺癌中的突變位點;運用SWISS-MODEL WORKSPACE(http://swissmodel.expasy.org)和SPDBV軟件(https://www.expasy.org/resources/swiss-pdbviewer)同源建模并分析CD59蛋白的3D結構;運用STRING數據庫(https://string-db.org/cgi/input.pl)分析CD59蛋白與其他蛋白質的相互作用;運用Kaplan-Meier Plotter數據庫(https://kmplot.com/analysis/)分析CD59表達與肺癌患者的生存關系。P<0.05表示有統計學意義。

1.3 免疫印跡分析

收集5例健康樣本、6例良性疾病患者和9例術前NSCLC IA期患者的血清,用于CD59蛋白表達水平的驗證。所有樣本依據南京醫科大學倫理委員會批準采集,樣本信息見表1。NSCLC患者通過低劑量計算機斷層掃描(low-dose computed tomography,LDCT)和組織病理學分析確診,肺癌患者分期按照國際肺癌研究協會(International Association for the Study of Lung Cancer,IASLC)的第八版TNM分期系統進行分級。采集血液2 mL后靜置,4℃400g離心20 min,將血清分裝至每管200 μL,立即凍存于-70℃備用,每份血清在使用前不超過兩次凍融。

表1 實驗涉及的樣本信息Table 1 The information of samples used in this study

在肺癌患者手術中收集4對組織標本,采集的癌旁組織距離癌組織2 cm,標本采集后液氮速凍,立即置于-70℃凍存備用。組織標本先在6孔板中用滅菌的剪刀剪碎,加入含苯甲基磺酰氟(phenylmethylsulfonyl fluoride,PMSF)(Sigma-Aldrich公司,德國)的RIPA裂解液和陶瓷珠,在全自動樣品快速研磨儀中研磨5次,每次60 s。冰上放置30 min后,12 000 r/min離心10 min,收集的上清液即為組織勻漿的蛋白質提取物。

用BCA(bicinchoninic acid)蛋白質定量試劑盒(ThermoFisher公司,美國)于OD562nm處測定蛋白質濃度。15 μg組織裂解液或5 μg稀釋的血清蛋白質上樣至15%十二烷基硫酸鈉-聚丙烯酰胺凝膠中進行電泳(SDS polyacrylamide gel electrophoresis,SDS-PAGE),電泳結束后,將凝膠中的蛋白質條帶轉移到聚偏氟乙烯[poly(1,1-difluoroethylene),PVDF]膜(Merck Millipore 公司,德國)上,300 mA電流下轉膜45 min,再將PVDF膜用5%脫脂牛奶室溫封閉1 h。洗膜3次后,室溫下分別孵育CD59抗體(1∶2 000稀釋,武漢三鷹生物技術有限公司)和GAPDH抗體(1∶10 000稀釋,武漢三鷹生物技術有限公司)1 h;洗膜5次,室溫孵育辣根過氧化物酶(horseradish peroxidase,HRP)標記的羊抗兔IgG二抗(1∶5 000稀釋,武漢三鷹生物技術有限公司)或羊抗鼠IgG二抗(1∶5 000稀釋,武漢三鷹生物技術有限公司)1 h;洗膜5次后,用ECL化學發光試劑(Bio-Rad公司,美國)顯影,最后用Vilber FUSION FX7化學發光成像儀拍照。蛋白質條帶用Image J軟件進行灰度分析,用GraphPad Prism軟件(v8.0)進行數據統計,P<0.05表示有統計學意義。

2 結果

2.1 GO功能注釋分析肺癌中差異表達的免疫相關分子

轉錄組測序的原始數據用TopHat與人的基因組(GRCh38)進行比對,比對后的數據用Cufflinks軟件進行DEGs分析。分析結果顯示:共比對到64 233個基因,其中可信基因有26 638個(FPKM>0);依據|log2(肺癌組FPKM/健康組FPKM)|≥1,DEGs有5 676個(表2),其中297個基因是健康組特異性表達的,222個是患者組中特異性表達的;2 184個基因在早期患者中表達上調,2 973個基因在早期患者中表達下調。

表2 轉錄組測序的差異表達基因分析Table 2 Analysis of DEGs by transcriptome sequencing

將差異表達的5 676個基因進行GO功能注釋,分析早期NSCLC患者白細胞轉錄組數據中參與免疫應答過程的差異表達分子。結果顯示,一共鑒定到358個免疫相關分子。這些差異表達的免疫相關分子主要參與免疫應答(immune response)、淋巴細胞刺激(lymphocyte costimulation)、免疫系統發育(immune system development)、淋巴細胞激活(leukocyte activation)、免疫應答過程(immune effector process)和免疫反應激活(activation of immuneresponse)等生物過程(圖1)。

圖1 GO功能注釋分析與免疫功能相關的差異表達分子Fig.1 GO functional annotation analysis of differentially expressed molecules involved in immune-related functions

2.2 CD59在肺癌中的表達

由于外周血白細胞中中性粒細胞約占50%,因此,根據GO注釋、有無商業化抗體以及是否利于腫瘤免疫診斷的血液學檢查,我們篩選了與中性粒細胞功能相關的顯著差異表達的CD59糖蛋白,其在肺癌患者外周血白細胞中表達下調,log2(肺癌組 FPKM/健康組 FPKM)值為-2.079 32。運用Oncomine數據庫分析CD59在癌癥中的表達,通過設定閾值和統計分析的P值,我們發現在6種比較類型中,CD59在肺癌組織中的表達都顯著下降(圖2A和表3)。進一步的GEPIA數據庫分析顯示,CD59在肺鱗癌(LUSC)組織中的表達顯著降低,在肺腺癌(LUAD)組織中的表達有降低趨勢(圖2B)。

表3 Oncomine數據庫分析CD59在肺癌中的表達Table 3 Analysis of the CD59 expression in lung cancer with Oncomine database

圖2 運用Oncomine和GEPIA數據庫分析CD59在肺癌中的表達(A)Oncomine數據庫分析CD59在不同癌癥中的表達。黃色表示CD59 mRNA在腫瘤中過表達,藍色表示CD59 mRNA在腫瘤中表達下降。分析類型:腫瘤組vs.正常組;P值閾值:1E-4;變化倍數閾值:2;基因排名閾值:前10%;數據類型:All;(B)GEPIA數據庫分析CD59 mRNA在肺癌組織中的表達。紅色表示腫瘤組織(T),灰色表示正常組織(N)。|log2(變化倍數)|閾值:1;P值閾值:0.01;log scale:是,用log2(TPM+1)表示;Jitter大小:0.4;匹配正常數據:匹配TCGA數據庫中正常樣本和GTEx數據。TPM:Transcripts per million。Fig.2 Analysis of CD59 expression in lung cancer with Oncomine and GEPIA databases(A)Analysis of CD59 expression in different cancers based on Oncomine database.Yellow and blue represent significant overexpression and decreased expression of CD59 mRNA,respectively,in different cancers.Analysis type:Cancer vs.normal;Threshold(P-value):1E-4;Threshold(fold change):2;Threshold(gene rank):Top 10%;Data type:All;(B)Analysis of CD59 mRNA expression in lung cancer tissues with GEPIA database.Red and gray represent tumor(T)and normal(N)tissues,respectively.|log2(fold change)|cutoff:1;P-value cutoff:0.01;log scale:Yes,and represented by log2(TPM+1);Jitter size:0.4;Matched normal data:TCGA normal and GTEx data.TPM:Transcripts per million.

此外,通過對臨床組織標本和血清標本進行免疫印跡實驗發現,相比癌旁組織,CD59蛋白在早期肺癌組織中的表達顯著下降,P=0.048 8(圖3A和3B);相對于健康對照組,CD59蛋白在早期肺癌血清中的表達也顯著下降,P=0.000 4(圖3C和3D)。另外,圖3D顯示,CD59蛋白在良性樣本和肺癌患者樣本間的表達水平無明顯差異,這可能是由于所用血清樣品量少,后續還需大量樣品進一步驗證。

圖3 免疫印跡法檢測早期肺癌患者組織和血清中CD59蛋白的表達水平(A)組織裂解液;(B)灰度分析組織中CD59的表達。PN表示癌旁組織,PT表示腫瘤組織;(C)血清蛋白質樣品;(D)灰度分析血清中CD59的表達。數據用平均值±標準誤顯示,統計用非配對的t檢驗,*P<0.05;**P<0.01;***P<0.001。Fig.3 Detection of the protein expression level of CD59 in tissues and sera of early lung cancer patients with Westernblot(A)Tissue lysates;(B)The gray analysis of CD59 expression in tissue lysates.PN:Paracancerous tissues,PT:Tumor tissues;(C)Serum samples;(D)The gray analysis of CD59 expression in sera.The data were statistically analyzed by GraphPad Prism(v8.0)with unpaired t-test,and represented by mean±SEM.*P<0.05;**P<0.01;***P<0.001.

2.3 CD59蛋白的結構

通過NCBI GeneBank和UniProt數據庫(https://www.uniprot.org/uniprot/P13987)分析CD59的編碼序列和位點(圖4A)。結果顯示:CD59的基因ID為966,定位在11號染色體上,編碼128個氨基酸,其中1~25位氨基酸為信號肽序列,103~128位氨基酸為前肽序列[11];CD59蛋白含有4個糖基化修飾位點。COSMIC數據庫的分析顯示:CD59在肺癌中有3個已知位點存在突變,即第8、87和128位氨基酸(圖 4A)。

CD59蛋白的3D結構如圖4B所示,主要由α螺旋和β折疊組成。研究報道,CD59蛋白分子有 5個二硫鍵[12],即氨基酸位點 28~51、31~38、44~64、70~88 和 89~94 分別形成二硫鍵(圖 4B)。COSMIC數據庫分析顯示,在肺癌患者中CD59有3個氨基酸位點即8、87和128位存在突變,其中第8和128位點的突變都屬于同義突變,而第87位氨基酸由酪氨酸(Y)突變為苯丙氨酸(F)。進一步的SWISS-MODEL同源模建以及SPDBV軟件分析提示,87位酪氨酸(Y)僅與53位異亮氨酸(I)有氫鍵作用,突變成苯丙氨酸(F)后,與53位異亮氨酸(I)的氫鍵并沒有發生變化(圖4C)。

圖4 CD59的序列和3D結構(A)CD59基因序列。紅色標記表示突變信息,藍色標記表示糖修飾位點;(B)CD59蛋白的3D結構?!癈”表示半胱氨酸;(C)運用SPDBV軟件分析CD59蛋白87位酪氨酸和53位異亮氨酸之間的氫鍵作用(左邊),以及87位突變后的苯丙氨酸和53位異亮氨酸之間的氫鍵作用(右邊)。Fig.4 The sequence and 3D structure of CD59(A)The sequence of CD59.Red represents mutation,and blue represents glycosylation sites;(B)The 3D structure of CD59 protein.“C”represents cysteine;(C)Analysis of the hydrogen bonding force between tyrosine(Y)87 and isoleucine(I)53 in the CD59 protein(left),and the hydrogen bonding force between phenylalanine(F)87 and isoleucine(I)53 in the mutant CD59 protein(right)by SPDBV software.

2.4 CD59蛋白與其他蛋白質之間的相互作用

STRING數據庫分析結果顯示,CD59蛋白主要與10種蛋白質存在相互作用(圖5),即補體加速衰減因子(complement decay-accelerating factor,CD55)、補體成分C9、C3a過敏毒素趨化性受體(C3a anaphylatoxin chemotactic receptor,C3AR1)、補體成分 C8 α 鏈(C8A)和 β 鏈(C8B)、胰島素(insulin,INS)、尿激酶纖溶酶原激活物表面受體(urokinase plasminogen activator surface receptor,PLAUR)、白細胞表面抗原CD47、整合素alpha-M(integrin alpha-M,ITGAM)和癌胚抗原相關細胞黏附分子8(carcinoembryonic antigen-related cell adhesion molecule 8,CEACAM8),其中大部分蛋白質參與免疫調控,如:CD55的唾液酸化促進腫瘤細胞發生免疫逃逸[13],CEACAM8與中性粒細胞脫顆粒有關[14]。我們前期的轉錄組數據也顯示,CD55和PLAUR的mRNA水平在早期NSCLC外周血白細胞中表達下降[9]。此外,有研究報道,CD55單抗有望用于胸膜轉移性肺癌的治療[15],含有CD55的腫瘤特異性溶瘤腺病毒也有潛力作為肺癌治療新方法[16];PLAUR參與腫瘤的轉移和入侵[17~18]??偟膩碇v,肺癌發生進程與免疫調控密切相關[19~20],因而蛋白質互作分析可為CD59蛋白參與肺癌發生機制的深入研究提供參考。

圖5 STRING數據庫分析與CD59蛋白相互作用的蛋白質(物種:人)Fig.5 The protein-protein interaction network diagram of CD59 using STRING database(organism:Homo sapiens)

2.5 CD59表達與肺癌患者預后的相關性

Kaplan-Meier Plotter數據庫分析顯示,CD59高表達肺癌患者(n=459)的生存時間為133.57個月;低表達肺癌患者(n=694)的生存時間為50.73個月(圖6),表明CD59低表達的肺癌患者的生存時間更短,提示CD59可作為肺癌患者生存期判斷的指標。

圖6 CD59表達與肺癌患者生存之間的關系數據分析的參數設置:Affy ID:228748_at;患者分組:自動選擇最佳臨界值;組織亞型:All;分期:All;AJCC TNM分期:All;性別:All;吸煙史:All;Cox回歸分析:單變量。Fig.6 The correlation between CD59 expression and the survival of lung cancer patientsParameter settings:Affy ID:228748_at;Split patients by:Auto select best cutoff;Histology:All;Stage and grade:All;AJCC stage T:All;AJCC stage N:All;AJCC stage M:All;Gender:All;Smoking history:All;Cox regression:Univariate.

3 討論

本研究通過Oncomine、GEPIA等多個數據庫分析發現CD59在肺癌組織中表達下降(圖2和表3),免疫印跡實驗結果也表明CD59在早期NSCLC患者組織和血清中的表達都顯著下降(圖3),與前期轉錄組測序數據檢測結果[9]一致。HPA數據庫(https://www.proteinatlas.org/ENSG00000085-063CD59/tissue)的分析顯示,CD59在正常的肺組織中高表達。然而,Li等[21]報道,免疫組化結果顯示,CD59在20例NSCLC組織中的表達量高于癌旁組織中的表達量,并且在H157細胞中敲低CD59表達可抑制H157細胞的增殖和增強細胞凋亡,表明CD59可作為NSCLC治療的靶點。Lin等[22]則報道,在肺癌細胞中敲低CD59表達,可抑制肺腺癌的生長和轉移。上述相反的結果可能是由于CD59在腫瘤早晚期樣本中表達不同,但具體機理還需要更多實驗進一步探究。

運用COSMIC數據庫分析CD59基因在肺癌患者中的突變情況,發現有3個氨基酸位點即第8、87和128位存在突變(圖4)。其中,第8位氨基酸位點位于信號肽序列中,在CDS序列中即24位C突變成G,也就是密碼子GTC突變為GTG,二者都編碼纈氨酸(V),屬于同義突變。第87位氨基酸位點在CDS序列中即260位A突變成T,也就是密碼子TAC突變為TTC,所編碼氨基酸由酪氨酸(Y)突變為苯丙氨酸(F),COSMIC數據庫報道該位點屬于錯義突變。我們通過SWISS-MODEL同源模建CD59的3D結構,運用SPDBV軟件進行分析發現,87位酪氨酸(Y)僅與53位異亮氨酸(I)有氫鍵作用,突變成苯丙氨酸(F)后,與53位異亮氨酸(I)的氫鍵并沒有發生變化。UniProt數據庫有報道,該87位氨基酸由酪氨酸(Y)突變為精氨酸(R),對蛋白質功能沒有影響。第128位氨基酸位點在CDS序列中是384位C突變成G,即密碼子CCC突變為CCG,都編碼脯氨酸(P),也屬于同義突變。第128位氨基酸位于前肽序列中,切割后才為成熟形式的CD59蛋白[11]。因此,現有數據提示,在肺癌患者中CD59蛋白3個已知的突變位點對該蛋白質結構并無明顯影響。

CD59蛋白屬于補體,是先天免疫系統的一部分,補體系統的激活以級聯酶促反應的形式發生[23],當補體激活不足或過度時可導致多種疾病[24]。CD59蛋白為相對分子質量為18~20 kD的糖基磷脂酰肌醇(glycosylphosphatidylinositol,GPI)錨定的糖蛋白,是膜結合性補體調節蛋白(membranebound complement regulatory proteins,mCPRs)的重要成員,在血液和多種組織中表達[25~26]。CD59蛋白有兩種存在形式,包括膜附著性CD59蛋白和可溶性CD59蛋白,附著性CD59蛋白的主要功能是在補體系統被激活后的酶級聯反應的終末階段抑制膜攻擊復合體(membrane attack complex,MAC)的形成,從而保護宿主細胞使其不受MAC裂解效應的影響[27~28]。當補體激活不足時,MAC可以通過激活細胞周期、預防細胞凋亡、上調致癌生長因子和細胞因子并抑制淋巴細胞的活化增殖等方式,誘導或維持腫瘤發生[29]。CD59分子還可參與免疫反應的調節過程,誘導T淋巴細胞的激活,并且影響T淋巴細胞增殖及其分泌細胞因子的能力[30]。本研究發現,CD59蛋白與神經免疫調節蛋白CD47有相互作用(圖5)。有研究報道,CD47的表達水平與NSCLC的侵襲和轉移相關,過表達CD47可以促進NSCLC的入侵和轉移,可作為NSCLC的不良預后指標,用于疾病進程監控和NSCLC治療的靶點[31]。Kleczko等[32]報道,靶向補體途徑可作為肺癌治療的策略,如前所述,CD55單抗可用于胸膜轉移性肺癌的治療[15],推測作為補體途徑的CD59分子也可能參與調控肺癌的發生。

總的來講,本研究發現CD59在肺癌組織和血清中的表達低于正常對照組,且CD59低表達的肺癌患者生存更差,推測是因為CD59可作為人自然殺傷細胞激活的共受體,當CD59低表達不利于自然殺傷細胞的激活時,可能引起免疫逃逸,導致腫瘤細胞惡性增殖,患者生存更差[33]。本研究表明,免疫分子CD59有可能作為肺癌預后生存標志物,為進一步探索CD59參與肺癌發生機制和預后判斷提供了參考依據。

猜你喜歡
位點氨基酸肺癌
Pd改性多活性位點催化劑NH3-SCR脫硝反應機理研究
DNA脫堿基位點的檢測方法及其生物學研究進展
多環境下玉米保綠相關性狀遺傳位點的挖掘
飼料氨基酸釋放動態對豬氮素利用影響的研究進展
氬氦刀冷凍治療肺癌80例的臨床觀察
中國每年78萬人確診肺癌醫生忠告,預防肺癌,晚上請堅持四不要
科學解讀食物中的蛋白質如何分“優劣”
近親得肺癌自己早預防
一種改進的多聚腺苷酸化位點提取方法
補氨基酸不如吃雞蛋
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合