?

肺腺癌鐵死亡相關LncRNA的篩選及風險預測研究*

2024-01-02 16:25哈爾濱醫科大學公共衛生學院流行病與衛生統計學系150081馬宇杰劉美娜
中國衛生統計 2023年4期
關鍵詞:腺癌樣本因素

哈爾濱醫科大學公共衛生學院流行病與衛生統計學系(150081) 馬宇杰 田 偉 張 薇 劉美娜

【提 要】 目的 篩選鐵死亡相關長鏈非編碼RNA(ferLncRNA)構建風險評分模型,并進行肺腺癌患者的生存預測。方法 通過相關性分析、癌組織-癌旁組織差異分析,獲得差異表達的鐵死亡相關LncRNA(DEferlncRNA),使用配對算法獲得DEferlncRNA pairs。利用LASSO Cox篩選與生存相關DEferlncRNA pairs,多因素Cox回歸分析并構建風險評分模型;計算ROC曲線的AUC值評估模型。利用單因素和多因素Cox回歸分析風險評分是否具有獨立預后價值;分析生存時間、臨床病理特征和化療療效等在高、低風險組之間的差別。結果 相關性分析獲取512個ferlncRNA,差異分析獲得53個DEferlncRNA,配對算法獲得1243個DEferlncRNA pairs。LASSO Cox分析獲得40個與生存相關DEferlncRNA pairs,多因素分析得到17個DEferlncRNA pairs構建風險評分模型;模型的AUC為0.776。單因素和多因素分析提示風險評分可作為肺腺癌(lung adenocarcinoma,LUAD)的獨立預后因素?;颊呋熕幬锩舾行?、TNM分期、臨床分期、生存時間和生存狀態在高、低風險組之間差異有統計學意義。結論 利用DEferlncRNA構建的肺腺癌風險評分模型,可為預測肺腺癌患者預后提供依據。此外,低風險評分患者對化療藥物敏感,將為肺腺癌患者臨床治療提供參考。

肺癌是全球癌癥相關死亡的主要原因之一,根據組織病理學,分為非小細胞肺癌(non-small cell lung cancer,NSCLC,85%)和小細胞肺癌(15%),其中肺腺癌(lung adenocarcinoma,LUAD)是NSCLC的主要病理類型[1]。早期通過手術治療肺腺癌可以獲得較好地治療效果,但其總體生存率仍然很低,5年生存率僅為18%;免疫抑制、細胞增殖、腫瘤遠處轉移、藥物抵抗等因素與肺腺癌患者低生存率緊密關聯[2-3]。鐵死亡是一種鐵依賴性新型的程序性死亡方式;鐵代謝異常會促進腫瘤細胞生長,是癌癥發生的危險因素;與正常細胞相比,癌細胞在增殖過程中過度依賴鐵離子;激活鐵死亡通路有望改善癌癥化療藥物耐藥的困境,為癌癥治療提供新的治療方向[4-5]。

長鏈非編碼RNA(long non-coding RNA,LncRNA)為大于200bps的RNA分子,其不直接編碼蛋白質,但能調節蛋白編碼基因的表達與蛋白質的合成[6],更重要的是,LncRNA與腫瘤發生、進展和轉移等癌癥相關事件高度相關[7]。鐵死亡相關LncRNA作為一類特殊的LncRNA在腫瘤的發生、發展過程中發揮極為重要的作用,影響癌癥患者的預后,有望成為腫瘤治療新靶點,如LncRNA LINC00336通過與ELAVL1相互作用降低癌細胞內鐵離子和脂類ROS含量,發揮抗腫瘤作用[8]。LUAD患者ferlncRNA相關特征與其預后價值的關系研究甚少,因此,本研究利用DEferlncRNA pairs構建風險評分模型,可以評估LUAD患者預后,并為肺腺癌患者臨床治療提供相關依據。

方 法

1.肺腺癌患者 LncRNA 和臨床數據的收集

在UCSC Xena網站(https://xenabrowser.net/)下載肺腺癌轉錄組數據,包括526例癌組織和59例正常肺組織,根據Ensembl(http://asia.ense.ensembl.org)GTF文件對轉錄組數據進行注釋,區分mRNA和LncRNA。通過UCSC Xena網站獲取肺腺癌患者臨床信息,提取性別、年齡、TNM分期、臨床分期、生存時間和生存狀態等臨床特征,剔除生存時間不足30天的樣本以及重復樣本,共納入489例腫瘤樣本和59例正常樣本,其中腫瘤樣本中生存時間為1年、3年、5年的病例分別有393例、132例、51例。

2.肺腺癌鐵死亡相關LncRNA的獲取

從FerrDb數據庫[9]提取259個鐵死亡相關基因,通過相關性分析提取并篩選肺腺癌ferlncRNA。篩選標準:相關系數大于0.4,P小于0.001。利用R軟件“limma”包篩選癌組織和正常肺組織差異鐵死亡相關LncRNA(DEferlncRNA);以FDR<0.05及|log(FC)| >1.5為篩選標準。

3.DEferlncRNA配對規則[10]

首先,構建DEferlncRNA pairs 0或1表達矩陣,將DEferlncRNA進行兩次循環配對。假設C為lncRNA A加lncRNA B所構成DEferlncRNA pairs;如果LncRNA A表達量高于LncRNA B,則C標記為1,否則C標記為0;然后,得到每個樣本C的表達情況,在所有的樣本中計算C為0或1的比例。由于沒有一定等級的DEferlncRNA pairs無法正確預測患者的預后,因此當DEferlncRNA pairs的表達量為0或1的比例介于20%與80%之間時,可以認為DEferlncRNA pairs與預后有關。

4.建立風險評分模型

5.模型的評價

使用“survivalROC”包繪制多個時間點ROC曲線,分別計算1年、3年和5年AUC值評估風險評分模型,繪制ROC曲線計算約登指數,確定模型的最佳臨界值;根據臨界值,將肺腺癌患者分為高風險組和低風險組,加載“survminer”包繪制Kaplan-Meier曲線分析高風險組和低風險組患者的生存差異;對風險評分進行單因素和多因素Cox回歸分析,確定風險評分是否具有獨立預后價值。

6.統計分析

統計分析由R 4.1.0版軟件完成。利用χ2檢驗分析各個臨床特征的高、低風險組之間的差異。采用Wilcoxon符號秩和檢驗分析各臨床特征不同組之間的風險評分差異。采用Wilcoxon秩和檢驗比較化療藥物的半數抑制濃度(IC50)在高、低風險組之間的差異。

結 果

1.DEferlncRNAs的篩選

鐵死亡相關基因與肺腺癌患者LncRNA進行相關性分析,獲得512個ferlncRNA;在腫瘤樣本和正常樣本之間進行差異分析獲得53個DEferlncRNAs,見圖1A;其中43個表達上調,10個表達下調,見圖1B。本研究納入489例肺腺癌患者的臨床基線資料,見表1。

2.DEferlncRNApairs的篩選

53個DEferlncRNAs通過配對算法獲得1243個有意義的DEferlncRNA pairs。單因素分析篩選出147個與預后相關的DEferlncRNA pairs,LASSO Cox回歸分析獲得40個DeferlncRNA pairs。

3.肺腺癌風險評分模型的建立

將上述40個DEferlncRNA pairs進行多因素Cox回歸分析,篩選出17個DEferlncRNA pairs構建風險評分模型,見表2和圖2;其中HR值均大于1的DEferlncRNA pairs為TYMSOS|AC145343.1、AC010789.1|AC111149.2、LINC00511|AC145343.1、Z98257.1|AP004608.1、LINC01614|DRAIC、AL033397.1|AC010719.1、LINC00973|AC027288.3、LINC01977|AC010719.1。

4.肺腺癌風險評分模型的評價

圖3B顯示繪制多個時間點ROC曲線,1年、3年、5年AUC分別為0.776、0.760、0.726;將1年ROC曲線與其他的臨床特征比較,見圖3C;利用風險評分公式計算每位患者的風險評分;根據ROC曲線得到風險評分cut-off值為2.035,見圖3D;以此為臨界值,100例患者被納入高風險組,389例患者被納入低風險組。圖4A顯示每個患者的風險值分布;圖4B提示高風險組患者有更差的生存狀況。Kaplan-Meier分析表明生存時間在高、低風險組之間有差異,差異具有統計學意義(P<0.001),見圖4C。

5.風險評分具有獨立預后價值

剔除臨床特征信息不完整的肺腺癌樣本后,共有469例樣本納入分析。通過單因素Cox回歸分析,臨床分期[P<0.001,HR=1.591,95%CI(1.358,1.864)],T期[P<0.001,HR=2.135,95%CI(1.361,3.350)],N分期[P<0.001,HR=2.581,95%CI(1.832,3.638)和riskScore(P<0.001,HR=1.321,95%CI(1.254,1.392)]顯示差異具有統計學意義,見圖5A;通過多因素Cox回歸分析只有riskScore(P<0.001,HR=1.280,95%CI(1.212,1.353)]顯示為獨立的預后預測因子,見圖5B。

6.高、低風險組臨床特征差異分析

從熱圖和箱式圖可以看出,T分期、N分期、M分期、臨床分期與風險評分相關。圖6A和圖7顯示TNM分期、臨床分期、化療藥物(吉西他濱、紫杉醇、順鉑)在高、低風險組之間有差異,差異具有統計學意義(P<0.05)。圖7顯示風險評分與一些常用化療藥物IC50之間存在相關,提示風險評分可能作為肺腺癌患者化療藥物敏感性的潛在預測因子。

討 論

利用相關性分析和差異分析獲取53個DEferlncRNAs,循環配對構建0或1矩陣獲得DEferlncRNA pairs;結合臨床信息,利用LASSO回歸和多因素Cox回歸分析篩選出17個與生存相關DEferlncRNA pairs,并構建風險評分模型。本研究采用的是配對算法來提取DEferlncRNA pairs,并選擇最優的DEferlncRNA pairs構建模型,該模型不需要做批次矯正,只需要考慮樣本內部lncRNA的比較;不需要考慮樣本之間的比較,便于臨床應用。

該風險評分模型表明8個DEferlncRNA pairs(TYMSOS|AC145343.1、AC010789.1|AC111149.2、LINC00511|AC145343.1等)為肺腺癌預后的危險因素,9個DEferlncRNA pairs(LUCAT1|AL365181.3、LINC02362|LINC02544、PARAL1|LINC01843等)為肺腺癌預后的保護因素。鐵死亡是一種依賴鐵的細胞死亡方式,已被證明與腫瘤發展和抗腫瘤治療有關[12-14];LncRNA參與惡性腫瘤進展和腫瘤耐藥,并成為新的生物標志物和治療靶點[15-17]。然而,鐵死亡相關LncRNA與肺腺癌預后關系研究較少。有研究發現LINC00511為肺腺癌預后的危險因素,與本研究結果一致;LINC00511通過PTEN調控肺癌細胞增殖、遷移和上皮間質轉化;通過miR-183-5p/ZEB2軸調控TGF-β1引起的肺癌細胞的遷移以及上皮間質轉化[18]。研究發現LUCAT1正向影響Beclin1的表達而激活自噬維持肺腺癌A549干細胞干性[19],與本研究發現LUCAT1為肺腺癌預后的保護因素結果一致。在前列腺癌中,DRAIC與IKK亞基結合,阻斷基間結合并抑制NF-κB的激活,從而抑制前列腺癌細胞的侵襲和增殖[20];DRAIC能促進降解通過阻斷UCHL5介導的NFRKB去泛素化,抑制胃癌細胞的增殖和轉移[21];以上結果表明DRAIC是癌癥患者的預后因素,與本研究結果相符。AC010789.1高表達與淋巴結轉移和預后不良相關[22]。然而,本研究發現AL365181.2、AL391427.1、PARAL1、AC145343.1等也是肺腺癌預后因素,但是具體影響機制還不清楚。

本研究發現常用化療藥物在高、低風險評分組之間藥物敏感性是有差異的,并提示低風險評分對藥物敏感。盡管還沒有證據表明DEferlncRNA與肺腺癌耐藥之間有直接聯系,但部分DEferlncRNA在其他癌癥耐藥過程中發揮重要的作用。LINC0973基因下調降低p21的水平,激活癌細胞的增殖,抑制藥物作用下細胞的凋亡;LINC01977表達水平上調可促進乳腺癌的進展,增加對阿霉素的耐藥作用;ECSB通過調控LINC01843表達來逆轉大腸癌5-FU的耐藥作用[23-25]。以上研究提示,DEferlncRNA可能為研究肺腺癌耐藥機制提供一定的參考。

繼往研究主要基于LncRNA表達量構建肺腺癌預后模型,數據以芯片數據或PCR數據為主,需要進行批次矯正后構建轉錄組數據模型;而本研究基于LncRNA對構建肺腺癌預后模型,只需考慮數據內部LncRNA表達量的相對高低信息,不需要數據的矯正,方便臨床使用,結果更具實用性。本研究風險預測模型樣本量較少,還缺少外部數據驗證。因此,在以后的工作中,將增加樣本量進一步驗證模型。綜上,利用ferlncRNA構建,不需要確定表達量的LncRNA基因特征可評估LUAD患者預后,同時也為肺腺癌患者臨床化療提供參考。

猜你喜歡
腺癌樣本因素
用樣本估計總體復習點撥
解石三大因素
推動醫改的“直銷樣本”
益肺解毒方聯合順鉑對人肺腺癌A549細胞的影響
隨機微分方程的樣本Lyapunov二次型估計
短道速滑運動員非智力因素的培養
村企共贏的樣本
HIF-1a和VEGF-A在宮頸腺癌中的表達及臨床意義
GSNO對人肺腺癌A549細胞的作用
老年胃腺癌中FOXO3a、PTEN和E-cadherin表達的關系
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合