胡雪停,吳曉鳳,徐 祥
(陸軍軍醫大學大坪醫院 干細胞與再生醫學科, 創傷、燒傷與復合傷國家重點實驗室, 重慶 400042)
長鏈非編碼RNA(long non-coding RNA,lncRNA)是指長度大于200 nt的不編碼蛋白的RNA分子。它們雖然不能編碼蛋白,但是仍然可以以RNA分子的形式通過與其他的分子(RNA、蛋白質和DNA)相結合來調控一系列的生命活動[1]。目前,許多有重要功能的lncRNA分子被鑒定出來[2],有些lncRNA分子甚至被發現可以編碼短肽來發揮作用[3]。lncRNA分子已成為目前的研究熱點。
人WFDC21P(WAP four-disulfide core domain 21, pseudogene)基因是不編碼蛋白質的長鏈非編RNA基因,轉錄產物為LOC645638。2014年,采用轉錄組芯片以及二代測序高通量篩選方法,鑒定發現LOC645638特異性高表達于DC細胞,并命名為lnc-DC。進一步地,通過RNA-pull down和ChIP-seq等技術發現lnc-DC可通過抑制STAT3的去磷酸化來促進DC細胞的分化。該研究表明人lnc-DC在DC細胞分化中具有重要作用[4]。然而,lnc-DC在其他組織器官及其相關疾病中是否發揮作用及分子調控機制仍然不清楚。
本文使用生物信息學工具,運用在線軟件及數據庫對人lnc-DC進行分析,預測調控lnc-DC表達的轉錄因子及其結合蛋白,并進行初步驗證。為lnc-DC的研究提供參考,為其他lncRNA研究提供思路。
登陸NCBI數據庫(https://www.ncbi.nlm.nih.gov/gene/),輸入“WFDC21P”,獲取lnc-DC基因的相關信息及正常組織中的表達數據;登陸UCSC數據庫(http://genome.ucsc.edu/),獲取lnc-DC基因啟動子序列,將序列導入轉錄因子結合位點的motif數據庫JASPAR(http://jaspar.genereg.net/),對lnc-DC基因的5′調控區序列上轉錄因子結合位點進行預測;登錄非編碼RNA數據庫AnnoLnc(http://annolnc.cbi.pku.edu.cn/index.jsp),輸入獲取的lnc-DC的序列,獲取lnc-DC二級結構;登錄RNA和蛋白結合預測工具catRAPID(http://service.tartaglialab.com/page/catrapid_group),選擇子程序catRAPID omics[transcript VS nucleotide-binding proteome],在RNA sequence框中輸入lnc-DC的序列,點擊提交獲取與lnc-DC相結合的蛋白質分子。
1.2.1 原位雜交檢測皮膚標本中lnc-DC的表達:皮膚標本來源于陸軍軍醫大學大坪醫院整形美容科,所有的組織樣本均由患者簽署知情同意書并獲得醫院倫理委員會批準。皮膚組織經固定、包埋后切片用于原位雜交檢測。lnc-DC雜交探針由廣州銳博生物科技有限公司設計合成,雜交方法參照原位雜交檢測試劑盒(廣州銳博生物)說明書進行操作。
1.2.2 siRNA轉染:人永生化皮膚角質形成細胞(HaCaT)(ATCC公司),由本實驗室常規保存,培養于DMEM高糖培養基中。轉錄因子GATA3特異性siRNA(廣州銳博生物)由riboFECTTMCP轉染試劑(廣州銳博生物)導入細胞,具體步驟參照說明書。
1.2.3 實時熒光定量PCR:使用RNA提取試劑盒(Bio-tech公司)提取細胞總RNA,并按照TaKaRa反轉錄試劑盒說明書將總RNA反轉錄成cDNA。使用SYBR Premix EX Taq進行qPCR, 反應在Bio-Rad FX96實時熒光定量PCR儀進行,以β-actin作為內參。引物序列如下:GATA3上游引物:5′-CTGG CGCCGTCTTGATACT-3′,下游引物:5′-GGGTCACC TGGGTAGCGAA-3′;lnc-DC上游引物:5′-CCATGA GTGTGTTGCAGGGT-3′,下游引物:5′-TCCAGGAA GGGATGACGATCT-3′;β-actin上游引物:5′-ACAG AGCCTCGCCTTTGCC-3′,下游引物:5′-GATATCATC ATCCATGGTGAGCTGG-3′。反應條件為95 ℃預變性60 s,循環40次;95 ℃變性5 s,60 ℃退火30 s。
hWFDC21P基因 Gene ID:645638,定位于17號染色體的長臂(17q23.1),基因組跨越4 902 bp,包含3個外顯子和2個內含子。3個外顯子分別位于60088467~60088197(271 bp),60085203~60085055(149 bp)和60083766~60083566(201 bp)。轉錄產物RNA的ID號為NR_030732.1,為不編碼蛋白質的長鏈非編碼RNA。
目前的研究發現lnc-DC在分化的DC細胞中顯著升高,有促進DC細胞分化成熟的作用。那么,它在其他組織器官中的表達如何?會不會在其他生理病理過程中也發揮重要作用呢?登錄NCBI/gene,檢索lnc-DC在人類正常組織器官中的表達,結果如圖1所示,WFDC21P轉錄產物lnc-DC高表達于食管(Reads Per Kilobase per Million, RPKM 17.05±4.69)和皮膚(RPKM 14.15±2.03),提示lnc-DC可能參與了食管和皮膚正常功能的維護,在食管和皮膚損傷修復中可能有重要作用。
RPKM: Reads Per Kilobase per Million圖1 Lnc-DC在人類正常組織中的表達Fig 1 Expression of lnc-DC in human normal n=95)
Relative profile score threshold 設定為100%時,利用在線軟件JASPAR預測顯示WFDC21P基因啟動子區域有11個轉錄因子結合位點,結果如表1所示,包括轉錄因子GATA2、GATA3、GATA5、NKX3-1、MZF1、MAX、ZNF345C和VAX1。
表1 人WFDC21P基因啟動子區域轉錄因子結合位點預測結果Table 1 Prediction of transcription factors binding to the promoter of WFDC21P
生物大分子的功能往往是由其結構決定的[5],lncRNA的二級結構及三級結構(空間構象)是其發揮功能的關鍵[6]。將lnc-DC序列輸入非編碼RNA數據庫AnnoLnc,獲得的lnc-DC二級結構如圖2所示。
圖2 lnc-DC二級結構示意圖Fig 2 Secondary structure diagram of lnc-DC
人lnc-DC不具有直接結合RNA的潛力,主要是與蛋白質分子結合發揮作用。通過RNA和蛋白結合預測工具catRAPID預測了可能與lnc-DC相結合的蛋白質分子。預測顯示lnc-DC可與眾多蛋白質分子結合,其中得分較高的結合蛋白分子如表2所示。
進一步地,采用富集分析工具Enrichr對與lnc-DC結合潛力較強的蛋白進行富集分析。KEGG富集分析(圖3)顯示這些蛋白與RNA剪接體信號通路相關的可能性較大,GO富集分析(圖4)顯示這些蛋白主要參與了RNA的剪接、成熟與轉運等過程。這些結果表明lnc-DC可能是通過結合RNA剪接相關蛋白,控制RNA的成熟與轉運來發揮作用。
圖3 lnc-DC結合蛋白KEGG富集分析Fig 3 KEGG analysis of proteins binding to lnc-DC
圖4 lnc-DC結合蛋白GO富集分析Fig 4 GO analysis of proteins binding to lnc-DC
2.7.1 熒光原位雜交(FISH)檢驗lnc-DC在皮膚中的表達結果:與NCBI數據庫測序數據一致,lnc-DC在皮膚組織中高表達,尤其是表皮層(圖5)。
圖5 FISH檢測lnc-DC在人皮膚組織中的表達Fig 5 Expression of lnc-DC in human skin by FISH(×100)
2.7.2 siRNA結合qPCR檢驗GATA3對lnc-DC調控作用結果:當使用siRNA干擾人皮膚永生化角質形成細胞HaCaT中的GATA3時,lnc-DC的表達也顯著降低(圖6),表明轉錄因子GATA3對lnc-DC確實有轉錄調控作用。
*P<0.01 compared with si-NC group圖6 qPCR檢測干擾GATA3后HaCaT細胞中lnc-DC的表達變化Fig 6 Expression of lnc-DC in HaCaT GATA3 RNAi cells by n=3)
皮膚覆蓋在身體表面,是人體最大的器官,具有保護、排泄、調節體溫和感受外界刺激等作用。皮膚結構的完整對于皮膚維持正常的功能至關重要,超過100種的皮膚系統疾病與皮膚功能異常有關,常見的有慢性及難愈性潰瘍、銀屑病、皮炎、基底細胞癌和皮膚鱗狀細胞癌,這些疾病困擾著超過20%的世界人口[7]。通過搜索數據庫發現lnc-DC在皮膚組織中顯著高表達,并通過原位雜交驗證lnc-DC確實在皮膚組織尤其是表皮層高表達,這些結果表明lnc-DC對于皮膚正常功能的維持可能具有重要作用,為lnc-DC的研究指明了新的方向。
轉錄因子是能與基因5’端上游啟動子區域特定序列結合,并能調控基因在特定時間與空間表達的蛋白質分子。本研究通過在線數據庫JASPAR成功預測了能調控lnc-DC轉錄的轉錄因子。JASPAR數據庫提供了轉錄因子與DNA結合位點motif最全面的公開數據,共收集了脊椎動物、植物、昆蟲、線蟲、真菌和尾索動物6大類不同類生物的數據[8]。此外,該數據庫是一個不斷更新的數據庫,最近一次的更新是2018年[9]。JASPAR預測的結果數據質量較為可靠,其預測結果被許多研究采納[10-12]。本研究通過JASPAR預測發現轉錄因子GATA3等轉錄因子可能具有調控lnc-DC表達的作用,結合siRNA干擾實驗確證了GATA3對lnc-DC的調控作用,為lnc-DC轉錄調控研究提供了理論依據。
CatRAPID是一款專門用來計算蛋白質和RNA結合特性的在線工具,該工具通過整合二級結構、氫鍵和范德華力等數據來預測蛋白與RNA結合的可能性[13],為蛋白質與RNA相互作用研究提供了極大的便利。許多研究者通過使用該工具發現了與某一特定RNA相互作用的蛋白質分子[14-15]。本研究通過catRAPID工具預測lnc-DC可能通過與蛋白U2AF2、HNRDL和HNRPD等結合,并進一步富集分析發現這些蛋白主要參與RNA的剪接、成熟與轉運,為lnc-DC的作用機制研究提供了參考。
lncRNA在皮膚系統中的研究才剛剛開始,本研究采用生物信息學的方法對lnc-DC的表達、轉錄調控因子和結合蛋白進行了分析,通過基礎實驗進行了初步驗證。然而有關lnc-DC的生物學功能、調控因子與分子機制還需相關的實驗做進一步的證明。本研究為lnc-DC的相關研究提供了參考,為其他lncRNA研究提供思路。