?

??莆锓NTHRSP 基因的分子特征及功能比較分析*

2024-04-01 14:12王榮平范新陽滕曉紅苗永旺
關鍵詞:密碼子核苷酸位點

吳 宇,王榮平,朱 偉,范新陽,滕曉紅,苗永旺**

(1.云南農業大學 動物科學技術學院,云南 昆明 650201;2.云南農業大學 動物遺傳育種研究所,云南 昆明 650201;3.云南農業職業技術學院 畜牧獸醫學院,云南 昆明 650212)

甲狀腺激素應答(thyroid hormone responsive,THRSP)基因的編碼蛋白Spot14 (又稱S14)最初由SEELIG 等[1]鑒定自大鼠肝臟的體外翻譯產物,是Spot14 家族的重要成員之一。在該家族中,還有1 個與其序列高度同源的蛋白——Spot14 相關蛋白(Spot14-R,MIG12)[2]。Spot14 家族成員包含3個保守區域,即N 末端的疏水區、中間的疏水區和C 末端的亮氨酸拉鏈區[2-4]。Spot14 和Spot14-R 依賴亮氨酸拉鏈結構形成同二聚體(Spot14/Spot14 和Spot14-R/Spot14-R)或異二聚體(Spot14/Spot14-R)參與基因的表達調控[4-6]。目前NCBI數據庫中已有普通牛、水牛、瘤牛、野牛、綿羊、山羊等主要??苿游锛皢畏羼?、雙峰駝、馬、驢、人、小鼠、雞等非??苿游锏腡HRSP基因序列信息,有研究表明該基因參與奶牛和山羊的乳脂合成過程,并與奶牛乳脂率和乳品質有關[7-10]。

雖然已有一些關于??莆锓NTHRSP基因的研究,但對于??萍倚骉HRSP 分子特征及功能的深入比較分析鮮有報道。本研究從NCBI 和Ensembl 數據庫下載了主要??莆锓N和非??莆锓NTHRSP基因及對應的編碼氨基酸序列,進一步采用比較基因組學和生物信息學分析方法對??莆锓N該基因轉錄區的結構、編碼區(coding sequence,CDS)的核苷酸組成、密碼子使用偏好性 (codon usage bias,CUB)、編碼產物的氨基酸組成、理化特性、結構特征、功能修飾位點、參與的生物學路徑、分子功能和系統發育關系進行全面預測和分析,旨在闡明??莆锓NTHRSP基因的分子特征及功能差異,為其表達調控研究提供參考。

1 材料與方法

1.1 序列及基因組注釋文件的下載

從NCBI (https://www.ncbi.nlm.nih.gov/)和Ensembl (https://asia.ensembl.org/index.html)數據庫中下載普通牛、水牛、牦牛、雜交牛、綿羊、山羊等??莆锓N的THRSP基因及對應的編碼氨基酸序列;利用NCBI 網站中的在線Blast 程序(https://blast.ncbi.nlm.nih.gov/Blast.cgi)進行同源搜索,獲取與??芓HRSP同源的非??莆锓N序列;從NCBI網站的Genome 數據庫(https://www.ncbi.nlm.nih.gov/genome/?term=)中下載各物種的基因組GTF格式數據用于分析。對所有序列進行比對和核對,篩除不完整或可能存在錯誤的序列,進一步對剩余的可靠序列(表1)進行分析。

表1 本研究所用序列Tab.1 Sequences used in this study

1.2 核苷酸組成和轉錄區結構分析

使用NCBI 數據庫中的ORF Finder 程序(ht-tps://www.ncbi.nlm.nih.gov/orffinder/)查找已下載的各物種THRSP基因開放閱讀框(open reading frame,ORF),以確定每條序列的完整CDS,使用Lasergene 軟件包(DNAStar Inc.,USA)中的Edit-Seq 程序分析各物種THRSP基因CDS 的堿基組成。在NCBI 數據庫中下載??坪头桥?莆锓N的基因組數據,并提取THRSP基因的轉錄本信息;使用TBtools[11]軟件對各物種THRSP基因的轉錄本信息進行完整化處理,進一步使用在線軟件Gene Structure Display Server 2.0 (http://gsds.gaolab.org/)呈現各物種THRSP基因的轉錄區結構,包括非翻譯區(untranslated region,UTR)、外顯子和內含子。

1.3 THRSP 基因的 CUB 分析

使用Codon 程序(http://codonw.sourceforge.net/)進行各物種THRSP基因的 CUB 分析,包括相對同義密碼子使用度(relative synonymous codon usage,RSCU)、有效密碼子數 (effective number of codons,ENc 值)、GC 含量和密碼子第3 位的GC 含量(GC of silent 3rd codon position,GC3s),其中,GC3s 為除了蛋氨酸、色氨酸和終止密碼子外,G 和C 出現在密碼子第3 個位置的頻率。

1.4 編碼蛋白的理化特性和結構特征分析

利用1.1 節的編碼氨基酸序列,使用在線程序ProtParam (http://web.expasy.org/protparam/)預測不同物種THRSP 蛋白的分子質量和理論等電點;使用SignalP5.0 (https://services.healthtech.dtu.dk/service.php?SignalP-5.0)預測信號肽;使用TMHMM version 2.0 (http://www.cbs.dtu.dk/services/TMHMM/)預測跨膜結構域;使用ProtScale (http://web.expasy.org/ protscale/)預測疏水性;使用PROSITE (https://prosite.expasy.org/prosite.html)預測功能修飾位點;使用ProtComp 9.0 (http://linux1.softberry.com/berry.phtml)分析各物種THRSP蛋白的亞細胞定位;分別使用SOPMA (https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)和SWISS-MODEL (https://beta.swissmodel.expasy.org/)分析??莆锓NTHRSP 蛋白的二級結構和三維結構,蛋白三維結構基于同源建模法,以小鼠Spot 14 蛋白模板(3ont.1.A)為最佳模型構建;使用STRING (https://cn.string-db.org/)分析蛋白相互作用關系;使用NCBI Batch Web CD-Serach Tool (https://www.ncbi.nlm/cdd/)預測各物種THRSP 的保守結構域;使用在線軟件Meme Suite[12](https://meme-suite.org)分析各物種THRSP 保守基序;使用TBtools[11]軟件的Gene Structure View (Advance)工具整合上述分析結果。

1.5 序列一致性和系統發育分析

使用Lasergene 軟件包(DNAStar Inc.,USA)中的MegAlign 程序分析各物種THRSP基因CDS及編碼氨基酸的序列一致性;使用MEGA 7[13]軟件輸出序列間的差異位點,進一步選用該軟件中的最大似然法,基于優化出的T92+G 和GTT+G+F 模型分別構建核苷酸序列和氨基酸序列的系統發育樹,每個節點處的支持率采用Bootstrap 方法進行評估(10 000 次重復)。

2 結果與分析

2.1 THRSP 基因的核苷酸組成、轉錄區結構及CUB 分析

2.1.1 CDS 核苷酸組成和轉錄區結構

??婆c非??撇溉閯游镩gTHRSP基因CDS的核苷酸組成相似,但與非哺乳動物雞的THRSP基因CDS 核苷酸組成差異較大,且表現出屬內相似性較高的特點;??苿游镏信俸脱驅賱游锏膶賰群塑账峤M成相似性更高,水牛與牛屬和羊屬動物之間存在較大差異(表2)。不同物種THRSP基因的轉錄區結構存在差異,尤其是內含子長度和UTR 長度的差異;除了駱駝科和馬科物種包含2 個可變剪接轉錄本外,其他物種都只包含1 個可變剪接轉錄本;驢THRSP基因包含3 個外顯子和2 個內含子,只有外顯子2 編碼蛋白質,而其他物種的THRSP基因都由2 個外顯子和1 個內含子組成,且只有外顯子1 編碼蛋白質(圖1)。

圖1 ??莆锓N及非??莆锓NTHRSP 轉錄區的結構Fig.1 Structure of THRSP gene in the species of Bovidae and non-Bovidae

2.1.2THRSP基因CDS 的CUB 分析

由表3 可知:水牛THRSP基因對20 種密碼子具有偏好性(RSCU>1),普通牛THRSP基因RSCU>1 的密碼子有22 種,雜交牛有18 種,牦牛有20 種,綿羊和山羊分別有22 和21 種,人和雞都有23 種,小鼠有24 種。水牛與其他??莆锓N共同偏好使用的密碼子有20 種,且對CUG、AGC、CCC、CGG、ACC、GUG、AUC等密碼子的偏好性較強,水牛與其他??莆锓N的RSCU 值差異較大。??莆锓N編碼蛋氨酸和色氨酸的密碼子RSCU 值都為1。由表4 可知:THRSP基因ENc 值呈現屬內相似、屬間差異大的特點,且ENc 值總體偏小,范圍在33.95~44.22。??莆锓NTHRSP基因ENc 值接近20,與其他非??苿游锎嬖谳^大差異,表明THRSP基因在??莆锓N中的CUB較強;THRSP基因GC3s 值范圍為0.741~0.832,均大于0.5,說明THRSP基因中的密碼子比較偏好以G/C 結尾;GC 含量范圍為0.581~0.625,表明各物種THRSP基因CDS 序列中G+C 堿基的含量大于A+T 堿基的含量。

表3 ??萍胺桥?莆锓NTHRSP 基因密碼子的RSCU 值Tab.3 RSCU values of THRSP gene codons in Bovidae and non-Bovidae

表4 THRSP 基因密碼子ENc、GC3s 頻率和GC 含量Tab.4 ENc,GC3s frequency and GC content of THRSP gene codons

2.2 THRSP 蛋白的理化特性和結構

2.2.1 理化特性

??莆锓NTHRSP 蛋白的理化特性較為相似,都為定位于細胞核的親水性蛋白質,不含跨膜區和信號肽,水牛與其他??莆锓N的極性氨基酸含量、脂肪族指數、親水性總平均值等指標差異較大;??莆锓NTHRSP 的理化特性與雞的差異最大,其次是人和小鼠(表5)。

表5 ??莆锓N及非??莆锓NTHRSP 理化特性Tab.5 Physicochemical characteristics of THRSP in the species of Bovidae and non-Bovidae

2.2.2 THRSP 基序組成模式和保守結構域

THRSP 具有4 種不同類型的基序組成模式(圖2):模式a 包含motif1~5,模式b 比模式a 缺少motif5 和motif3,模式c 包含motif1~4,模式d只包含motif1 和motif2。除普通牛和彎角劍羚外,其他??莆锓NTHRSP 基序組成都為模式a類型,與非??撇溉閯游颰HRSP 基序模式相似,但??婆c雞差異較大。THRSP 蛋白包含2 種保守結構域,??莆锓N中普通牛、雜交牛和牦牛以及除了原麝和雞以外的其他非??莆锓N的THRSP 保守結構域為Spot_14,水牛、山羊、綿羊、彎角劍羚、四川羚羊、原麝和雞的保守結構域為Spot_14 超家族,??莆锓N及其他非??苿游锉J亟Y構域的位置大致相同。

圖2 ??坪头桥?莆锓NTHRSP 的Motif 組成和保守結構域Fig.2 Motif composition and conserved domains of THRSP in the species of Bovidae and Non-Bovidae

2.2.3 ??莆锓NTHRSP 功能修飾位點

??莆锓NTHRSP 蛋白功能修飾位點有2 種,即酪蛋白激酶Ⅱ磷酸化位點和蛋白激酶C 磷酸化位點;人和小鼠比??莆锓N多了N-豆蔻?;稽c和N-糖基化位點,雞比??莆锓N多了N-豆蔻?;稽c、亮氨酸拉鏈結構以及cAMP 和cGMP 依賴性蛋白激酶磷酸化位點;??莆锓N及其他非??撇溉閯游锵嗤δ芰姿峄稽c所處的位置相似,與雞的差異較大(圖3)。

圖3 ??莆锓NTHRSP 蛋白功能修飾位點Fig.3 Functional modification site of THRSP protein in the species of Bovidae

表2THRSP基因CDS 核苷酸組成
Tab.2 Nnucleotide composition ofTHRSPCDS %

注:物種及其基因序列號對應的物種中文名見表1;下同。Note: The Chinese names of species and accession number of gene sequences are shown in Tab.1;the same as below.

2.2.4 二級結構和三維結構

??莆锓N間THRSP 蛋白二級結構元件的氨基酸比例相似,與其他非??苿游锏牟町愝^大(表6)。水牛、牦牛和四川羚羊的THRSP 蛋白三維結構與模板3ont.1.A 的覆蓋率為96% (AA:7~156),一致性為72.00%;雜交牛、綿羊和山羊的三維結構與模板3ont.1.A 的一致性為73.33%,覆蓋率為96% (AA:1~156);普通牛和彎角劍羚的三維結構與模型模板3ont.1.A 的一致性和覆蓋率分別為73.33%和100% (AA:1~150)(圖4)。

圖4 ??莆锓NTHRSP 蛋白的三維結構Fig.4 Three-dimensional structures of THRSP protein in the species of Bovidae

表6 THRSP 蛋白4 種二級結構的氨基酸占比Tab.6 Amino acid proportion of four secondary structures in THRSP protein %

2.2.5 蛋白互作、參與的生物學路徑和分子功能

各??莆锓N與THRSP 相互作用的蛋白質不盡相同,其中脂肪酸合成酶、甘油-3-磷酸?;D移酶、乙酰輔酶A 合成酶2 和RAS 癌基因家族成員是與THRSP 互作的蛋白質(圖5)。這些蛋白分子主要與脂肪酸的合成和β-氧化、蛋白質代謝和轉運、跨細胞膜或細胞器的物質轉運、溶酶體與吞噬體的融合、囊泡介導的物質運輸等生物學過程有關。THRSP 蛋白主要參與脂類的生物合成(GO:0046890)、脂肪酸代謝(GO:0006631)、乙酰輔酶A 代謝(GO:0006084)、?;o酶A 的生物合成(GO:0071616)等生物學過程,其分子功能主要與脂肪酸合酶活性(GO:0004312)和蛋白質同源二聚化活性(GO:0042803)相關。

圖5 ??莆锓NTHRSP 互作蛋白網絡Fig.5 Interaction protein network of THRSP in the species of Bovidae

2.2.6 序列一致性和系統發育分析

??莆锓NTHRSP基因包含2 種長度的CDS(471 和453 bp),其編碼產物相差6 個氨基酸。??莆锓N間THRSP基因CDS 及編碼氨基酸序列的一致性高,其中核苷酸序列一致性為93.2%~96.9%,氨基酸序列一致性為91.3%~94.0%;??莆锓N與非??撇溉閯游锏男蛄幸恢滦暂^低,核苷酸和氨基酸的序列一致性分別為78.6%~95.3%和72.0%~94.6%;??婆c雞的序列一致性最低,核苷酸和氨基酸的序列一致性分別為51.0%~52.8%和32.2%~35.5% (圖6)。序列差異位點分析表明:位點c.79C、c.162T、c.191A、c.226A、c.423G 和c.466G 是區分牛屬動物與水牛、羊屬動物的核苷酸位點;位點c.91A、c.157A、c.180T、c.222A、c.253C、c.288C 和c.423T 是區分水牛與牛屬、羊屬動物的核苷酸位點;水牛特有的氨基酸位點為p.31S、p.59T、p.74I 和p.85Q;p.54H、p.64N、p.76M、p.96E 和p.156V 是區分牛屬動物與水牛、羊屬動物的氨基酸位點;p.57T 和p.90L是區分羊屬動物與水牛、牛屬動物的氨基酸位點(圖7)。

圖6 ??坪头桥?莆锓NTHRSP 基因核苷酸(a)及編碼氨基酸(b)的序列一致性Fig.6 Consistency of THRSP nucleotides (a) and their encoded amino acid (b) sequences in the species of Bovidae and non-Bovidae

圖7 ??坪头桥?莆锓NTHRSP 基因核苷酸(a)及編碼氨基酸(b)序列的差異位點Fig.7 Difference sites in THRSP nucleotides (a) and their encoded amino acid (b) sequences in the species of Bovidae and non-Bovidae

基于各物種THRSP基因核苷酸和編碼氨基酸序列構建的系統發育樹聚類關系相似,??莆锓N聚為一大支,其中水牛和牛屬動物聚為一小支,羊屬動物聚為單獨的一小支;非??撇溉閯游锞蹫橐恢?圖8)。

圖8 基于核苷酸序列(a)和氨基酸序列(b)構建的??坪头桥?莆锓NTHRSP 系統進化樹Fig.8 Phylogenetic trees of THRSP between the species of Bovidae and non-Bovidae based on the sequences of nucleotide (a) and amino acid (b)

3 討論

??萍倚竽転槿祟愄峁┴S富的肉類、乳制品等畜產品,同時具有役用價值,在農業生產中具有重要地位。研究表明:THRSP基因與奶牛和山羊乳脂肪酸的從頭合成、雜交牛的肌內脂肪和韓國牛的肌肉脂肪酸種類及胴體性狀相關,是調節??萍倚笾铣傻闹匾δ芑?,然而,目前關于該基因的研究主要涉及普通牛和山羊等少部分??萍倚骩7-8,14-15],對其他??萍倚蟮难芯旷r有報道?;诖?,本研究采用比較基因組學和生物信息學分析方法對??萍倚骉HRSP基因及其編碼產物的理化特性和結構特征、蛋白互作以及參與的生物學路徑與功能等進行了深入的比較分析,旨在闡明??苿游颰HRSP 在分子特征及功能上的差異。

本研究表明:??莆锓N間THRSP基因CDS的長度存在差異,但堿基組成和CUB 一致性高,其編碼蛋白的理化特性、二級結構、3-D 結構、基序組成模式、保守結構域、功能位點等高度相似,但呈現屬間差異,與其他非??莆锓N也具有一定的相似性;系統發育分析表明:??芓HRSP 蛋白序列聚為一大支,表明??圃摰鞍椎墓δ芨鼮橄嗨???梢?,THRSP基因在??萍胺桥?撇溉閯游镏泄δ鼙J?,但??萍倚箝g的功能更為相似。已有研究發現:THRSP基因主要表達于肝臟、乳腺、皮下脂肪等組織,它能調節脂肪酸合成基因的轉錄,參與這些組織中脂肪酸的從頭合成過程[2-3,8,16-17]。敲低Spot14 小鼠的乳腺中三酰甘油(triacylglycerol,TAG)含量顯著降低,表明Spot14 是泌乳期小鼠乳腺脂肪酸從頭合成所必需[2];Spot14 還與泌乳期小鼠乳腺中中鏈脂肪酸(medium chain fatty acids,MCFA)的合成以及脂肪從頭合成關鍵酶(fatty acid synthase,FASN)基因的表達相關[18];Spot14 對人乳腺癌細胞的增殖和乳脂合成具有促進作用,敲低Spot14 還會誘導細胞凋亡[19]。THRSP基因的表達還與牛肌肉[15]、脂肪[14]以及奶牛乳品質有關[7,9-10]。如:韓國牛THRSP基因的多態性位點與肌肉大理石紋評分、脂肪酸組成及胴體性狀相關聯[15];夏洛萊?!梁伤固古<戎舅岷颗cTHRSP基因的表達量正相關[14];與低乳脂率奶牛相比,高乳脂率奶牛乳腺THRSP的mRNA和蛋白的相對表達量顯著升高,且過表達牛乳腺上皮細胞中的THRSP基因,TAG含量顯著增加,并上調FASN、過氧化物酶體增殖物激活受體γ (peroxisome proliferator-activated receptor γ,PPARγ)和固醇調節元件結合蛋白1(sterol regulatory element binding protein 1,SREBP1)等重要脂肪生成酶基因的表達,提示THR-SP基因能通過調節脂代謝基因的表達進而調節乳脂合成過程,其在乳腺中的表達量可能是奶牛乳脂率的標志[7];THRSP基因在山羊皮下脂肪組織的表達量最高,在乳腺的相對表達水平極低,但泌乳高峰期的表達量顯著高于干奶期,對調節山羊乳腺上皮細胞的脂肪酸從頭合成和去飽和過程具有重要作用[8]。

本研究還表明:??莆锓NTHRSP 定位于細胞核,無跨膜區和信號肽序列,包含1 個Spot_14或Spot_14 超家族保守結構域,參與的生物學過程主要與脂類的生物合成、脂肪酸代謝、乙酰輔酶A 代謝、?;o酶A 的生物合成等相關,分子功能主要與脂肪酸合酶活性及蛋白質同源二聚化活性相關;與之互作的蛋白質分子主要與脂肪酸的合成和β-氧化、蛋白質代謝和轉運、跨細胞膜或細胞器的物質轉運、溶酶體與吞噬體的融合、囊泡介導的物質運輸等生物學過程有關。因此,推測THRSP基因可能與??莆锓N脂肪酸的合成過程相關,特別是參與了乳脂合成過程的調節。

4 結論

??莆锓NTHRSP基因轉錄區的結構、CDS長度、堿基組成及其編碼產物的理化特性和結構有一定差異,但具有較高的一致性。??芓HRSP 蛋白均是定位于細胞核的親水蛋白質,含有1 個Spot_14 或Spot_14 超家族保守結構域,參與的生物學過程主要與脂類的生物合成有關,分子功能主要與脂肪酸合酶活性及蛋白質同源二聚化活性相關。推測THRSP 蛋白參與了??莆锓N脂合成(包括乳脂合成)的調節。

猜你喜歡
密碼子核苷酸位點
單核苷酸多態性與中醫證候相關性研究進展
徐長風:核苷酸類似物的副作用
鎳基單晶高溫合金多組元置換的第一性原理研究
CLOCK基因rs4580704多態性位點與2型糖尿病和睡眠質量的相關性
密碼子與反密碼子的本質與拓展
Acknowledgment to reviewers—November 2018 to September 2019
二項式通項公式在遺傳學計算中的運用*
10種藏藥材ccmFN基因片段密碼子偏好性分析
廣東人群8q24rs1530300單核苷酸多態性與非綜合征性唇腭裂的相關性研究
茶樹CsActin1基因密碼子偏性分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合