?

粗毛纖孔菌轉錄組密碼子偏好性分析

2023-11-23 06:10劉備備楊貴明宋永學
北方蠶業 2023年3期
關鍵詞:孔菌密碼子堿基

王 敬 李 立 劉備備 王 暉 王 鵬 楊貴明 宋永學*

(1.承德醫學院蠶業研究所/ 2.河北省高校特色蠶桑應用技術研發中心,河北承德 067000;3.承德醫學院生物醫學工程系,河北承德 067000;4.天津脈絡醫學檢驗有限公司,天津 30038;5.承德應用技術職業學院,河北承德 067000)

桑黃是銹革孔菌科(Hymenochaetaceae)一類真菌的統稱,包括許多個種,藥用價值極高[1]。其中粗毛纖孔菌(Inonotushispidus)是桑黃類群的一個種,其子實體符合本草古籍中記載的桑黃特征,寄生于桑、柳等闊葉樹的樹干上,子實體為一年生,革質至軟木栓質,干后木栓質,側生無柄,菌蓋平展呈半圓形,表面黃色至暗褐色,被粗毛,無環帶,下生菌孔。分布于華北、東北、西北等地。桑黃作為中藥使用已有兩千多年的歷史,《神農本草經》《藥性論》《本草綱目》等許多中醫古籍中均有記載?!侗静輬D經》云:“桑耳—名桑黃,有黃熟陳白者,又有金色者,皆可用”[2]。并附有“信州桑黃”圖一幅,圖中桑黃上有毛,符合粗毛纖孔菌特征。桑黃具有活血、化飲,止瀉等功效,常用于血崩,血淋,脫肛、瀉血等的治療?,F代醫學研究發現桑黃中所含有的多糖[3]、黃酮[4]、萜類[5]等多種活性成分具有很好的抗腫瘤[6]、降血糖[7]、提高免疫力等功效[8]。

遺傳密碼子是連接蛋白質和DNA的信息橋梁[9]。人體所存在的氨基酸中絕大多數的氨基酸往往對應著幾種不同編碼的密碼子。這種編碼同一種氨基酸的不同密碼子就被稱之為同義密碼子。然而對于編碼同一種氨基酸的密碼子來說,生物體對于選擇哪種密碼子并不是隨機的,而是有著自身的選擇偏好性,且這種偏好性在不同的物種之間,甚至是同一物種的不同部位也有著很大的區別。有實驗研究發現,選擇最優密碼子可使相關基因和蛋白質的表達量增加[10]。同時,通過篩選最優密碼子可提高生物的外源基因表達量[11]。

本研究通過對粗毛纖孔菌轉錄組密碼子使用的偏好性進行研究,揭示其密碼子的使用規律,并與4種生物的密碼子使用偏好性進行對比,為提高粗毛纖孔菌基因的表達及選擇合適的異源表達宿主提供一些理論基礎。

1 材料與方法

1.1 材料及編碼序列的篩選

用承德地區野生粗毛纖孔菌桑黃子實體提取菌種后,進行人工栽培,接種栽培菌包后于室內避光恒溫28 ℃培養。30天后菌絲長滿菌包,轉入溫室大棚培養18 d(散射光小于1 000 Lx,20~32 ℃),在出子實體之前,在每個菌包的同樣位置挖取菌絲組織,液氮速凍,-80 ℃保存。將所需的材料送檢至北京諾禾致源科技股份有限公司進行測序工作。測序工作完成后對編碼序列進行篩選:使用perl語言選取長度≥300 bp且以ATG為起始密碼子,TAG、TGA、TAA為終止密碼子的完整的編碼序列,并將重復的序列刪除,最終的得到所需的編碼序列[12]。

1.2 密碼子堿基組成分析

使用CodonW軟件計算粗毛纖孔菌轉錄組編碼序列GC的含量、有效密碼子數(ENC)、密碼子中第3位堿基的GC含量(GC3s)和相對同義密碼子相對使頻率(RSCU)等。使用Python對GC12(GC1與GC2的平均值)的值進行計算[13]。

1.3 中性繪圖分析

中性繪圖:以GC3s的值為橫坐標、GC12的值為縱坐標。當GC12和GC3s相關且二者回歸線斜率趨近1時表明突變是影響密碼子偏好性的主因。反之,則是由自然選擇導致的密碼子偏好性[14]。

1.4 ENC-plot繪圖分析

ENC-plot繪圖:以GC3s作為橫坐標,ENC值作為縱坐標作圖,公式為:ENC=2+GC3s+29/[GC3s2+(1-GC3s)2]。ENC的值在20~61的范圍之間,當ENC的值越大說明密碼子的偏好性越弱,反之則說明密碼子的偏好性越強[15]。

1.5 PR2-Bias plot偏倚分析

PR2-Bias plot:以GC[G3/(G3+C3)]的值為橫坐標,AT[A3/(A3+T3)]的值為縱坐標作圖。若基因不受突變壓力或自然選擇的影響時T=A,C=G。但實際上由于生物體收到外界環境的影響導致基因突變、選擇壓力等的作用是會導致G、C的數量變化[16]。

1.6 最優密碼子的篩選

RSCU值指的是編碼某一氨基酸的密碼子與能夠編碼這個氨基酸的所有密碼子的比值。當RSCU的值大于1時表明密碼子使的偏好性較大。將ENC的由小到大依次排列,選取最小值的10%和最高值的10%的編碼序列分別建成高表達庫和低表達庫,并計算出兩個表達庫的RSCU值,兩個表達庫的差即為ΔRSCU。當ΔRSCU的值大于等于0.08的密碼子即為最優密碼子。

1.7 粗毛纖孔菌與模式生物之間的密碼子偏好性比較

在Codon Usage Database(http://www.kazusa.or.jp/codon/)網站上下載庫德里阿茲威酵母、家蠶、擬南芥和大腸桿菌的密碼子使用頻率,并與粗毛纖孔菌轉錄組編碼基因密碼子使用頻率進行比較。

1.8 數據作圖

使用Origin 2023b作圖并進行分析。

2 結果與分析

2.1 粗毛纖孔菌GC含量的分析

通過使用Perl語言對粗毛纖孔菌轉錄組數據進行篩選,共篩選出符合條件的10 716條CDS序列。對篩選出的10 716條CDS序列進行分析,結果顯示:粗毛纖孔菌轉錄組編碼基因的總GC含量在31.6%~71%,并主要分布在50%~55%之間;粗毛纖孔菌的平均總GC的含量為51.7%。這說明粗毛纖孔菌轉錄組密碼子偏向于使用G、C堿基(結果如圖1A所示),但偏好性不是很強。GC3s的總含量在25.6%~90.4%之間,GC3s的總平均含量為50.8%且大部分的基因分布在50% ~60%之間,說明粗毛纖孔菌轉錄組基因的末位更偏向于使用G、C為結尾的堿基(結果如1圖B所示)。

圖1 粗毛纖孔菌轉錄組GC和GC3s含量的柱狀圖

2.2 粗毛纖孔菌的中性繪圖分析

由粗毛纖孔菌的中性繪圖分析結果顯示GC12的含量范圍為33.8%~73.0%,大部分的基因樣本分布在回歸線(y=-0.13667x+57.84914)的兩側,GC12與GC3的關系為負相關,且相關性系數為-0.13667,R2為0.04005(結果如圖2所示),GC12與GC3的相關性較弱,說明密碼子1、2位上的堿基與3位的堿基基本無關聯性,即粗毛纖孔菌密碼子使用的偏好性受自然環境影響最大。

圖2 粗毛纖孔菌轉錄組GC12和GC3含量的中性繪圖分析

2.3 粗毛纖孔菌的ENC-plot繪圖分析

粗毛纖孔菌轉錄組ENC的范圍是27.98~61,平均值是59.41。根據ENC=35為密碼子偏好性強弱的分界值,粗毛纖孔菌轉錄組基因的編碼序列中有24條(占比為0.22%)這部分基因在密碼子的使用上具有比較強的偏好性;ENC值為61的編碼序列有1852條(占比為17.3%),這部分基因在密碼子的使用上無偏好性。通過ENC-plot的圖示觀察發現,基因沒有均勻的分布在期望曲線的兩邊(圖3所示)。

圖3 ENC-GC3s相關性分析

綜合上述分析,受選擇壓力的作用,粗毛纖孔菌轉錄組密碼子的偏好性較低,但在不同的基因中密碼子使用的偏好性有一定程度上的差異,通過公式:ENC比值=(ENC期望值-ENC觀測值)/ENC得出表1的數據。

表1 ENC比值分布

由表1可以看出,比值主要集中在-0.1~ 0.2之間,為總基因的88.4%,ENC期望值和觀測值之間的差異較小,說明粗毛纖孔菌轉錄組密碼子的偏好性主要受突變壓力和自然選擇的影響。

2.4 PR2-Bias plot 分析

根據偏倚性分析,粗毛纖孔菌轉錄組基因的平均分布位置為(0.4915,0.4824),從圖4可以看出大部分轉錄組基因都分布在中心位置的附近,少部分的基因相對于中心有一定程度上的偏離。這進一步說明了粗毛纖孔菌轉錄組基因密碼子使用的偏好性主要來源于突變壓力產生的影響。

圖4 A3/(A3 + T3)與G3/(G3 + C3)的偏倚性分析

2.5 粗毛纖孔菌同義密碼子的使用頻率及最優密碼子分析

RSCU值指的是編碼某一氨基酸的密碼子與能夠編碼這個氨基酸的所有密碼子的比值。當RSCU的值大于1時表明密碼子使用的偏好性較大,說明編碼某一氨基酸的密碼子使用偏好性較強;當RSCU值小于1時說明密碼子的使用偏好性較弱;當RSCU的值等于1時說明密碼子無使用偏好性。

從表2中可以看出:RSCU>1的密碼子有35個,且在這些密碼子中,第三位置的堿基以A結尾的有7個;以U為結尾的有10個;以C為結尾的有9個;以G為結尾的有9個。說明粗毛纖孔菌轉錄組密碼子在同義密碼子使用頻率中在第三位密碼子的選擇上無大的差別。

粗毛纖孔菌轉錄組最優密碼子的個數為14,分別為UUC、UCC、UAC、UGC、CUU、CUC、CGC、AUC、ACG、AAC、AAG、GUC、GCG、GAG,且在最優密碼子中第三位堿基中C、U、G的數量分別為9、1、4。這說明在最優密碼子的選擇上,粗毛纖孔菌轉錄組在堿基第三的位置上更為傾向于使用C和G 。

2.6 密碼子使用頻率的比較

不同物種之間對于密碼子使用的偏好性不同,因此,研究不同物種間在密碼子使用上的偏好性差異有利于提高目標基因在進行外源表達時的效率。當兩個物種在同一密碼子使用頻率上的比值≤0.5或≥2.0,說明它們在使用同一密碼子時的偏好性較大,反之則說明在密碼子的使用上差異較小。

粗毛纖孔菌與庫德里阿茲威酵母、家蠶、擬南芥和大腸桿菌密碼子使用頻率的比較如圖5所示。粗毛纖孔菌與這四種生物之間密碼子使用的偏好性有著不同程度上差異:與庫德里阿茲威酵母密碼子使用頻率的比值結果中,大于等于2的密碼子為3種,小于等于0.5的密碼子為59種;與家蠶密碼子使用頻率的比值結果中,大于等于2的密碼子為0種,小于等于0.5的密碼子為58種;與擬南芥密碼子使用頻率的比值結果中,大于等于2的密碼子為1種,小于等于0.5的密碼子為61種;與大腸桿菌密碼子使用頻率的比值結果中,大于等于2的密碼子為1種,小于等于0.5的密碼子為60種。這說明粗毛纖孔菌與這幾種生物在密碼子使用偏好性上均有很大程度上的差異性。

圖5 粗毛纖孔菌與其他物種密碼子偏好性的成對比較

3 討 論

生物在自然選擇條件下不斷進化,最終形成了一套自己所特有密碼子的使用模式,而這種模式在不同種物種之間,甚至是在自身的不同器官中差異往往也是不同的[17]。研究密碼子使用的偏好性可以為后續研究提供一定程度上的應用價值,例如可以提高異源基因的表達效率、預測蛋白質的結構及功能、解析生物體的進化規律等[18-19]。本研究以粗毛纖孔菌轉錄組中的10 716條編碼基因為研究對象,通過使用CodonW軟件和perl語言對它的密碼子使用偏好性進行研究,發現粗毛纖孔菌轉錄組編碼基因的總GC含量在31.6%~71%之間,平均值為51.7%,GC3s含量在25.6%~90.4%之間,平均值為50.8%。從這些數據中可以看出GC3s的含量范圍要大于總GC的含量范圍,表明GC3s的含量不集中,且粗毛纖孔菌轉錄組密碼子和末尾堿基偏向于使用G、C堿基,但偏好性不是很強。粗毛纖孔菌轉錄組ENC值的范圍是27.98~ 61,平均值59.41高于35,且轉錄組編碼序列ENC值大于35的占97.8%,說明粗毛纖孔菌密碼子在使用時偏好性較弱。這與對馬尾松[20]、橄欖[21]的研究結果一致。偏倚性分析的結果顯示大部分的基因分布于中心的周圍,少部分基因偏離中心,說明粗毛纖孔菌轉錄組密碼子偏好性主要來源于突變壓力對其產生的影響。粗毛纖孔菌轉錄組編碼基因的ENC值與ENC期望值的差別不大,說明粗毛纖孔菌在密碼子使用偏好性上是受突變壓力和自然選擇等多重因素的影響,這和大黃[22]轉錄組密碼子偏好性的研究一致。

粗毛纖孔菌轉錄組的編碼基因中,RSCU>1的密碼子有35個,且在這些密碼子中,第三位置的堿基以A結尾的有7個;以U為結尾的有10個;以C為結尾的有9個;以G為結尾的有9個。說明粗毛纖孔菌轉錄組密碼子在同義密碼子的使用頻率中在第三位密碼子的選擇上無大差別,但在最優密碼子的使用上在堿基第三的位置上更為傾向于使用C和G。粗毛纖孔菌與庫德里阿茲威酵母、家蠶、擬南芥和大腸桿菌密碼子使用頻率差異較大,這說明粗毛纖孔菌與這幾種生物在密碼子使用偏好性上均有很大程度上的差異性[23],因此,若選擇粗毛纖孔菌進行外源基因表達時應避開這幾種生物作為外源表達體。

本研究通過對粗毛纖孔菌轉錄組編碼序列密碼子進行偏好性分析并探討導致密碼子偏好性的影響因素。結果顯示粗毛纖孔菌密碼子使用的偏好性比較弱,說明突變壓力和自然選擇為影響密碼子使用偏好性的主要原因。通過對粗毛纖孔菌密碼子偏好性的分析,從中篩選出14個最優密碼子,可為粗毛纖孔菌桑黃在基因工程、遺傳機理及在其他生物體中進行異源表達提供一些參考價值及理論基礎。

猜你喜歡
孔菌密碼子堿基
樺褐孔菌的生物活性及其應用研究
樺褐孔菌的研究現狀及應用前景*
應用思維進階構建模型 例談培養學生創造性思維
密碼子與反密碼子的本質與拓展
中國科學家創建出新型糖基化酶堿基編輯器
生命“字母表”迎來4名新成員
生命“字母表”迎來4名新成員
10種藏藥材ccmFN基因片段密碼子偏好性分析
擬黃薄孔菌菌絲體的固體培養條件及CAT和SOD活力動態研究
紅緣擬層孔菌發酵物體外抗氧化活性研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合