?

橡膠樹種子性狀相關基因的預測與功能研究

2023-07-17 07:51劉嘉智劉長寧
熱帶農業科技 2023年3期
關鍵詞:蓖麻橡膠樹同源

劉嘉智,劉長寧

(1.中國科學院西雙版納熱帶植物園,云南勐臘 666303;2.中國科學院大學,北京 100049)

橡膠籽是天然橡膠種植生產中的重要副產品,橡膠籽的含油量為35%~50%,年產量可達2 060 kg/hm2[1],與其 他 非 食用 植 物 油相 比,橡膠籽油燃燒的CO2和NO2排放率更低,是理想的生物柴油來源[2-3]。然而,目前對橡膠樹的利用主要集中于獲取天然橡膠,忽略了橡膠籽作為生物柴油的巨大潛力,與之相關的研究也并不充足。

通常,具有同源序列的蛋白編碼基因具有相似的功能,因而基于同源分析可以在近緣物種中預測相關功能基因。本研究基于共線性分析和同源分析,利用目前研究中較為深入的蓖麻全基因組關聯分析數據,將蓖麻野生型品種中種子農藝性狀相關的基因映射到橡膠樹reyan7-33-97 品種基因組上,使用生物信息學手段預測橡膠樹中種子性狀相關基因并進行基因功能分析,為橡膠籽的合理開發利用提供理論參考。

1 材料和方法

1.1 數據來源

蓖麻野生型品種的基因組文件以及基因組注釋文件下載于http://oilplants.iflora.cn/Download/castor_download.html,橡膠樹reyan7-33-97 品種的基因組文件以及基因組注釋文件從https://www.ncbi.nlm.nih.gov/data-hub/genome/GCF_001654055.1/下載。從上述文件分別提取基因ID、序列信息、基因組位置信息和功能描述等內容。從NCBI SRA 數據庫中收集具有文獻來源且為雙端測序的蓖麻和橡膠樹根、莖、種子3 種組織的轉錄組數據,樣本編號分別為SRR3136156、SRR6127585、SRR3136168、SRR17218208、SRR17218209、SRR17218216。

1.2 研究方法

1.2.1 橡膠樹種子性狀相關基因預測

根據文獻調研[4],在蓖麻野生型品種中收集基于全基因組關聯分析得到的種子特征性狀相關的SNP 位點。根據基因組注釋信息,在上述SNP 位點前后50 kb 范圍內提取基因,并認為這些基因可能與種子特征有關。

橡膠樹與蓖麻同屬大戟科,具有較近的親緣關系,因此,首先判斷蓖麻種子性狀相關基因所在區塊在橡膠樹中是否存在共線區塊。由于橡膠樹reyan7-33-97 品種基因組只組裝到scaffold 級別,使用BLAST 進行共線性分析后認為存在3 個及以上基因,且基因之間相互間隔不超過50 kb的片段具有共線性。然后,使用Orthofinder 軟件[5]對這兩個物種進行同源組鑒定,得到的結果再根據雙向BLAST 最優策略進一步確定同源基因,并根據基因結構驗證預測的同源基因是否可靠,最終將收集到的蓖麻野生型種子性狀相關基因比對到橡膠樹基因組上,來挖掘橡膠樹中與種子特征性狀相關的基因。

1.2.2 表達譜分析和差異表達分析

下載蓖麻和橡膠樹根、莖、種子3 種組織對應的轉錄組原始測序文件,使用Trim Galore 進行質控檢測去除低質量堿基和接頭。利用HISAT2 軟件[6]對基因組序列構建索引后進行序列比對,使用Stringtie 工具[7]進行定量分析來獲取基因水平上的Raw counts、TPM 值以及FPKM 值。將TPM 值進行歸一化處理,使用R 包pheatmap 繪制表達量熱圖,并對上述兩個物種得到的表達量結果進行比較。使用GFOLD 1.1.4 軟件[8]對橡膠樹基因進行差異表達分析,進一步挖掘橡膠樹中與種子性狀相關基因在種子與根、莖之間的表達差異。

1.2.3 miRNA 靶位點預測

根據文獻調研[9]以及pmiren 數據庫[10]中獲取橡膠樹的成熟miRNA 序列,使用gffread 軟件提取轉錄本序列,使用psRNATarget 在線工具[11]默認參數進行miRNA 靶基因預測,從預測結果中篩選期望值大于3.5 的相互作用的miRNA 和靶基因,使用Cytoscape 軟 件[12]將miRNA 與 靶 基因 間的 網絡關系進行可視化展示。

1.2.4 蛋白互作網絡預測

基于同源組劃分,以擬南芥蛋白互作網絡作為參考映射到橡膠樹中,獲得橡膠樹reyan7-33-97 的蛋白互作網絡。從String 數據庫[13]中下載擬南芥蛋白互作物理子網,使用Orthofinder 軟件預測擬南芥與橡膠樹reyan7-33-97 之間的蛋白同源群組。使用Cytoscape 軟件對橡膠樹種子性狀相關候選基因進行網絡可視化。

2 結果與分析

2.1 橡膠樹種子性狀相關基因預測

在野生型蓖麻中共發現18 個與種子特征性狀相關的SNP 位點,這些SNP 位點分別與種子面積(SA)、種子長度(SL)、種子厚度(ST)、種子寬度(SW)以及單粒重(SSW)等5 個特征形狀相關。根據蓖麻基因組注釋文件,在上述SNP 位點上下50 kb 范圍內共有67 個基因(圖1),分別位于蓖麻的1、2、3、5、6 以及9 號染色體上(表1)。其中Rc01G001599、Rc01G001600、Rc01G001601、Rc01 G001602、Rc01G001603、Rc01G001604、Rc01G001605、Rc01G001606、Rc01G001607、Rc01G001608、Rc01G 001609 對上述5 個性狀都產生影響。

表1 蓖麻野生型種子特征相關基因

圖1 蓖麻野生型種子性狀相關基因統計

基于共線性分析,在蓖麻野生型與橡膠樹reyan7-33-97 中發現4 個共線區塊,分別位于蓖麻的2、5、6 以及9 號染色體上,對應橡膠樹的NW_018746954.1、NW_018745856.1、NW_018746236.1 以及NW_018746078.1 這4 條scaffold,共 覆 蓋19 個基因(表2)。根據Orthofinder 軟件,在蓖麻野生型與橡膠樹reyan7-33-97 中共鑒定到16 926 個同源組,根據雙向BLAST 最優確定二者之間序列相似程度,上述67 個蓖麻基因最終在橡膠樹中比對得到49 個基因。對上述橡膠樹基因以及同源蓖麻基因根據基因結構作圖進行驗證(圖2),發現基因結構與最終得到的基因序列預期結果相符。

表2 蓖麻野生型與橡膠樹reyan7-33-97共線區塊基因統計

圖2 蓖麻野生型與橡膠樹reyan7-33-97同源基因結構圖

2.2 種子性狀相關表達譜和差異表達分析

為進一步探究蓖麻和橡膠樹種子性狀相關基因的功能,進行了組織表達譜的分析,圖3 是蓖麻和橡膠樹種子性狀相關基因的組織表達譜。從中發現,有些同源基因在3 個組織中的表達量類似,但有些差別很大。對蓖麻和橡膠對應的49 個基因在種子中表達結果進行統計,發現在兩個物種中有5 個基因均為正表達,25 個基因均為負表達,19 個基因表達相反,這可能是由于物種在分化過程中部分基因功能改變導致的。

圖3 蓖麻和橡膠樹種子性狀相關基因組織表達譜

根據差異表達分析,選出16 個在種子中表達量遠高于根莖的基因、17 個在種子中表達量遠低于根莖的基因以及5 個在三者之中都沒有差異表達的基因,其余基因在3 個組織中無交集(表3)。

表3 種子與根莖差異表達基因

2.3 miRNA 靶位點預測

基因的miRNA 靶位點預測也是研究基因調控的重要途徑。本研究共收集到橡膠樹的217 條成熟miRNA 序列,對橡膠樹種子性狀相關基因進行miRNA 靶位點預測,結果發現LOC110671483、LOC110673189、 LOC110645416、 LOC110651200、LOC110672934、 LOC110641727、 LOC110653311、LOC110659520 受到不同miRNA 調控(圖4)。由于miRNA 在物種進化中相當保守,大部分miRNA 在特定的組織和發育階段表達,我們預測得到的miRNA 許多功能都與種子性狀相關。例如之前研究發現miR156 參與調控擬南芥種子成熟過程[14]、miR408 在水稻種子發育中具有重要作用[15]等,因此推測上述8 個基因可能受到miRNA 調控影響種子發育,從而影響了種子特征性狀。

圖4 橡膠樹種子性狀相關基因miRNA靶位點預測

2.4 蛋白互作網絡預測

基于同源組的劃分,橡膠樹reyan7-33-97 品種中共有22 815 個基因映射到19 762 個擬南芥基因。根據預測得到的橡膠樹蛋白互作網絡,我們將橡膠樹reyan7-33-97 品種中與種子性狀相關的49 個基因放入蛋白互作網絡中,發現除LOC110654127 和LOC110668244 外,其 它 基 因 之 間不存在邊。這可能是影響種子性狀的橡膠樹候選基因與其他基因也存在相互作用導致的。為此,提取這49 個基因以及最近的相鄰基因重新進行網絡構建,結果發現其中16 個橡膠樹種子性狀候選基因通過一級相互連接構成網絡(圖5),因此認為這16 個基因存在間接蛋白相互作用從而影 響 種 子 性 狀,LOC110654127 和LOC110668244 同時存在直接蛋白相互作用影響種子性狀,而其它33 個基因可能單獨影響種子性狀或者存在不同于擬南芥的蛋白互作成員。

圖5 橡膠樹種子性狀候選基因蛋白互作網絡

3 展望

本研究使用全基因組關聯分析、基因組共線性分析和基因序列同源分析等多種技術手段,預測了49 個與橡膠樹種子性狀相關的基因并進行了多種組學分析,研究結果為進一步開發利用橡膠籽提供了一定的工作基礎。然而,橡膠籽種子性狀基因與種子產油之間的關系是一個復雜的過程,植物激素的生物合成和信號傳遞對種子大小和形態的控制至關重要,例如赤霉素可以促進種子的擴大和發育[16],而乙烯則可以抑制種子的生長[17]。因此,后續研究可深入挖掘橡膠籽種子性狀基因和植物激素生物合成和信號傳遞通路之間的關系,通過對橡膠樹中這些激素合成和信號傳遞通路進行深入分析,揭示橡膠籽種子性狀基因在種子性狀形成過程中的作用機制,以便更好地理解種子大小和形態的調控機制,為橡膠樹的育種和生產提供指導。

猜你喜歡
蓖麻橡膠樹同源
兩岸年味連根同源
橡膠樹寒害減災技術研究
中國熱科院突破橡膠樹死皮康復技術難關
以同源詞看《詩經》的訓釋三則
“鋌”有“直”義的詞源學解釋——兼說/直/義的同源詞族
橡膠樹miRNA 探查
橡膠樹開割季在5月已經開始
虔誠書畫乃同源
巧嘴繞口令
蓖麻蒴果剝殼過程中的力學性能有限元仿真
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合