?

銀杏轉錄組數據中EST-SSR位點的生物信息學分析

2020-04-10 06:57秦姣姣楊玉琦胡曉艷
江蘇農業科學 2020年3期
關鍵詞:轉錄組銀杏

秦姣姣 楊玉琦 胡曉艷

摘要:銀杏(Ginkgo biloba L.)是雌雄異株植物,其植株價值因性別不同而異。銀杏轉錄組數據中EST-SSR位點的生物信息學分析將為銀杏遺傳學研究開展提供重要的理論與方法支持。首先通過高通量測序技術獲得銀杏大、小孢子葉球轉錄組數據,然后開展數據拼接組裝與EST-SSR位點挖掘及相應的生物信息學分析。轉錄組數據處理及拼接組裝后共獲得108 307條unigenes,然后利用MISA軟件發掘銀杏轉錄組數據中的SSR位點,最終從8 178條unigenes中檢索出9 668個SSR位點。其中,單核苷酸重復的數量最多,有5 663個;其次是二核苷酸和三核苷酸,重復數量分別為2 471、1 438個;四核苷酸至六核苷酸重復的數量相對較少,共有96個。銀杏轉錄組EST-SSR位點共包含147種重復基元。在單核苷酸重復中,A和T是優勢重復基元類型,分別有2 808、2 685個;在二核苷酸重復基元中,AT與TA數量較多,分別為469、383個,所占比例為34.48%。此外,設計得到6 809對銀杏EST-SSR位點特異引物。銀杏轉錄組EST-SSR位點的發掘將為銀杏遺傳圖譜構建、遺傳性狀分析、幼年期性別鑒定方法的建立等提供有力的理論與方法支持。

關鍵詞:銀杏;轉錄組;SSR位點;重復基元

中圖分類號:S664.301 ? 文獻標志碼: A ?文章編號:1002-1302(2020)03-0090-05

微衛星序列(simple sequence repeat,SSR)是指由1~6個核苷酸為重復單位組成的串聯重復序列,如Tn、(AG)n、(ATG)n、(ATGC)n等,在真核生物基因組中隨機分布。不同物種間SSR位點的分布差異較大,主要表現在基序類型、重復長度以及在染色體上的分布情況等,從而反映出物種間高水平的等位基因多樣性。雖然不同物種間SSR位點的差異性較大,但是SSR位點兩端的序列比較保守,因此可以根據SSR位點兩端的保守序列設計特異性引物以獲得其長度多態性,即SSR分子標記。SSR分子標記技術除了具有操作簡單、易檢測、共顯性、穩定性好等優點外,還具有特異性強、等位基因變異多、受選擇壓力小等特點[1]。開發SSR分子標記的傳統方法所需費用高、工作量大,并且成功獲得陽性克隆和多態性引物的概率偏低[2]。當前,高通量測序技術發展迅速,測序成本顯著降低,為SSR分子標記開發提供了一種全新的方法。轉錄組測序(RNA-Seq)可以全面快速地獲得某一特定組織或器官在特定狀態下幾乎所有的轉錄組信息,也可以根據測序結果開發特異EST-SSR分子標記[3]。目前,RNA-Seq技術已在刺梨(Rosa roxbunghii)[4]、魚腥草(Houttuynia cordata)[5]、杜仲(Eucommia ulmoides)[6]等多種植物上開發出EST-SSR分子標記,并應用于多領域遺傳分析。

銀杏(Ginkgo biloba L.)為銀杏科銀杏屬落葉喬木,雌雄異株,有“金色活化石”之稱,具有良好的觀賞特性與藥用價值[7]。銀杏種子含有銀杏酸等多種生理藥理活性物質[8],但銀杏種子成熟后外種皮有惡臭[9],易污染環境,故在園林綠化上宜使用雄株。銀杏采果園的建設與園林綠化中的資源配置都要求將雌雄株區分開來,然而銀杏實生苗在定植后需15~20年才開花,繼而才能肉眼分辨出雌雄,這顯然不能滿足早期定植時對雌雄性別區分的要求。形態特征鑒別法簡單易行,但仍處于定性階段,缺乏準確的定量標準;同工酶法及染色體核型分析法均可靠,但難以應用于大規模實踐;分子標記法及特異蛋白方面的研究更為準確,但需更高的科技支撐[10]。因此,開發快捷、有效和可靠的銀杏雌雄株早期性別鑒定方法,對銀杏的資源配置及實際應用具有重要意義。利用雌雄特異的EST-SSR標記位點,已經成功地開發出一種早期鑒別杜仲性別的方法[11]。尋找在銀杏雌雄株中存在的與性別相關聯的特異EST-SSR標記位點,或許可以成為快速準確地鑒別銀杏性別的方法,為制定科學合理的配置應用方案提供有力的技術支持。

本研究通過RNA-Seq技術對銀杏大、小孢子葉球進行轉錄組測序,對測序數據進行拼接組裝后獲得unigenes,再對unigenes中包含的EST-SSR位點進行分析,明確銀杏轉錄組EST-SSR位點的組成和分布特征,為后續銀杏遺傳分析及早期性別鑒定方法的建立等研究提供理論支持。

1 材料與方法

1.1 銀杏來源與總RNA提取

銀杏采自山東農業大學林學院銀杏種質資源圃,選取來自于同一家系的銀杏25年生雌雄實生苗各5株,于2015年3月取初開的銀杏大孢子葉球(雌花)和小孢子葉球(雄花)各10個作為試驗材料。每棵樹采集2個樣本,每5個樣本作為1個生物學重復,共設置2個生物學重復。所采樣品用液氮速凍后保存于-80 ℃冰箱備用。使用改良的CTAB法[12]抽取銀杏總RNA,利用Nanodrop 2000和瓊脂糖凝膠電泳檢測總RNA質量和完整性。當總RNA的濃度大于400 ng/μL、28S/18S>1.8時,表明所提取的RNA符合轉錄組測序的要求。

1.2 轉錄組測序及序列拼接組裝

利用NEB Next UltraTM RNA Library Prep Kit for Illumina(NEB,USA)構建cDNA文庫,然后利用Illumina Hiseq 2500測序平臺對構建的cDNA文庫進行雙末端測序。對測序得到的原始序列進行去接頭、去低質量讀段和去重復等處理后,使用軟件Trinity[13]進行de novo組裝,最終得到盡可能長的unigenes。

1.3 銀杏轉錄組EST-SSR位點挖掘

利用MISA軟件[14]對銀杏轉錄組unigenes序列進行EST-SSR位點搜索,搜索標準如表1所示。

1.4 銀杏轉錄組EST-SSR位點引物設計

利用Primer 3.0進行銀杏轉錄組EST-SSR位點引物設計,軟件參數設置采用默認值,針對檢索到的每一個EST-SSR位點同時設計3對特異引物供后期試驗選擇。

2 結果與分析

2.1 總RNA質量檢測結果

經Nanodrop 2000和瓊脂糖凝膠電泳檢測后發現,總RNA濃度為845.7 ng/μL,28S/18S為2.01,表明本研究提取的銀杏總RNA樣品質量高,能夠滿足后續轉錄組測序的要求。

2.2 原始序列組裝結果

銀杏轉錄組測序原始數據經組裝拼接后共得到108 307條unigenes,這些unigenes的總長度為 86 212 372 bp,平均長度為796 bp。序列長度大于1 000 bp的unigenes有23 624條,占全部unigenes的21.81%(圖1)。

2.3 銀杏EST-SSR位點數量分布特征

如表2所示,銀杏轉錄組unigenes序列經檢索后,共發現8 178條unigenes含有9 668個EST-SSR位點,占總unigenes數量的7.55%。從銀杏轉錄組unigenes中共檢索到6種核苷酸重復類型,出現數量最多的是單核苷酸重復,占總EST-SSR位點數量的58.57%,其次是二核苷酸重復,占 25.55%,數量最少的是五核苷酸重復,僅占0.14%。

2.4 銀杏EST-SSR重復基元的分布特征

如圖2所示,在9 668個銀杏EST-SSR位點中,共有147種重復基元出現, 其中單核苷酸、二核苷酸、三核苷酸、四核苷酸、 五核苷酸及六核苷酸重復基元的種類分別有4、12、60、44、13、14種。單核苷酸重復基元中,A和T是優勢重復基元類型,分別有2 808、2 685個,占單核苷酸重復的97.00%;二核苷酸重復基元中,出現次數最多的是AT,有469個,占二核苷酸重復的18.98%,其次是TA,有383個,占15.50%;三核苷酸重復基元中,出現頻率最高的為GAA,占三核苷酸重復的4.79%;四核苷酸、五核苷酸和六核苷酸重復基元類型數量最少,占總EST-SSR位點數量的1.01%。

2.5 銀杏轉錄組EST-SSR位點引物設計

如表3所示,采用Primer 3.0軟件對本研究檢索到的銀杏EST-SSR位點進行特異引物設計,共得到6 809對特異引物,成功率為70.43%。在設計成功的6 809對引物中,擴增產物為單核苷酸重復的最多,有4 012個,占58.92%;其次為二核苷酸和三核苷酸重復基元,分別有2 413、1 095個,分別占35.44%、16.08%。另外,PCR產物為復合型重復(含有1個以上重復基元類型)的有921個,占13.53%。

2.6 銀杏轉錄組EST-SSR位點的可用性評價

多態性是判定分子標記可用性的重要參考指標之一,對于SSR分子標記來說,長度是影響其多態性高低的一個重要因素。研究表明,當SSR長度大于20 bp時,此位點具有高度多態性,當長度在 12~20 bp之間,此位點具有中等水平的多態性,而長度小于12 bp的SSR位點多態性較低[15]。因此本研究中對銀杏轉錄組EST-SSR位點進行搜索時,篩選標準為單核苷酸重復至少10次,二核苷酸重復至少6次,而三核苷酸至六核苷酸的重復次數要大于5次。經統計,銀杏轉錄組EST-SSR位點的長度集中分布在12~45 bp之間,其中長度大于20 bp的EST-SSR位點共有734個,占總EST-SSR位點的7.59%;長度在12~20 bp之間的 EST-SSR位點有4 944個,占總數的51.14%。Zhang等研究發現,高級重復基元類型SSR位點的多態性要低于低級重復基元類型[16]。在本研究中檢索到的銀杏轉錄組EST-SSR位點主要是低級重復基元類型SSR位點,如單核苷酸、二核苷酸、三核苷酸重復所占比例高達84.28%,對銀杏轉錄組EST-SSR位點長度進行統計分析時發現,長度大于20 bp的734個EST-SSR位點中,單核苷酸、二核苷酸重復基元類型有471個, 占比達到64.17%,表明這部分銀杏轉錄組EST-SSR位點具有高度多態性潛能,有很好的利用潛質。

3 討論與結論

SSR位點廣泛分布于真核生物基因組中,據統計,真核生物基因組中每隔10~50 kb就存在1個SSR位點,在植物基因組中,平均每23.3 kb就有1個SSR位點[17]。目前,轉錄組學研究涉及的物種越來越廣泛,尤其是基因組序列還未公布的物種,產生了大量的轉錄組測序數據,對于這些數據的深度挖掘成為目前研究的熱點。本研究通過RNA-Seq技術對銀杏大、小孢子葉球進行了轉錄組測序,經過拼接組裝后得到108 307條unigenes,檢索后得到符合條件的EST-SSR位點9 668個,出現頻率為8.92%,其出現頻率明顯高于魚腥草[5]、云南松[18]等物種,低于刺梨[4]等物種。造成不同物種間 EST-SSR位點出現頻率差異的原因可能是物種間SSR位點組成及分布的差異性。銀杏轉錄組中 EST-SSR位點種類與數量均比較豐富,可為銀杏SSR分子標記的開發提供重要的參考。

不同物種之間EST-SSR位點主要重復類型同樣有所差異。很多植物的EST-SSR位點主要以二核苷酸、三核苷酸重復基元類型為主,比如云南松[18]。本研究發現,銀杏轉錄組EST-SSR位點重復基元類型主要以單核苷酸重復為主,占全部SSR位點的58.57%,其次是二核苷酸重復,這與紅松[19]、白皮松[20]等相似,但與云南松[18]、魚腥草[5]、刺梨[4]等物種有差異,這些物種EST-SSR位點的主要重復基元是三核苷酸重復。SSR位點基序類型中普遍存在A/T優勢,而G/C重復基序類型出現頻率較低,在多數植物中很難發現。導致上述現象的可能原因是打破A/T堿基對之間氫鍵所需的能量要低于G/C堿基對,基因組中A/T的波動較G/C容易[21]。但也有觀點認為,基因組甲基化使C轉化為T,同時3′末端polyA序列插入形成富含A的原始SSR位點,導致重復基序中A/T優勢的出現[22]。本研究發現,銀杏轉錄組EST-SSR位點重復基序類型中單核苷酸重復基元類型出現最多的是A與T,兩者構成的SSR位點占總SSR位點數量的56.82%。其次,二核苷酸重復基元類型中,AT和TA重復基序類型出現次數同樣很高,所占SSR位點比例分別為4.85%、3.96%,表現出較明顯的A/T優勢。而G/C在所有重復基元類型中的出現頻率較低,由C和G組成的單核苷酸重復基元共19個,占總SSR位點的0.16%,二核苷酸重復中GC和CG所占的比例僅分別為0.01%、0.003 7%。銀杏轉錄組EST-SSR位點不僅出現頻率高、平均分布頻率廣,且類型豐富,具有較高的多態性潛能和可用性。本研究積累了大量銀杏EST-SSR位點并明確了其基本特征,可為開發銀杏SSR分子標記奠定重要的理論基礎。本研究的開展對于加快銀杏功能基因資源的開發利用,建立銀杏種質資源評價和改良機制、快速準確的苗期性別鑒定方法等具有重要的意義。

參考文獻:

[1]趙 罕,朱高浦,劉夢培,等. 微衛星分子標記及其在林業中的應用[J]. 世界林業研究,2013,26(6):21-26.

[2]程小毛,黃曉霞. SSR標記開發及其在植物中的應用[J]. 中國農學通報,2011,27(5):304-307.

[3]Sharma R,Maloo S R,Choudhary S,et al. Microsatellite markers:an important DNA fingerprinting tool for characterization of crop plants[J]. The Journal of Plant Science Research,2015,31(1):83.

[4]鄢秀芹,魯 敏,安華明. 刺梨轉錄組SSR信息分析及其分子標記開發[J]. 園藝學報,2015,42(2):341-349.

[5]黎曉英,劉勝貴,王 丹,等. 魚腥草轉錄組SSR位點信息分析及其多態性研究[J]. 中草藥,2016,47(10):1762-1767.

[6]黃海燕,杜紅巖,烏云塔娜,等. 基于杜仲轉錄組序列的SSR分子標記的開發[J]. 林業科學,2013,49(5):176-181.

[7]朱麗峰. 銀杏的景觀價值及其在園林中的應用[J]. 林業調查規劃,2012,37(1):112-114.

[8]耿敏章. 銀杏中營養成分和功能因子的研究進展[J]. 氨基酸和生物資源,2011,33(1):63-66,83.

[9]曹福亮,沈國航. 中國銀杏志[M]. 北京:中國林業出版社,2007.

[10]黃 茜,劉霽瑤,曹 敏,等. 銀杏性別特征表現與鑒別研究進展[J]. 果樹學報,2013,30(6):1065-1071.

[11]林開勤,趙德剛,李 巖,等. 杜仲性別相關EST-SSR標記的開發[J]. 林業科學,2016,52(10):146-152.

[12]許端祥,杜文麗,陳中釤,等. 基于瓠瓜轉錄組測序的EST-SSR標記的開發及其應用[J/OL]. 熱帶作物學報:1-16[2019-12-19]. http://kns.cnki.net/kcms/detail/46.1019.S.20190912.1409.008.html.

[13]Grabherr M G,Haas B J,Yassour M,et al.Trinity:reconstructing a full-length transcriptome without a genome from RNA-Seq data[J]. Nature Biotechnology,2013,29(7):644-652.

[14]Faircloth B C.MSATCOMMANDER:detection of microsatellite repeat arrays and automated,locus-specific primer design[J]. Molecular Ecology Resourecs,2008,8(1):92-94.

[15]Temnykh S,Park W D,Ayres N,et al. Mapping and genome organization of microsatellite sequences in rice(Oryza sativa L. )[J]. Theoretical and Applied Genetics,2000,100(5):697-712.

[16]Zhang P Z,Dreisigacker S,Melchinger A E,et al. Quantifying novel sequence variation and selective advantage in synthetic hexaploid wheats and their backcross-derived lines using SSR markers[J]. Molecular Breeding,2005,15(1):1-10.

[17]Marathi B,Guleria S,Singh N K,et al. Molecular diversity and segregation distortion measured by SSR markers in a new plant type based recombinant inbred line population of rice[J]. Indian Journal of Genetics and Plant Breeding,2011,71(4):297-303.

[18]蔡年輝,許玉蘭,徐 楊,等. 云南松轉錄組SSR的分布及其序列特征[J]. 云南大學學報(自然科學版),2015,37(5):770-778.

[19]張 振,張含國,莫 遲,等. 紅松轉錄組SSR分析及EST-SSR標記開發[J]. 林業科學2015,51(8):114-120.

[20]李昕蔓,金卓穎,蘇安然,等. 白皮松EST-SSR序列分布特征及引物開發[J]. 林業與生態科學,2019,34(3):266-272.

[21]Biswas M K,Chai L J,Mayer C,et al. Exploiting BAC-end sequences for the mining,characterization and utility of new short sequences repeat (SSR) markers in Citrus[J]. Molecular Biology Reports,2012,39(5):5373-5386.

[22]Li D J,Deng Z,Qin B,et al. De novo assembly and characterization of bark transcriptome using Illumina sequencing and development of EST-SSR markers in rubber tree (Hevea brasiliensis Muell.Arg.)[J]. BMC Genomics,2012,13(1):192.

猜你喜歡
轉錄組銀杏
銀杏
銀杏大道隨想曲
論銀杏的栽植
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合