?

不同生態類型菘藍SLAF-seq 分子標記

2024-04-09 02:56孟瑾瑾陳紅剛王惠珍
中草藥 2024年7期
關鍵詞:類群基因組遺傳

劉 東,孟瑾瑾,王 盼,陳紅剛,王惠珍,杜 弢

甘肅中醫藥大學藥學院,甘肅 蘭州 730000

隨著分子生物技術水平的不斷提高,分子標記技術應用越來越廣泛,人們常采用隨機擴增多態性DNA 標記(random amplified polymorphic DNA,RAPD)[1-3]、相關序列擴增多態性(sequence related amplified polymorphism,SRAP)[4-6]、限制性內切酶片段長度多態性( restriction fragment length polymorphism,RFLP)[7]、擴增片段長度多態性(amplified fragment length polymorphism,AFLP)[8-9]、簡單重復序列標記(simple sequence repeats,SSR)[10-12]、ISSR 標記(inter-simple sequence repeat,ISSR)[13-15]和表達序列標簽SSR(expressed sequence tags-SSR,EST-SSR)[16]等分子標記技術進行遺傳多樣性、親緣關系及遺傳演化等方面的研究,并取得很大進展,但這些分子標記技術都有一定的缺陷,RAPD 技術易受到模板的質量和濃度、引物序列短、PCR 循環次數、基因組DNA 的復雜性等方面的影響,造成RAPD 技術的重復性差;AFLP 技術操作復雜、成本較高,對基因組純度和反應條件要求較高,ISSR 標記對體細胞遺傳變異的檢測效率低,因此,由不同分子生物技術所得結果也存在些許差異。

特異位點擴增片段測序(specific-locus amplified fragment sequencing,SLAF-seq)是基于高通量測序技術發展起來的一種簡化基因組測序技術,具有通量高、準確性高、成本低、周期短的技術特點[17]。SLAF-seq 技術是通過生物信息學方法設計最佳酶切方案,構建SLAF 文庫,篩選特異性長度的酶切片段(SLAF 標簽),利用高通量測序技術獲得大量序列,通過軟件比對分析,開發大量的全基因組范圍的特異性SNP 標記,利用大量的SNP 標記進行親緣關系及遺傳變異分析[18-19]、性狀關聯分析[20]和構建遺傳連鎖圖譜[21]等工作,同時為分子育種、系統進化和種質資源鑒定等提供技術保障[22-23]。李貝貝等[24]利用SLAF-seq 技術進行了304 份葡萄種質遺傳多樣性分析,實驗結果表明,我國地方品種親緣關系較近,證實了‘小黑葡萄’是野生種的一個過渡類型的推測。Kozich 等[25]利用SLAF-seq 簡化基因組測序技術對甘薯栽培種及不同倍性的近緣野生種的遺傳多樣性和進化關系進行分析,實驗結果表明,栽培種和六倍體近緣野生種的遺傳關系最近,進一步驗證了栽培甘薯可能來源于Ipomoeatrifida(6X)。目前,采用SLAF-seq技術在菘藍上開發大量SNP位點的相關研究鮮見報道。因此,本實驗利用SLAF-seq 技術測定了25 個不同生態類型菘藍材料的基因序列,獲得大量的SLAF 標簽,進而開發一批穩定性高、特異性強的SNP 位點?;陂_發的SNP 標記對不同生態類型菘藍間遺傳多樣性及群體結構進行分析,旨在從基因水平揭示不同生態類型之間的遺傳關系。

1 材料

1.1 材料信息

25 個不同生態類型菘藍的種子均是從全國各地收集而來,均為人工栽培品,引種地信息見表1,所有種子經甘肅中醫藥大學杜弢教授鑒定為十字花科菘藍屬植物菘藍IsatistinctoriaL.的種子。試驗于甘肅中醫藥大學和政藥用植物園實施,園內海拔2 430 m,年均降水量660 mm,年均氣溫5.1 ℃,無霜期110 d。土壤為肥力均一的黑壚土。

表1 菘藍種子編號及葉片特征信息Table 1 Table of seed number and leaf characteristic information of Isatis tinctoria

1.2 試驗方法

將25 個不同生態類型菘藍種子條播于甘肅中藥大學和政藥用植物園,各試驗小區隨機排列,3 次重復,每個試驗小區的面積為19.58 m2。條播用種量為1.2 g/m2,溝深5 cm,溝寬10 cm,行距30 cm。6 月17 日出苗,6 月27 日一次性完成間苗,株距10 cm;10 月25 日觀測各個試驗小區葉片表觀特征。在每個試驗小區內隨機挑選5 株,從每株相同部位采取幼嫩葉片并將其混裝,1 個試驗小區形成1 份混樣,并對其編號,迅速投入液氮中速凍保存。

2 方法

2.1 基因組DNA 提取和檢測

用CTAB 法從預先保存的葉片中提取基因組DNA,用傳統的1%瓊脂糖凝膠電泳法檢測提取基因的完整性,并用NanoDrop 1000C 微量紫外分光光度計檢測DNA 的濃度及純度,確保提取的DNA質量滿足測序要求。采用超純水將質量濃度統一調至50 ng/μL,?20 ℃保存備用。

2.2 酶切建庫

根據最優酶切方案的選擇原則,應用酶切預測軟件進行酶切預測,確定最優的酶切方案,當最適酶切方案確定之后,對已檢測合格的樣品基因組DNA 進行酶切建庫。對得到的酶切片段(SLAF 標簽)進行3’端加A 處理、連接Dual-index 測序接頭、PCR 擴增、DNA 純化、混樣、切膠選取目的片段。

2.3 基因組測序及數據質量評估

經文庫質檢合格后,利用Illumina 平臺進行測序[26]。為了評估酶切實驗方案和酶切結果的準確性,選用水稻日本晴OryzasativaindicaL.作酶切方法和數據質量的評估對照。Dual-index 識別測序所得的原始數據,進行過濾優選得到高質量雙端Clean reads,再進行測序質量和數據量的質量評估。

2.4 SLAF 標簽和SNP 分析

根據生物信息學分析,在群體中開發全基因組范圍的SLAF 標簽,以每個SLAF 標簽中深度最高的序列類型作為參考序列,利用BWA[27]將測序reads 比對到參考序列上,并使用 GATK[28]和SAMtools[29]2 種軟件開發SNP,以2 種軟件開發獲得的SNP 交集作為最終可靠的SNP 標記數據。

2.5 群體遺傳結構和親緣關系分析

將開發的SNP 標記根據完整度>0.8,次要等位基因頻率(MAF)>0.05 的標準進行過濾[30],基于篩選出的高一致性的群體SNP,使用統計軟件MEGA X[31]和Admixture[32]對群體進行系統進化樹和群體結構分析。

2.6 主成分分析(principal component analysis,PCA)

PCA 是一種統計方法。在群體遺傳學上,主要基于不同材料的SNP 差異程度(或分歧程度)聚類成不同亞群,其結果可以用于與其他聚類方法的結果相互驗證?;赟NP,通過EIGENSOFT 軟件進行PCA。

3 結果與分析

3.1 葉片表觀特征分析

形態學特征是植物遺傳差異的最直觀表現,田間栽培驗證也是最簡單的遺傳變異的鑒別方法。田間植株葉片表觀特征調查結果如表1 所示,對比分析發現25 個不同生態類型菘藍葉片表觀特征可以概述如下:葉形分為倒卵圓形和倒披針形2 種,葉尖分為尖和鈍尖2 種,葉片表面都有蠟粉層,均是蠟質葉,葉柄基部根據顏色分為淺綠色和綠色2 種,葉緣根據缺刻程度分為無缺刻(全緣葉)和輕度缺刻2 種,觀察葉片整體形態特征,分為無波狀葉、輕度波狀葉和中度波狀葉。

3.2 建庫評估

酶切效率是評價簡化基因組試驗是否成功的一個關鍵指標,測序reads 插入片段中殘留酶切位點的比例越高,酶切效率越好[33]。本實驗經過SLAF電子酶切預測軟件分析,確定限制性內切酶切組合為Rsal-Haell,酶切片段長度在314~364 bp 的序列定義為SLAF 標簽。為進一步評估酶切方案的有效性與酶切效率,以水稻日本晴測序數據為酶切方案和數據質量評估對照,利用SOAP[34]軟件將對照的測序reads 與其參考序列進行比對,試驗雙端比對效率的結果為96.09%,正常酶切比例為 92.39%,說明酶切反應處于正常,此次試驗選定的酶切方案正確可行,SLAF 建庫正常。

3.3 測序質量評估

本實驗25 個樣品共獲得63.32 兆數據量,菘藍及對照測序結果如表2 所示。各樣品所得到的讀長總量各不相同,最大的讀長總量為6 086 419(2016-8),最小的讀長總量為1 498 688(2016-22)。測序的GC 堿基比例的平均值為40.13%,最小的GC 堿基比例為38.76%(2016-24),最大的GC 堿基比例為41.37%(2016-15),此次測序所有樣品GC堿基比例均比較高,說明測序達到要求。測序質量值(Q)是對測序數據質檢的關鍵指標,是測序下機后單堿基錯誤率大小的具體評判標準,一般測序質量值用Q30表示。此次試驗測序質量值Q30均大于95%,平均Q30為96.31%,最小的Q30為95.66%(2016-3),最大的Q30為96.60%(2016-1),說明此次測序堿基錯誤率較低,測序質量較好。結合讀長總量、GC 堿基比例及Q30比例等各個結果的數據,可以得出此次測序質量較高,所得數據結果可靠。

表2 菘藍及對照測序結果Table 2 I.tinctoria and control sequencing results

3.4 SLAF 標簽開發及SNP 信息統計

經過生物信息學等各方面分析,此次試驗的每個樣品標簽平均測序深度為23.52X,共獲得535 105 個菘藍SLAF 標簽,具體的菘藍SLAF 標簽數統計結果如表4 所示,其中共獲得34 412 個多態性SLAF 標簽。以每個SLAF 標簽中深度最高的序列類型作為參考序列,進行SNP 位點開發,此次實驗共得到63 002個群體SNP 標記。SNP 信息統計結果見表3。

表3 菘藍SLAF 標簽和SNP 統計結果Table 3 Results of I.tinctoria SLAF label and SNP statistics

3.5 系統發育樹分析

基于篩選出的高一致性SNP 標記,通過MEGA X 軟件,基于鄰接法(neighbor-joining,NJ),采用Kimura 2-parameter 模型,bootstrap 重復1 000 次,構建各樣品的系統發育樹,如圖1 所示。25 份不同生態類型菘藍聚成3 組,第1 組為2016-22 和2016-26,第2 組為2016-3、2016-4、2016-5、2016-16、2016-20、2016-21,第3 組為2016-8、2016-14、2016-15、2016-1、2016-2、2016-6、2016-18、2016-19、2016-27、2018-1、2016-7、2016-9、2016-13、2016-17、2016-23、2016-24、2016-25。

圖1 不同生態類型菘藍系統發育樹Fig.1 Phylogenetic trees of I.tinctoria of different ecological types

3.6 群體結構分析

根據試驗篩選出的高一致性SNP 標記,利用Admixture 軟件進行群體結構分析,經過交叉驗證,K值為1~10 的聚類情況及各個K值對應的交叉驗證錯誤率結果如圖2、圖3 所示。當K=1 時,25 個不同生態類型菘藍基因來源為一類;當K=10 時,25 個不同生態類型菘藍可以分為10 類。由于每個類群都存在交叉現象,說明每個類群間的親緣關系相對較近。類群1 主要是2016-3 和2016-9,類群2 主要是2016-1 和2016-23,類群3 主要是2016-4、2016-5 和2016-26,類群4 主要是2016-24 和2016-25,類群5主要是2016-13,類群6 主要是2016-6 和2016-16,類群7主要是2016-14 和2016-15,類群8主要是2016-19 和2016-22,類群9 主要是2016-2 和2016-7,類群10 主要是2016-18、2016-27 和2018-1。而2016-8、2016-17、2016-20 和2016-21 這4 個生態類型的游離在各個類群之間,2016-8 相比較而言,較為接近類群10(遺傳特征值為0.373 1),2016-17 相比較而言,較為接近類群1(遺傳特征值為0.261 3)和類群4(遺傳特征值為0.245 9),2016-20 相比較而言,較為接近類群1(遺傳特征值為 0.330 7)和類群3(遺傳特征值為0.297 8),2016-21 相比較而言,較為接近類群1(遺傳特征值為0.405 3)。但是,根據Admixture 各個K值的交叉驗證錯誤率折線圖走勢及結果可以看出,K=1 是應為最優K值。因此,25 個不同生態類型的菘藍樣品群體關系為均來自同一個祖先。

圖2 Admixture 各個K 值對應的樣品聚類結果Fig.2 Sample clustering results corresponding to K values of Admixture

圖3 Admixture 各個K 值的交叉驗證錯誤率Fig.3 Cross verification error rate of Admixture for each K value

3.7 PCA

基于SNP,通過EIGENSOFT 軟件,進行PCA,得到樣品的主成分聚類情況和具體數據如圖4 所示。通過PCA 三維聚類圖可知,25 個樣品的SNP結果聚為1 個分組,同時也佐證了“3.6”項群體結構分析的結果,25 個不同生態類型菘藍為同一個祖先,擁有共同的血緣來源。

圖4 不同生態類型菘藍PCA 三維聚類圖Fig.4 PCA three-dimensional cluster map of I.tinctoria of different ecological types

4 討論

十字花科菘藍屬有7 種菘藍,分別是長圓果菘藍I.oblongataDC.、寬翅菘藍I.violascensBunge、毛果菘藍I.tinctoriaL.var.praecox(Kit.)、歐洲菘藍I.tinctoriaL.、三助菘藍I.costataC.A.Mey.、菘藍I.tinctoriaL.、小果菘藍等I.minimaBunge。根據《中國植物志》中記載的各種菘藍形態特征描述,比對表1 中田間調查記錄結果,結合對25 個不同生態類型菘藍種植情況,可以排除不是寬翅菘藍、小果菘藍、毛果菘藍、長圓果菘藍、歐洲菘藍和三助菘藍,因為25 個不同生態型菘藍均為二年生、莖及基生葉背面不帶紫紅色、植株被不具有白色柔毛、角果不著生柔毛和不具有中脈3 棱的特點,因此,可以確定此25 個不同生態類型的菘藍是中國特有種菘藍,與群體結構和PCA 的結果一致。根據表1 中葉片表觀特征描述,25 個不同生態類型菘藍可以分為5 鐘類型,第1 種類型為倒卵圓形無缺刻皺縮葉(2016-27、2018-1),第 2 種類型為倒卵圓形缺刻皺縮葉(2016-2),第3 種類型為倒卵圓形無缺刻平坦葉(2016-3、2016-4、2016-5、2016-6、2016-14、2016-15、2016-16、2016-17、2016-18、2016-19、2016-21、2016-22、2016-26),第4 種類型為倒卵圓形缺刻平坦葉(2016-9),第5 種類型為披針形無缺刻平坦葉(2016-1、2016-7、2016-8、2016-13、2016-20、2016-23、2016-24、2016-25)。

分子生物技術是現代生物學研究不可或缺的技術手段。本研究利用SLAF-seq 技術在菘藍全基因組范圍內成功開發出了大量SNP 位點,利用得到的63 002 個群體SNP 標記分析了不同生態類型菘藍種質的群體遺傳多樣性,根據SNP 群體遺傳結構、PCA 及田間觀測記錄,25 個不同生態類型的菘藍為同一種屬,具有共同的祖先和血清來源。SNP 系統發育樹將25 個不同生態類型菘藍聚為3 類,第1、2 類對應田間觀測調查的倒卵圓形無缺刻平坦葉,而第3 類涵蓋了田間觀測調查的5 種類型。在SNP群體遺傳結構的分析結果中,2016-8、2016-17、2016-20 和2016-21 這4 個生態類型的游離在多個類群之間,每一個類型都出現同屬于幾個類群的現象,結合葉片表觀特征調查的結果發現,這4 個類型的菘藍均為倒披針形無缺刻平坦葉,并且種子的引種地并不在同一個省份和地區,說明2016-8、2016-17、2016-20 和2016-21 在市場流通比較頻繁,為藥農和種植戶所常選類型之一,因此在頻繁的引種交換過程中曾可能出現過與其他類群之間的基因交流,或者經受各地不同環境氣候的自然選擇,從而導致類群歸類不具體的現象。

綜上所述,不同生態類型菘藍形態上的差異可能來源于種內遺傳差異,差異的形成原因可能是由于菘藍在國內各地都是采用種子直播的方式人工栽培,并且種子大多都是自繁自用或區域性調種,很少出現大范圍的調種現象,但是我國東西南北氣候和環境差異較大,因此菘藍種群的種內基因大范圍交流受阻,外加各地氣候和環境對其的自然選擇進化,形成了具有區域特點的不同生態類型,表現了菘藍的遺傳多樣性。目前,根據現有結果和數據,可以將25個同一種屬不同生態類型菘藍分為倒卵圓形無缺刻皺縮葉、倒卵圓形缺刻皺縮葉、倒卵圓形無缺刻平坦葉、倒卵圓形缺刻平坦葉、倒披針形無缺刻平坦葉5 個類群。此研究為后期進一步研究不同類型菘藍的基因來源和遺傳進化提供參考,為菘藍種質分類、品種鑒定和分子輔助育種提供借鑒。

利益沖突所有作者均聲明不存在利益沖突

猜你喜歡
類群基因組遺傳
非遺傳承
牛參考基因組中發現被忽視基因
還有什么會遺傳?
還有什么會遺傳
還有什么會遺傳?
薏苡種質資源ISSR分子標記篩選及親緣關系分析
黑石頂自然保護區土壤動物功能類群對季節動態的響應
2011年春夏季黃海和東海微型浮游動物類群組成及其攝食的研究
基因組DNA甲基化及組蛋白甲基化
有趣的植物基因組
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合