?

基于BSA重測序的辣椒CMS恢復基因連鎖分子標記開發

2023-09-20 11:23王萌趙虎徐曉美潘堯鏵趙曾菁吳星王日升
熱帶作物學報 2023年8期
關鍵詞:分子標記辣椒

王萌 趙虎 徐曉美 潘堯鏵 趙曾菁 吳星 王日升

關鍵詞:辣椒;全基因組重測序;胞質雄性不育;恢復基因;分子標記

辣椒(Capsicumspp.)是世界最大的調味料作物和世界第三大蔬菜作物,也是我國種植面積最大、加工方式最多、消費功能最多的蔬菜和最大的調味品[1]。目前辣椒雜交制種生產仍較多采用人工去雄,種子生產成本高,與國外品種相比缺乏市場競爭力[2]。利用辣椒胞質雄性不育(CMS)進行三系雜交制種不僅可以確保雜交種子純度,更有利于保護品種的知識產權,是辣椒育種發展的主要趨勢[3]。開發與辣椒CMS恢復基因緊密連鎖的分子標記,大規模對自交系及中間材料進行恢復基因篩選,可大大提高三系育種效率。

辣椒CMS育性恢復的遺傳控制多樣且復雜,多數研究者認為辣椒Rf基因由1個顯性基因控制的[4-5],WEI等[6]認為辣椒CMS恢復基因(Rf)是受2個主加性-顯性上位基因和1個加性-顯性多基因控制,也有認為辣椒CMS育性恢復與1個主QTL和4個小QTL有關[7]。針對辣椒Rf基因,前人已經開發了多種類型的分子標記用于輔助育種,這些標記包括隨機擴增多態性(RAPD)標記[8]、簡單重復序列(SSR)標記[9]、插入/缺失(InDel)標記[10]、切割擴增多態性序列(CAPS)標記[11]、序列特征擴增區(SCAR)標記[12]和競爭性等位基因特異性PCR(KASP)標記[6,13]等。其中應用最廣泛的標記CRF-SCAR[12,14]在不同自然群體中對育性恢復性狀的準確率最高,同一標記在不同群體間準確率差異較大,準確率較高的報道有89.1%[4]、79.2%[15]和100%[16]。這些結果進一步說明,辣椒基因組包含多個候選Rf基因,不同恢復系可能具有基因型特異性的Rf基因[11,15,17-18],目前尚無通用標記,特異的恢復基因需要開發相應的標記才更有效。

目前,最廣泛使用的CRF-SCAR標記[15,17]不能區分本單位的不育系014A和恢復系014C,說明恢復系014C可能具有不同Rf基因,需要開發相應的連鎖標記。深度測序結合BSA法,在不構建遺傳圖譜的情況下,可快速定位正向遺傳學的性狀位點[19],快速篩選目標基因以獲得緊密連鎖分子標記[20],目前已用于多種作物質量性狀或主效基因的定位,如尹明智等[21]利用該方法定位了油菜野芥胞質雄性不育恢復基因;LI等[22]利用BSA法結合基因組測序和轉錄組測序,聯合分析獲得了大白菜中與葉狀頭形成相關的共同候選基因。本研究以不育系014A和恢復系014C構建了F2分離群體,利用BSA法結合全基因組重測序,獲得辣椒CMS恢復基因相關定位區間,根據區間內的差異SNP/InDel設計引物,篩選恢復基因連鎖分子標記,為加速選育辣椒CMS恢復系奠定基礎。

1材料與方法

1.1材料

以不育系014A×恢復系014C構建F2分離群體,正常田間管理,于花期調查育性,構建測序所需基因可育混池和不育混池,可育混池單株分別隔離,單株留種,每個單株種植30個子代,調查育性分離情況,判斷可育混池內單株基因型為RfRf或Rfrf。試驗材料種植于廣西農業科學院基地。

1.2方法

1.2.1育性調查2020年對F2群體1008個單株進行插牌編號,田間正常管理,于辣椒開花期開展3次以上育性調查并記錄,參考花粉指數(PI)法:根據肉眼觀察花粉數量分為1~4級,每株調查10朵花,在開花當天進行觀察。1級:花藥上布滿花粉,同可育親本無明顯差異;2級:有花粉,但不及可育親本的一半,花粉量明顯減少;3級:有很少量的花粉;4級:花藥干癟皺縮,無可見的花粉。對于不易判定等級的調查的單株,采用多次調查的方法,同時調查自然坐果率和果內種子數量進行輔助判斷并記錄。

1.2.2建池、測序與數據處理在F2群體采集單株葉片提取DNA,同時分別選擇1級和4級各30個單株,分別取幼嫩葉片0.1g用于DNA的提取,DNA分別等量混合構建不育基因池和可育基因池。2個混池連同親本建庫后使用HiseqX10PE150上機測序,測序深度為30×。樣本由廣州基迪奧生物科技有限公司完成建庫和測序。測序得到的原始數據先進行過濾,獲得cleanreads,再利用Burrows-WheelerAligner(BWA,v0.7.16a-r1181)將過濾后的reads與辣椒參考基因組Ensembl_release47(http://plants.ensembl.org/Capsicum_annuum/Info/Index)進行比對。比對結果使用GATK(v3.5)VariantFiltration模塊對SNP和InDel進行變異檢測。

1.2.3基于SNP-index的BSA分析與Fisher精確檢驗對辣椒育性連鎖定位區間進行篩選時,首先過濾不育和可育混池中SNP-index均小于0.3或大于0.7的位點,計算各混池的SNP-index和混池間的Δ(SNP-index),然后以滑動窗口法對Δ(SNP-index)在各個染色體上的分布制圖。置信區間設置為95%和99%,取正向置信水平99%以上窗口作為候選區間[23]。

采用Fisher精確檢驗法(SPSS21.0)對2個混池中的等位基因深度比例進行檢驗,顯著性使用P值表示,再次按照滑窗的方法對計算獲得的P值結果進行擬合,取P值的-log10后繪制曼哈頓圖。原始的P值進行FDR校正后獲得q值,篩選q值小于閾值(0.05)的位點作為顯著位點,連續的顯著位點合并成一個區間,獲得顯著區間。

1.2.4DNA提取與引物篩選采用改良的CTAB法提取親本及F2群體所有單株DNA,檢測合格后將濃度統一調整至50ng/μL用于后續試驗。根據定位區間獲得的基因、InDel/SNPs信息,結合前人報道恢復基因類型信息,每個基因至少設計1對以上的引物,優先選擇位于外顯子區域的SNP和多態性差異5bp以上的InDel作為第一輪SSR/InDel分子標記,篩選在親本間呈現多態性的引物。在第一輪多態性引物附近,第二輪根據基因信息和InDel/SNPs設計更多的標記,再次利用雙親進行標記篩選,然后結合F2、F3育性田間調查結果,利用確定了基因型的30個可育混池單株(基因型為RfRf或Rfrf)、30個不育混池單株(基因型為rfrf)進行篩選,獲得準確率最高的分子標記,最后使用F2群體進行準確率驗證。

提取目標位點兩翼各150bp的堿基序列,使用Oligo6軟件進行引物設計。引物序列均由生工生物工程(上海)股份有限公司合成。PCR反應總體系均為10μL,其中50ng/μL模版DNA1μL,TaqDNA聚合酶5μL,上下游引物(10μmol/L)各0.5μL,ddH2O3μL。PCR擴增程序參照王日勇等[24]的方法。擴增產物用8%變性聚丙烯酰胺凝膠110V電泳分離95min,用銀染法進行顯影;根據標記特征,分離群體內驗證也可使用2%瓊脂糖,電壓120V,電泳35min;觀察結果并拍照保存。

2結果與分析

2.1F2代分離群體育性調查

通過不育系014A和恢復系014C雜交構建的F2代分離群體1008個單株育性調查結果表明,花粉正??捎龁沃隇?85株,不育的單株為223株,可育、不育分離比例均接近3∶1,按1對基因的控制模式分別進行χ2測驗,χ2值為1.341,P值為0.247,P>0.05,符合理論預測,即可育和不育分離比符合3∶1的分離規律(表1),表明辣椒CMS育性恢復性狀受1對顯性基因控制。30個測序用的極端可育單株通過種植調查F3群體分離情況,育性不發生分離則親本為純合可育(RfRf),育性發生分離則親本為雜合可育(Rfrf),連同30個純合不育單株(rfrf)用于后續分子標記篩選與驗證。

2.2重測序混池數據質量評估

根據親本和混池重測序的相關數據結果顯示(表2),此次測序共得到450.60Gb原始數據,經數據質控過濾后獲得448.27Gb高質量有效數據。樣品的GC堿基含量為36.08%~36.84%,測序質量控制標準Q30>93.75%。不育、可育測試樣品與參考基因組的比對率分別為97.84%、97.67%?;蚪M覆蓋度20×比例約為80%以上。全基因組范圍內分別檢測到950253個InDel和15142397個SNP。由此可知,本研究樣本數據量足夠,GC分布正常,測序質量合格,測序數據與參考基因組比對結果正常,覆蓋度飽和,可用于后續的變異分析及目標性狀的基因定位。

2.3與辣椒CMS育性關聯的連鎖區間定位

基于SNP-index的BSA分析結果顯示,正向置信水平99%以上窗口有12個區間分別位于6號、8號、11號染色體上(表3,圖1)。由圖1可知,6號染色體定位區間峰值高、峰形寬大,8號染色體存在多個小峰,11號染色體也存在一個峰值高的狹窄峰。由表3可知,6號染色體的第一個定位區間最大,長度為26.72Mb,約占總區間長度32%,其中包含540個基因,約占基因總數的64%,基因分布相對集中。

為進一步縮小定位區間,采用Fisher精確檢驗法對2個混池中的等位基因深度比例進行檢驗,得到基于-log10(p)值的全基因組分布曼哈頓圖(圖2),獲得的定位區間為6號染色體1.44~8.28Mb,該區間內包含4441個SNP、266個Indel和227個基因。

2.4分子標記開發

根據6號染色體1.44~8.28Mb候選區間內227個基因及SNP/InDel位點,共設計了316對引物,擴增親本,篩選出27對在親本間差異顯著的標記。根據基因注釋獲得的3個恢復基因候選基因,然后重點在這3個基因附近設計引物并篩選,最終獲得了能穩定擴增出特異條帶的標記OP59和PP5。OP59引物序列為F:5-TGGAACAGAGTCATATTTTTCTTTCAT-3、R:5-CCAATTCCGATAAAGGGTTTT-3。PP5引物序列為F:5-TCATTCTTTAGGGGAAGCTTAGG-3、R:5-CGGTGTGGACAGACATTTCA-3。根據SNP位點設計的標記OP59,在純合可育材料可擴增出282bp條帶,不育材料可擴增出278bp條帶,雜合單株能擴增出2條帶(圖3)。根據InDel位點設計的標記PP5,在不育親本、F2雜合可育單株、不育單株中均可擴增出約300bp的條帶,而純合可育親本和F2純合可育單株中無擴增條帶,該標記可使用瓊脂糖電泳更方便快速(圖4)。2個標記在極端群體驗證中準確率均達到100%。

將這2個標記在F2代分離群體隨機挑選的456個單株進行驗證,結果表明,2個標記在重測序的極端群體中準確率均達到100%。共顯性標記OP59在不育的群體中準確率為100%,在可育單株中準確率為97.21%。標記PP5在不育單株和純合可育單株中準確率均為100%。根據與參考基因組比對結果,標記OP59根據位于6號染色體3877192bp處SNP位點設計,參考堿基為A,突變堿基為G,該位點位于恢復基因候選PPR基因T459-15819基因間區,距離為17232bp;標記PP5根據位于6號染色體3897138bp處InDel位點設計,參考堿基為G,突變堿基為GT,該位點位于該基因下游318bp。

3討論

本研究表明,辣椒CMS核內恢復基因經BSA結合法結合全基因組重測序,比對參考基因組Ensembl_release47,經Fisher精確檢驗,定位在6號染色體頂端1.44~8.28Mb區間,區間長度6.84Mb。WEI等[6]通過基于轉錄組測序的BSR-seq方法,通過與參考基因組Zunla-1比對,將恢復基因定位在6號染色體末端16.8Mb的區間,其使用的試驗材料包含的恢復基因被認為是受2個主加性-顯性上位基因和一個加性-顯性多基因控制。ZHANG等[25]也是使用BSA結合基因組重測序的方法在6號染色體的兩端分別獲得了一個恢復基因,該材料中辣椒CMS育性恢復同時受2對基因控制。本研究所使用的試驗材料F2群體中可育∶不育符合3∶1,因此育性恢復受1對基因控制,這與WEI等[6]、ZHANG等[25]的試驗材料不同,推測確實含有不同的恢復基因。

在許多農作物中多個雄性不育恢復基因(Rf)已經被鑒定,大多數恢復基因屬于PPR基因(編碼蛋白含有五肽重復序列),如水稻[26]、油菜[27]、棉花[28]等。在辣椒作物上,前人報道的恢復基因有PPR6[11]、PPR46[11]、NEDD8[18]、長鏈非編碼RNA[29]等。尹明智等[21]通過對基因定位的候選區域進行序列分析和基因注釋,發現其中的PPR基因,再進行基因克隆及功能驗證,這將是分析恢復基因的一種有效手段。本研究初步獲得的候選基因T459-15819也是屬于PPR基因,該基因是否為調控辣椒育性恢復的關鍵基因,以及如何影響育性的恢復還需進一步分析驗證。

本研究獲得的標記OP59屬于共顯性標記,不僅能夠區分基因純合可育(RfRf)植株和不育(rfrf)植株,還能鑒定出雜合可育(Rfrf)的植株,且準確率高,聚丙烯酰胺凝膠電泳即可分辨,在實際應用中非常簡便有效。標記PP5瓊脂糖凝膠電泳檢測即可,實際應用中可先用PP5檢出純合可育株,然后再用OP59檢出其他類型。

本研究構建的F2群體中,根據花粉指數法將單株劃分為不同的等級,花粉量減少的2、3、4等級全部歸為不育,經χ2測驗,可育和不育分離比符合3∶1,推測辣椒CMS育性恢復性狀受1對顯性基因控制,這與多數研究結果一致[4-5,9,14]。從本研究不育群體實際調查數據來看,單株間花粉量存在一定的差異,因此,本研究使用的恢復基因除受1對顯性基因控制外,在6號、8號、11號染色體上也可能存在育性修飾的微效基因,或基因表達受到環境影響,仍需進一步研究。

猜你喜歡
分子標記辣椒
關于辣椒的快問快答
原來,你還是這樣的辣椒
你的辣椒結出果實了嗎?
辣椒也瘋狂
揀辣椒
蘿卜抽薹相關SRAP分子標記篩選與分析
軟棗獼猴桃性別相關的SRAP分子標記
軟棗獼猴桃性別相關的SRAP分子標記
大白菜種質資源抗根腫病基因CRa和CRb的分子標記鑒定與分析
玉米大斑病的研究進展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合