?

燕麥全基因組SSR 位點鑒定及多態性標記開發

2024-03-12 14:31陳凱凌武濤徐逸群高佳張美俊李欣賈舉慶
生物技術通報 2024年2期
關鍵詞:基元核苷酸燕麥

陳凱凌 武濤,2 徐逸群,2 高佳,2 張美俊,2 李欣 賈舉慶,2

(1.山西農業大學農學院,太谷 030801;2.山西農業大學雜糧種質資源創新與分子育種國家實驗室(籌),太原 030031)

燕麥(Avena sativa L.)為異源六倍體(AACCDD,2n=6X=42),包含A、C、D 三個亞基因組,每組包含7 條染色體,是一種重要的特色雜糧。中國作為裸燕麥(莜麥)的起源地,在內蒙古、山西等地廣泛種植[1]。燕麥是一種可全谷物食用的健康谷物,由于其含有獨特的燕麥蛋白、燕麥多肽、β-葡聚糖等營養物質,對于人體健康與疾病防治有重要作用而受到廣泛關注[2]。

由于燕麥基因組較大、基因組結構復雜并缺少高質量的參考基因組,相較于同為禾本科的小麥、水稻、玉米而言,燕麥功能基因發掘與分子進化的相關研究起步較晚[3]。在2022 年,相繼公布了2 個六倍體燕麥參考基因組[4-5],為燕麥基因組學研究提供了強有力的工具。

開發SSR 標記的方法主要有根據全基因組測序結果開發[6]、轉錄組測序結果開發[7]、SSR 富集文庫構建開發[8]及利用已報道的SSR 標記交叉擴增[9]?;谵D錄組開發SSR 標記所包含的物種基因信息較少,構建SSR 富集文庫開發成本較高,近緣物種交叉擴增有效率較低?;趨⒖蓟蚪M開發SSR 標記簡單、經濟并且包含基因信息豐富。

在燕麥中,基于基因組開發的SSR 分子標記數量有限,主要集中在燕麥抗冠銹?。?-10]、高矮[11]、β-葡聚糖[12]含量相關SSR 標記的開發與基因定位,其次是基于EST 序列開發的SSR 標記[13],關于燕麥皮裸性狀的多態性SSR 標記鮮有報道。

本研究利用公布的六倍體裸燕麥“三分三”全基因組進行SSR 位點檢索并對其進行特征分析,同時開發出52 對多態性SSR 引物,并進行克隆測序驗證其真實性。在F2遺傳群體材料中進行小規模擴增,為后續燕麥皮裸基因克隆、遺傳圖譜構建、群體多樣性分析等提供了科學的參考依據。

1 材料與方法

1.1 材料

選取2 個六倍體裸燕麥白燕2 號(父本)與皮燕麥Banner(母本)作為雜交親本。雙親種質資源由山西農業大學生物技術實驗室提供。將白燕2 號和Banner 通過人工去雄雜交獲得F1單株種子,F1種子自交、結實、收獲、鑒定,獲得F2種子。于2022 年3 月,將F2及雙親種子播種在山西農業大學農作站實驗基地,期間進行科學的田間水肥管理。在F2群體中分別在2 個極端表型(皮燕麥和裸燕麥)中隨機選取皮裸性狀差異明顯的植株各10 株,共計20 個單株為試驗材料。

1.2 方法

1.2.1 燕麥全基因組序列下載及SSR 位點檢索 在NCBI 網站下載裸燕麥“三分三”參考基因組序列,登錄號為PRJNA727473。利用TBtools(v1.09876-63)[14]中SSR 檢索工具對全基因組序列SSR 位點進行搜索。搜索標準為單堿基至少重復10 次、雙堿基至少重復6 次,三堿基、四堿基、五堿基與六堿基至少重復5 次。同一SSR 最長不超過2 kb。將搜索數據利用Excel 與SPSS 軟件進行統計分析。

1.2.2 燕麥SSR 引物設計和PCR 驗證 選取SSR 位點上下游500 bp 序列,將和控制燕麥籽粒皮裸性N1連鎖的分子標記序列[15]與“三分三”基因組比對,判斷N1 在染色體上的物理區段,從該區段中挑選長度大于40 bp 的SSR 位點100 個,在基因組上截取SSR 位點上下游500 bp 序列,將這些序列分別比對“三分三”和“Sang”基因組,以去除非特異性位點及在兩個測序的燕麥品種中無多態性的SSR 位點。剩余的序列利用Primer3 在線設計SSR 引物,引物設計參數設置為長度18-22 bp,退火溫度為55-59℃,擴增產物長度為250-400 bp;應避免引物間二聚體、發夾結構等結構出現。并將設計引物在“三分三”和“Sang”基因組中進行電子PCR 分析,去除有非特異擴增與在2 個燕麥基因組中擴增片段相同的引物,提高其特異性與多態性。將設計完成的引物序列交由北京華大科技有限公司合成。

1.2.3 皮裸性狀調查 對雜交雙親及F2群體中選取的燕麥植株進行皮裸性狀調查。

1.2.4 DNA 提取 選取試驗材料苗期的幼嫩葉片,按照北京天根生化科技有限公司提供的DNA 提取試劑盒提取DNA。用1%瓊脂糖凝膠電泳檢測其完整性,并將DNA 稀釋為50 ng/μL,-20℃保存備用。

1.2.5 燕麥SSR 引物的開發與多態性檢測 將親本DNA 進行初步PCR 擴增,篩選出具有目的條帶的SSR 引物,進一步在20 個F2群體燕麥單株和雙親DNA 中進行PCR 擴增,篩選出多態性明顯、條帶清楚的穩定SSR 引物。SSR-PCR 反應體系:1.0 μL DNA(50 ng/μL)、左右引物各0.5 μL(0.5 μmol/L)、1.0 μL 10×PCR buffer(含Mg2+)、0.8 μL dNTP(0.23 nmol/L)、0.12 μL Taq DNA 聚合酶(5 U)和ddH2O 6.08 μL。反應程序:94℃ 4 min;94℃ 45 s,56℃(依據引物最佳退火溫度而定)45 s,72℃ 20 s,30 個循環;72℃ 10 min,4℃保存。PCR 擴增產物用8%非變性聚丙烯酰胺凝膠電泳檢測,染色、顯影,并拍照保存。

1.2.6 SSR 引物的驗證 經非變性聚丙烯酰胺凝膠檢測后,回收擴增的目的產物,加入100 μL 無菌水,用無菌玻璃棒將其研磨充分,55℃溶解30 min,離心;取1 μL 上清液作為模板DNA 進行PCR 擴增,擴增條件同1.2.5。將擴增產物經2%瓊脂糖凝膠電泳分離,用DNA 回收試劑盒將目的基因進行切膠回收,并連接至T 載體,轉入JM109 感受態細胞,挑選陽性克隆菌液送至北京華大科技有限公司進行測序。利用Jalview 軟件對測序序列進行多序列比對。

2 結果

2.1 燕麥全基因組SSR位點數量分布特征

在NCBI 網站下載六倍體裸燕麥“三分三”及“Sang”全基因組序列,“三分三”的基因組總長為11 Gb。燕麥基因組共分為3 個亞基因組,每個亞基因組各有7 條染色體,共計21 條染色體,每條染色體長度為293.84-701.82 Mb。利用TBtools 軟件在21條染色體上共檢索到828 138 個SSR 位點(表1),在1A(46 585)、3C(49 132)和4C(46 713)位點最為豐富,在6D(22 043)分布最少。在全基因組中,平均每12.90 kb 會出現一個SSR 位點,在1C 出現SSR 位點距離最長;全基因組平均SSR 密度為78.16個/Mb,在2A 上SSR 分布密度最高。表明燕麥全基因組SSR 位點數量豐富、分布均勻。

表1 SSR 數量分布特征Table 1 SSR quantitative distribution characteristics

燕麥染色體大小和SSR 密度、SSR 距離、SSR數量之間均符合正態分布,結果顯示,染色體大小與SSR 數量之間呈正相關關系,相關系數為0.81。同時,染色體大小與SSR 密度、SSR 距離之間無相關關系(表2),在A、C、D 三個亞基因組間C 亞基因組染色體最長、SSR 數目最多,但是SSR 密度最低;A 亞基因組染色體長度與SSR 數目適中,但SSR 密度最高(表3)。

表2 相關性分析Table 2 Correlation analysis

表3 亞基因組間SSR 分布特征Table 3 SSR distribution characteristics among subgroups

2.2 燕麥全基因組SSR位點基元重復次數與類型分布特征

在燕麥全基因組中共檢測到6 種核苷酸重復類型(表4),其中,單核苷酸(29.85%)、雙核苷酸(33.69%)和三核苷酸(33.79%)重復類型占主導優勢;四核苷酸(1.81%)、五核苷酸(0.28%)、六核苷酸(0.59%)占比較少。在全部SSR 位點中,重復次數在5-567 次之間均有檢索到,最小重復次數為5 次,最多重復次數為一個雙核苷酸重復類型的SSR 重復567 次。在重復次數的數量上分析,大于10 次的重復次數最多(310 749),在不大于10 次的重復次數中5 次(177 356)和6 次(185 716)重復次數數量最多,其余重復次數數目均較少。在核苷酸重復類型和重復次數兩個復合條件下分析,隨著核苷酸重復類型的基元序列變長和核苷酸重復次數增加,SSR 位點數量逐漸減少,其中,三核苷酸重復、重復5 次數目最多(164 814),五核苷酸重復、重復大于10 次數目最少(96)。

表4 燕麥全基因組SSR 重復類型、重復次數和占比Table 4 SSR repeat type,repeat number and proportion of whole genome of oat

2.3 燕麥全基因組SSR位點基元類型分布特征

在燕麥全基因組中共檢索到1 548 種不同的重復類型(表5),不同基元重復類型在6 種不同核苷酸類型中均有出現。在單核苷酸重復中,2 種基元類型A/T(58.80%)與C/G(41.20%)占比大致相當;在雙核苷酸重復中4 種基元類型占比差異較大,AG/CT(49.15%)為優勢基元,CG/CG(1.67%)占比最??;在三核苷酸重復中AAC/GTT(24.49%)、ATC/ATG(20.50%)為優勢基元;在四、五、六核苷酸重復中的優勢基元分別為AAAT/ATTT(15.29%)、TAAGA/TCTTA(39.21%)、CCTGGG/CCCAGG(41.91%)。隨著核苷酸重復類型基元序列變長,基元類型顯著增加,但各基元數量明顯減少。在檢索的所有優勢基元中,含有A、T 堿基的SSR數量明顯高于含有C、G 堿基的SSR 數量,說明在燕麥全基因組SSR 位點中含有大量A、T 堿基。

表5 燕麥全基因組各SSR 重復類型中優勢基元類型及分布Table 5 Types and distribution of dominant motifs in each SSR repeat type of oat genome

2.4 燕麥全基因組SSR位點長度分布特征

決定一個SSR 位點能否使用取決于其多態性的有無,序列長度越長的SSR 具有多態性的可能越大。對燕麥全基因組SSR 位點長度分布進行分析,能夠檢索到最長的SSR 序列為1 587 bp,最短的為11 bp,SSR 平均長度為17.55 bp。其中,SSR 序列長度為11(123 990)、12(177 110)和15 bp(176 477)的SSR 位點數目占主導優勢(圖1)。長度在12 bp以下(低度多態性)的SSR 位點數目為123 990 個,長度在12-20 bp(中度多態性)的SSR 位點數目為582 176 個,長度大于20 bp(高度多態性)的SSR位點數目為121 972 個,表明在燕麥全基因組中SSR位點呈現中度多態性。

圖1 燕麥基因組SSR 長度分布Fig.1 SSR length distribution of oat genome

2.5 燕麥4D染色體末端SSR標記開發、驗證及多態性檢測

將設計的100 對引物在2 個親本DNA 中進行PCR 擴增,使用非變性聚丙烯酰胺凝膠電泳檢測,除10 對引物無擴增片段,其余引物擴增產物均符合預期長度,有效擴增率為90%;在有效擴增的引物中52 對在2 個親本間具有多態性(表6),擴增多態率為58%。將多態性SSR 引物進一步在F2群體的20 個單株中進行擴增,均可以看到多態性條帶(圖2),52 對引物在親本中的擴增片段進行克隆測序,并將結果進行比對“三分三”基因組發現,PCR 擴增位點與SSR 引物設計位點一致,且PCR 擴增片段的多態性確由SSR 造成(圖3)。說明本研究基于燕麥基因組開發的SSR 分子標記,無論是PCR 擴增的特異性還是產物的多態性,都可用于后續的燕麥N1及其他基因的定位研究。

圖2 引物A-1(A)和A-2(B)在試驗材料中擴增結果Fig.2 Amplification results of primers A-1(A)and A-2(B)in experimental materials

圖3 引物A-1(A)和A-2(B)在2 個親本中的擴增序列比對結果Fig.3 Amplification sequence alignment of primers A-1(A)and A-2(B)in two parents

表6 開發的燕麥多態性SSR 引物信息Table 6 Information of SSR primers developed for oats polymorphism

3 討論

由于第三代測序技術的出現,使得小麥[16]、燕麥[4-5]等六倍體作物的參考基因組組裝得以實現。本研究利用最新公布的燕麥參考基因組,對全基因組進行SSR 位點鑒定與特征分析,并利用鑒定的SSR 位點開發52 對多態性引物并克隆測序驗證其真實性,證明基于參考基因組開發SSR 標記有效可行,相較于轉錄組測序、物種間交叉擴增和構建富集文庫的開發方法[6-9]簡單高效,為后續大規模開發燕麥SSR 標記提供科學參考依據。

通過對燕麥全基因組SSR 位點鑒定發現,在數量上遠高于一般農作物如玉米[17]、苦蕎[18]、谷子[19],以及蔬果類如花生[20]、黃瓜[21]、蘋果[22]、甜菜[23]等基因組。此現象的主要原因是由于燕麥為六倍體作物,染色體條數多,基因組龐大。但與同為六倍體的小麥中國春基因組[24]相比,兩者SSR 數量相差較大,主要在于檢索SSR 標準不同,小麥中未檢索單核苷酸的重復類型。已有研究表明,隨著基因組的擴大,SSR 位點數量不會無限擴增,其分布密度會相對減少[25],在燕麥中也符合這一規律。燕麥基因組相比于四倍體馬鈴薯[26]的SSR 密度減少較多;同時發現在燕麥基因組的不同亞組間也符合這一規律,表明在不同物種間和同一物種的不同亞組間,DNA 在同一條染色體復制過程中發生的滑動錯配的概率會隨著染色體增長而降低。

在燕麥SSR 的優勢基元中,與薏苡[27]、黃麻[28]、煙草[29]、綠豆[30]等其他物種相比,不同物種SSR優勢基元不盡相同,但比較發現不同物種優勢基元中均含有豐富的A、T 堿基。這種現象可能是由于A、T 堿基之間含有2 個氫鍵相較于C、G 堿基之間3 個氫鍵更容易被打開所導致。

在燕麥基因組中檢索得到的所有SSR 序列長度占全基因組序列比例遠小于動物的SSR 含量,相較于植物如擬南芥和玉米,其SSR 含量也較少[31]。表明在燕麥基因組中SSR 位點數量雖然豐富,但是其含量并不豐富。已有研究發現,SSR 位點在基因組中的擴張與物種進化密切相關[31],燕麥較低的SSR含量表明燕麥相較于魚類和擬南芥等物種進化相對緩慢。燕麥SSR 含量與同為麥類作物的節節麥[32](0.10%)相比含量稍高,節節麥是六倍體小麥(AABBDD)D 套染色體的二倍體祖先。燕麥由于染色體結構復雜,導致染色體間重組更為頻繁,從而導致更易出現SSR 位點,同為六倍體的小麥染色體間的重組導致物種基因組出現馬賽克結構[16],推測燕麥SSR 含量可能與燕麥基因組的馬賽克結構相關。

本研究開發的52 對多態性SSR 標記,能夠用于后續燕麥相關基因定位克隆、DNA 指紋圖譜和遺傳圖譜構建、種群群體分析等研究。但是開發SSR標記隨機性仍舊較大,比較依賴參考基因組的準確性,通過非變形聚丙烯酰胺凝膠判別條帶人為誤差較大,而且耗時耗力,后續可以開發KASP 標記進行基因分型或者使用毛細管電泳的方法檢測 SSR 序列的多態性。

4 結論

通過對燕麥“三分三”參考基因組進行SSR 位點檢索發現,該基因組SSR 位點多樣、數量豐富。根據檢索結果設計引物,在構建的F2代群體小規模進行擴增,開發了52 對具有多態性的引物,并克隆測序驗證其真實性。表明在燕麥“三分三”參考基因組中開發SSR 標記可行有效,開發的多態性SSR標記可以用于后續燕麥皮裸基因定位。

猜你喜歡
基元核苷酸燕麥
關注基元反應的考查
可嚼燕麥,營養打折
單核苷酸多態性與中醫證候相關性研究進展
徐長風:核苷酸類似物的副作用
燕麥的栽培技術
晉??笛帑?守護您的健康
Acknowledgment to reviewers—November 2018 to September 2019
人體細胞內存在全新DNA結構
行了,我像所有的他們一樣
Numerical Modeling and Analysis of Gas Entrainment for the Ventilated Cavity in Vertical Pipe*
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合