?

玉米穗軸長與穗軸粗的QTL定位及全基因組預測

2022-05-26 02:52李宗澤徐曉明楊彩霞許加波吳鵬昊
中國農業大學學報 2022年4期
關鍵詞:表型位點性狀

李宗澤 徐曉明 孫 強 楊彩霞 許加波 吳鵬昊

(新疆農業大學 農學院,烏魯木齊 830052)

玉米(ZeamaysL.)是我國重要的糧食作物,同時也是重要的工業原材料,是全球種植面積最大的作物,對我國糧食安全具有重要影響[1]。作物產量構成因子在不同生長條件下表現出很高的遺傳力和穩定性[2],玉米穗軸長和穗軸粗與籽粒性狀呈顯著相關性,是影響產量構成因子的重要性狀[3]。而且,玉米穗軸長與穗軸粗是典型的數量性狀,受到多個基因調控,對控制玉米穗軸長與穗軸粗性狀的QTL進行鑒定不僅有助于揭示玉米產量的遺傳機制,而且能指導玉米育種實踐[4]。

關于玉米穗部發育相關性狀的QTL鑒定,石云素等[5]利用F2群體對玉米穗部性狀進行定位,發現5個與穗軸長相關QTL位點,4個穗軸粗QTL位點,其中穗軸長定位到1個主效QTL位點,可解釋14.3%的表型變異。張建華等[6]利用玉米加倍單倍體(DH)群體對穗軸長和穗軸粗進行了QTL定位,共定位6個QTL位點,其中穗軸長定位到3個QTL位點,穗軸粗定位到3個QTL位點。在定位穗軸粗性狀時找到1個主效QTL位點,該QTL解釋了16.1%的表型變異。崔新建等[7]利用2個RIL群體對產量相關性狀進行QTL定位,定位到穗軸長相關QTL位點有13個,其中位于2號染色體的q2sEL2-1為主效位點,其貢獻率為18.32%;定位到穗軸粗的相關QTL位點14個,位于1號染色體上的q2sCD-1為主效QTL,表型貢獻率為24.31%。王滿等[8]利用2個F2群體定位到11個穗軸長QTL,鑒定到1個主效QTLqEL1-2,表型貢獻率為22.3%;定位到14個穗軸粗QTL,其中qCD4-2為主效位點,能夠解釋19.9%的表型變異。對已發表的與玉米穗軸長和玉米穗軸粗相關QTL[5-11]進行分析發現,其在數量、位置和效應方面都具有差異,且共定位的QTL很少。由于作圖群體、應用標記及種植環境等因素都影響定位結果,因而挖掘多次被定位到的、穩定存在的、具有較高表型貢獻的QTL,對穗軸長和穗軸粗進行分子標記選擇育種將具有更高應用價值[9]。

全基因組預測(Genomic selection, GS)技術是改良作物數量性狀的有效工具之一,已在國內外迅速發展利用[12]。GS技術利用訓練群體的表型與基因型建立預測模型,估計分子標記的遺傳效應,根據訓練群體的基因型對表型進行預測,選擇優良材料,可提高育種效率[13]。劉小剛等[14]利用不同群體對玉米穗長和穗粗進行GS分析,結果表明在自然群體中穗長和穗粗的預測精度分別為0.45和0.53,在RIL和DH群體中預測精度分別為0.49和0.60,在F2群體中預測精度分別為0.66和0.72。GS的預測精度受多個因素影響,包括遺傳力、標記密度、訓練群體大小、訓練群體與預測群體間親緣關系等。通過對影響GS的各個因素進行研究,可提高GS預測精度,促進GS在育種上的應用。

目前在玉米穗軸性狀方面尚未見利用全基因組進行選擇的研究報道。本研究利用玉米自交系‘B 73’與‘鄭58’構建的F2群體,在多環境下采集玉米穗軸長和穗軸粗的表型,結合48K液相雜交探針捕獲獲得的基因型數據,對玉米穗軸長和穗軸粗進行QTL定位,采用嶺回歸最佳線性無偏預測(Ridge regression best linear unbiased prediction, rrBLUP)方法對玉米穗軸長和穗軸粗進行全基因組預測,分析標記密度和訓練群體大小對預測精度的影響,旨在明確玉米穗部發育相關性狀的主效QTL位點,以期為解析玉米穗部性狀發育的遺傳機制提供參考。

1 材料與方法

1.1 試驗材料

2018年11月—2019年3月在海南省樂東黎族自治縣實驗站種植玉米自交系‘B 73’與‘鄭58’,并組配獲得雜交F1,2019年5—10月于新疆維吾爾自治區昌吉市三工鎮九圣禾實驗站種植并自交獲得F2,于2019年11月—2020年3月在海南省樂東黎族自治縣實驗站種植F2并自交獲得200個F2∶3家系。2020年5—10月,將F2∶3家系分別種植于新疆維吾爾自治區昌吉市三工鎮九圣禾實驗站、新疆維吾爾自治區昌吉市二六工鎮實驗站和新疆維吾爾自治區烏魯木齊市三坪農場實驗站。每個地點設置2個重復,采用完全隨機區組試驗設計,行長3 m,株距0.25 m,行距0.67 m,單行區種植,田間管理同大田生產。在F2∶3家系吐絲期,利用玉米‘農大高油高誘3號’對F2∶3家系進行多次授粉,以保證果穗的結實率。收獲的果穗在室內進行考種,測量穗軸長和穗軸粗。游標卡尺測量脫粒后穗軸基部到頂部的距離為穗軸長,cm;游標卡尺測量脫粒后的穗軸最粗部分為穗軸粗,cm。

1.2 表型數據分析

利用CIMMYT開發的META-R軟件(http:∥hdl.handle.net/11529/10201)對3個環境的穗軸長和穗軸粗表型數據進行聯合分析,獲得最佳線性無偏估計值(Best Linear Unbiased Prediction, BLUP)[15],用于QTL定位和GS分析。利用QTL IciMapping軟件[16]估計出不同組分的方差,并進行遺傳力分析。遺傳力計算公式[17]:

1.3 基因分型和連鎖圖譜構建

在苗期對親本和F2群體葉片進行取樣,送中玉金標記(北京)生物技術股份有限公司,采用48K液相雜交探針捕獲測序技術獲得基因型數據。液相探針捕獲是在溶液中進行的核酸分子堿基互補雜交,而實現目標片段DNA富集,再經過高通量測序技術檢測分析。將獲得的原始測序數據過濾獲得高質量測序數據,通過BWA軟件比對到B73_RefGen_v4_genomic參考基因組[18]。采用GATK(The Genome Analysis Toolkit)軟件進行過濾,共獲得1 785 794 個SNP標記。利用VCFtools對SNP數據進行過濾,過濾參數為:缺失率<0.20,最小等位基因頻率>0.05,測序深度為4~500,個體變異基因型值質量值(GQ)>10,Phred格式(Phred_scaled)的質量值(Q)>30,獲得62 504個SNP標記用于全基因組預測分析。通過VCFtools對SNP數據進行嚴格過濾,過濾參數為:GQ>30,Q>30,缺失率<0.97,獲得2 111個高質量SNP標記。篩選親本純合且有差異的標記,剩余標記為2 010個,對P<0.05的偏分離標記進行過濾,剩余1 855個SNP標記用于連鎖圖譜的構建。

使用QTL IciMapping軟件進行連鎖圖譜的構建,SNP標記根據物理位置進行排序后導入IciMapping軟件,選擇MAP(Linkage map construction in biparental populations)功能進行連鎖群的劃分及遺傳距離的確定,在軟件界面“Grouping”命令中選擇By Anchor only,在Order命令中選擇By Anchor order,連鎖群選擇10,進行輸出,獲得連鎖圖譜。

1.4 QTL定位

采用META-R軟件獲得的BLUP值作為表型值,使用QTL IciMapping軟件的BIP(QTL mapping in biparental populations)功能對穗軸長與穗軸粗進行QTL定位,定位方法采用完備區間作圖加性模型(ICIM-ADD)[16]。分子標記之間每隔0.5 cM 進行1次全基因組掃描,窗口的設定為5.0 cM。

1.5 全基因組預測

采用48K液相雜交探針技術獲得的62 504個SNP標記進行全基因組預測(Genomic selection GS),利用多環境的BLUP值作為表型值,使用R軟件包rrBLUP,對穗軸長和穗軸粗性狀進行全基因組預測分析。采用五倍交叉驗證方法[19],即隨機選取群體的80%作為訓練群體,剩下的20%作為預測群體,進行GS,計算預測群體的真實育種值與全基因組估計育種值間的相關系數,即全基因組預測精度,重復100次。

標記個數設定為10、30、50、100、300、500、1 000、3 000、5 000、10 000和60 000,采用五倍交叉驗證方法,每個標記密度進行100次GS,研究標記數目對GS預測精度的影響。訓練群體設定為總群體的10%,20%,30%,40%,50%,60%,70%,80%和90%,剩余群體為預測群體,采用全部62 504個SNP標記,每個訓練群體大小進行100次GS,研究訓練群體大小對GS預測精度的影響。

2 結果與分析

2.1 F2群體穗軸長和穗軸粗表型分析

由表1可知,在F2群體中穗軸長的均值為14.42 cm,最小值為12.94 cm,最大值為16.40 cm,變異系數為0.05。穗軸粗的均值為2.51 cm,最小值為2.40 cm,最大值為2.67 cm,變異系數為0.02。穗軸長與穗軸粗的峰度和偏度都<1,基本符合正態分布的規律,是典型的數量性狀。

表1 F2∶3家系穗軸長和穗軸粗統計分析Table 1 Descriptive statistics of cob length and cob diameter in the F2∶3 families

2.2 穗軸長和穗軸粗方差分析

由表2可知,穗軸長與穗軸粗2個性狀在不同基因型、環境、基因型與環境的互作上都具有顯著差異。穗軸長與穗軸粗的廣義遺傳力分別是0.71與0.52,說明群體中穗軸長主要受遺傳因素影響,穗軸粗受基因型和環境因素共同影響。

表2 F2∶3家系穗軸長與穗軸粗方差及廣義遺傳力分析Table 2 ANOVA and broad-sense heritability (H2) analysis for cob length and cob diameter in the F2∶3 families

2.3 構建遺傳圖譜

由表3可知,其中3號染色體標記數目最多為346個,6號染色體標記數最少為85個。構建的遺傳圖譜總長度為2 788.80 cM,平均2個標記間的遺傳距離為1.50 cM,其中3號染色體圖譜最長為432.86 cM,6號染色體圖譜最短為168.57 cM。

表3 F2群體遺傳連鎖標記與圖譜長度Table 3 Marker and genetic distance information for the 10 maize linkage groups in F2 population

2.4 QTL定位結果分析

由表4可知,在第1、2、3、4、8和9號染色體上定位到8個控制穗軸長的QTL,其對穗軸長的表型貢獻率為3.54%~12.64%。位于第3號染色體的第54.3—54.7 Mb處的QTLqCL3,LOD 8.31,表型貢獻率為12.64%,加性效應為-0.37,是控制穗軸長的主效QTL。這個控制穗軸長的QTL來自于自交系‘B 73’。

在第2和4號染色體上定位到3個控制穗軸粗的QTL,其對穗軸粗的表型貢獻率為7.92%~10.61%。位于第4號染色體的第165.6—168.6 Mb 處的QTLqCD4-1,LOD 5.14,表型貢獻率為10.61%,加性效應為0.10,是控制穗軸粗的主效QTL。這個提高穗軸粗的QTL來自于自交系‘鄭58’,見表4。

2.5 全基因組預測

采用五倍交叉驗證法對玉米穗軸長與穗軸粗進行全基因組預測,穗軸粗與穗軸長的GS精度分別為0.39和0.56。其中穗軸粗的預測精度較低,變異范圍較大,這可能是因為穗軸粗的遺傳力低于0.7。

由圖1可知,穗軸長GS精度隨著標記數目增多而升高。當標記數目從10增加到500時,GS預測精度有顯著的提升,當標記數目>500時,穗軸長的預測精度增加幅度很小。采用不同標記時穗軸粗的預測精度的變化趨勢與穗軸長是一致的,即隨著標記數目的增加而不斷增加,當標記數目超過500后,穗軸粗的預測精度增加很小(圖1(b))。

圖1 F2群體不同SNP個數穗軸長(a)和穗軸粗(b)全基因組預測精度Fig.1 Genomic selection accuracy of cob length (a) and cob diameter (b) with different SNP numbers in the F2 population

由圖2可知,穗軸長的GS精度隨著訓練群體的增大而增加,當訓練群體從10%增加到60%時,穗軸長的預測精度顯著提升,當訓練群體>60%時,穗軸長的預測精度增加幅度很小。在樣本數量不同的訓練群體中穗軸粗的預測精度與穗軸長變化趨勢是一致的,穗軸粗的預測精度隨著訓練群體的增大而不斷的增加,當訓練群體>60%后,穗軸粗的預測精度增加幅度很小(圖2(b))。

圖2 F2群體不同訓練群體大小穗軸長(a)和穗軸粗(b)全基因組預測精度Fig.2 Genomic selection accuracy of cob length (a) and cob diameter (b) in the F2 population with different training population sizes

3 討 論

提高產量一直以來都是作物育種工作的主要目標之一,產量性狀的復雜性降低了玉米育種的效率,產量構成因子一般具有較高的遺傳力,因此是遺傳改良的目標性狀[9]。本研究中考察了F2群體的2個穗部性狀,分別是穗軸長與穗軸粗。其遺傳力分別為0.71與0.52,說明這2個性狀的基因型在表型變異中起重要作用。本研究利用1 855個SNP標記構建遺傳連鎖圖譜,分子標記數目多,平均遺傳距離為1.50 cM,有效地提高了QTL定位的準確性和精度。利用62 504個SNP標記進行全基因組預測,估計分子標記的遺傳效應。結合QTL定位與全基因組預測結果,可以更好地解析穗軸長與穗軸粗的遺傳基礎,提高育種效率,有效改良目標性狀。

本研究中穗軸長共檢測到8個QTL,位于1、2、3、4、8和9號染色體上,LOD變異范圍為2.68~8.31,能夠解釋51.04%的表型變異。王輝等[20]利用RIL群體對不同密度下的穗部性狀進行定位,定位到的qEL1其物理位置在第191.0—214.6 Mb,與本試驗定位到的qCL1-2(第199.8—205.1 Mb)所在染色體區間基本一致。Huo等[21]定位到的qCL8與本研究在8號染色體第176.8—176.9 Mb檢測到的QTL一致。這些共定位到的QTL是穩定QTL,也說明了本研究定位結果的可靠。同時本試驗中還定位到一個新的主效QTLqCL3,位于3號染色體,LOD為8.31,能夠解釋12.64%的表型變異,為玉米穗軸長的遺傳研究提供了新的QTL位點,可以用于精細定位,克隆相關基因。

穗軸粗共檢測到3個QTL,能夠解釋26.83%的表型變異。定位到1個控制穗軸粗的主效位點qCD4-1,表型貢獻率為10.61%。馬娟等[22]利用309份材料對穗軸粗進行全基因組關聯分析,檢測到位于2號染色體的主效SNP S2位于本研究所檢測到的位于第197—198 Mb的qCD2。該SNP同時在控制穗粒重及籽粒大小這2個性狀的定位中被檢測到。趙強等[23]利用2個F2∶3家系對玉米產量相關性狀進行定位,在1號染色體檢測到穗軸粗相關的QTL與本研究檢測到的位于第238—241 Mb的qCD4-2在同一染色體區段。吳律等[24]利用全基因組關聯分析檢測到穗軸粗相關的SNP為SCD9,其表型貢獻率為8.4%,該SNP位于本試驗所檢測到的第238—241 Mb的qCD4-2。本試驗定位到的2個穗軸粗相關的QTL為qCD2和qCD4-2,均在馬娟等[22]、趙強[23]和吳律[24]的研究中報道過,說明這些QTL是控制穗軸粗的穩定位點。本研究所定位到的穗軸粗主效QTL為qCD4-1尚未見報道,為該性狀提供了新的遺傳位點。王寶寶[25]認為可靠的遺傳組成可以為培育理想的玉米品種提供可靠的分子標記,因此,本試驗得到的結果有利于揭示玉米穗部性狀的遺傳組成,為培育理想穗型的玉米品種提供可靠的分子標記。

全基因組預測技術是改良復雜數量性狀有效工具之一,利用覆蓋全基因組的高密度SNP標記,可對依賴于基因型、受環境影響大和微效基因控制的復雜數量性狀進行有效預測。本研究結果與Guo等[26]的結果是一致,即在雙親后代群體,標記數目達到500個就可以獲得良好的預測精度;訓練群體包含群體總遺傳變異的60%時可以獲得良好的預測精度。

4 結 論

通過對玉米穗部性狀進行QTL定位,共檢測到了8個穗軸長相關QTL位點,分別解釋表型變異的3.54%~12.64%;共檢測到3個穗軸粗相關QTL位點,可解釋表型變異的7.92%~10.61%。采用五倍交叉驗證法對穗軸長與穗軸粗進行GS分析,穗軸長與穗軸粗的預測精度分別為0.56和0.39,預測精度中等。在探究不同SNP個數與預測群體對穗預測精度的影響時,發現GS預測精度隨著標記數目的增多而升高,但分子標記達到500時,GS預測精度就基本達到峰值,繼續增加分子標記對提高GS預測精度非常有限。GS預測精度也隨著訓練群體的增大而增加,訓練群體>60%時,GS的預測精度增幅較小。

猜你喜歡
表型位點性狀
珠海長肋日月貝形態性狀對體質量的影響
多環境下玉米保綠相關性狀遺傳位點的挖掘
基于衰老相關分泌表型理論探討老年慢性阻塞性肺疾病患者衰弱發生機制
PSORA:一種基于高通量測序的T-DNA插入位點分析方法
探訪“人類表型組”
表型組研究:中國后發先至
相信科學!DNA追兇是如何實現的?
作物表型組學和高通量表型技術最新進展(2020.2.2 Plant Biotechnology Journal)
一種改進的多聚腺苷酸化位點提取方法
甜玉米主要農藝性狀的研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合