?

分子設計育種在棉花中的應用進展與展望

2024-01-16 12:22趙俊杰任中英章志強張飛劉艷改賀昆侖郭金峰周曉箭張文生王海娟李威楊代剛
棉花學報 2023年5期
關鍵詞:棉纖維基因組棉花

趙俊杰,任中英,章志強,張飛,劉艷改,賀昆侖,郭金峰,周曉箭,張文生,王海娟,李威,4*,楊代剛,4*

(1.中國農業科學院棉花研究所/ 棉花生物育種及產業技術國家工程研究中心,河南安陽455000;2.奎屯華棉農業科技有限公司,新疆奎屯 833200;3.新疆生產建設兵團第七師農業科學研究所,新疆奎屯 833200;4.鄭州大學農學院,鄭州 450001)

1 棉花生產發展現狀

棉花是我國重要的經濟作物,是除糧食之外最重要的農產品和戰略物資,棉花產業影響著國民經濟的發展。我國是原棉生產大國,2022 年,全國棉花播種面積為300.03 萬hm2,總產量597.70萬t,占全球棉花總產量(2570 萬t)的近四分之一(圖1 和附表1)[1]。隨著社會進步和人民生活水平的提高,在保證產量的基礎上,提升棉花品質成為育種家的重要發力點。 此外,當前全球氣候變化導致的災害性天氣頻發,國際政治經濟環境復雜,保證原棉這一大宗農產品的安全供給是棉花產業可持續發展的關鍵。

圖1 1949―2022 年我國棉花逐年播種面積和總產量Fig.1 Annual plantation area and total annual production of cotton in 1949-2022 in China

我國是人口大國,在保證18 億畝(畝為廢棄單位,1 畝約為666.7 m2) 的耕地紅線下,2016 年原農業部對棉花種植結構重新調整規劃,將棉花種植面積調整至5 000 萬畝左右, 其中將新疆植棉面積提升至2 500 萬畝。 在有限種植資源下保障國家棉花生產安全是我國棉花產業必須應對的挑戰。 種子是農業的“芯片”,培育突破性新品種是提振棉花產業的關鍵。 自新中國成立以來,通過科學家的不斷奮斗,我國的棉花育種取得了巨大的成就,極大地促進了棉花產業的發展。

2 棉花育種歷程

作物育種先后經歷了原始馴化選育、常規育種、分子育種、分子設計育種4 個階段[2]。 原始馴化選育(育種1.0)通過人工選擇,保留最適宜栽培的野生種,優中選優,馴化成適合農耕需要的栽培種或農家種。 常規育種(育種2.0)開始和興盛于20 世紀, 玉米雜交育種和矮稈綠色革命基因的成功應用是常規育種的里程碑,在世界糧食增產和推動農業發展方面發揮了巨大作用[3-4]。 分子育種(育種3.0)包括基于20 世紀90 年代迅速發展的分子生物學理論和技術而形成的分子標記輔助育種和轉基因育種;步入21 世紀,分子設計育種(育種4.0)以新一代測序技術、基因組編輯技術、單倍體制種等新型技術為基礎,將生物遺傳學理論與雜交育種相結合,基于對控制作物重要性狀的關鍵基因及其調控網絡的認識,利用基因組學、表型組學等多組學數據進行生物信息學的解析、整合、篩選、優化,從而獲取符合育種目標的最佳基因型, 實現性狀的精準定向改良,從而高效地培育目標新品種[5-6]。

自20 世紀50 年代以來,我國棉花育種得到了質的飛躍, 棉花單產也經歷了跨越式發展。2022 年,每666.7 m2皮棉產量達132.8 kg,比新中國成立初期增加12.4 倍(圖2)。 我國棉花單產取得突破性提高的最重要因素是育種技術發展推動的品種改良。 據統計,品種改良對產量提高的實際貢獻率達到30%以上[7]。 以下就新中國成立以來我國的棉花育種發展歷程進行簡單梳理。

圖2 1949―2022 年我國每666.7 m2 皮棉產量Fig.2 Lint yield of cotton per 666.7 m2 in 1949-2022 in China

2.1 國外引種促進我國早期棉花育種發展

20 世紀20 年代, 我國第一次引進了美國的金字棉、脫字棉、愛字棉等陸地棉(Gossypium hirsutumL.) 品種, 逐步替代了長期種植的亞洲棉(G.arboreumL.)品種;1933―1947 年,我國相繼引進了德字棉531、斯字棉4 號、珂字棉100 等品種,完成了第二次引種;之后在1950 年前后引進岱字棉15 號、斯字棉5A 等美國品種,完成了我國亞洲棉和前期引進品種的更換,優化了我國的陸地棉品種[8-10]。 這些品種的成功引進,使我國棉花單產提高了15%, 纖維長度增加2~4 mm,改善了我國棉花生產上因長期使用亞洲棉以及混雜退化陸地棉品種導致的產量低、 品質差等問題,對我國棉花品種改良及棉花產業的發展起到了推動作用。

2.2 系統選育和雜交育種取得重要進展

系統選育是以原有品種產生的自然變異為前提進行的人工選擇育種。 自20 世紀60 年代開始, 中國農業科學院棉花研究所在岱字棉15 號基礎上選育出中棉所2 號,從烏干達棉中選育出中棉所7 號,這些系統選育的品種比對照品種岱字棉15 號增產14.3%左右[10]。 此外,前徐州農業科學研究所從斯字棉2B 中系統選育出徐州209, 該品種在當時比對照斯字棉2B 及岱字棉15 號增產(以皮棉計)15%以上[11],是我國第一個產量超美棉的大面積種植品種,并于1965 年獲得國家發明獎;之后,從徐州209 后代中選育出中早熟品種徐州1818,使棉花單產提高18%,累計推廣面積達7 800 萬畝[10],榮獲1978 年全國科學大會獎。 這些系統選育的品種逐步取代國外引進的品種,開啟了我國棉花品種自主選育的發展道路。

20 世紀70 年代之后, 在推廣自交品種的同時,我國也逐步開始棉花雜交育種工作。 育種家在中棉所2 號和1195 系的雜交后代中選育出魯棉1 號,該品種比岱字棉15 號增產30%以上[12],累計推廣面積超過1 億畝,是我國第一個大規模種植的國產品種,徹底結束了美國岱字棉系列作為我國黃河流域棉區主導品種的20 多年歷史,1981 年榮獲國家發明一等獎。 除此之外,在黃河流域棉區通過雜交手段先后選育出徐州142、邢臺6871、冀棉8 號等代表性品種;在長江流域棉區選育出鄂沙28、鄂棉18、蘇棉2 號等表現優良的品種[10,12]。 進入20 世紀80 年代中期,枯萎病和黃萎病呈快速傳播態勢,我國育種家從烏干達4 號和邢臺6871 的雜交后代中選育出抗病品種中棉所12 號, 該品種首次克服了高產與抗病性、 纖維品質遺傳負相關的難題,1986―1997 年累計推廣面積超過1.6 億畝, 成為當時推廣面積最大、單年種植面積最高和衍生品種最多(超過200 個)的歷史性品種,榮獲國家技術發明獎一等獎,創造了巨大的社會效益和經濟效益[13]。中棉所16 和中棉所19 早熟性好,開創了麥棉套種、兩熟種植模式,化解了糧棉爭地矛盾,1997 年和1999年分別獲得了國家科技進步獎一等獎[14-15]。 其他育種單位在此期間也培育了很多優良的棉花品種,如山東省農業科學院育成的魯棉6 號,其皮棉產量高于對照品種冀棉8 號13.6%,到1990 年累計推廣種植6 000 萬畝[12];此外,徐州農業科學研究所選育的早熟、抗病品種徐州219,河南省農業科學院經濟作物研究所與中國科學院遺傳與發育生物學研究所聯合選育的抗病品種豫棉11 等均為當時抗病育種工作做出了突出貢獻。

近幾年, 新疆成為我國最大的棉花主產區,棉花種植面積和總產量常年穩居全國第一位。新中國成立后, 我國從蘇聯先后引進了2 依3、910 依、5904 依、8763 依等海島棉(G.barbadenseL.)品種并直接推廣種植[10],這些品種為我國西北內陸地區早期海島棉育種奠定了基礎,開啟了新疆地區棉花傳統育種工作的新篇章。 自20 世紀60 年代后,新疆地區開始推廣自育品種吐海1 號和軍海1 號等,其中軍海1 號以其抗病、早熟、豐產特性,成為我國種植時間最長、推廣面積最大的海島棉品種[10]。20 世紀80 年代之后,推廣種植的新海3 號、 新海11 等新海系列抗病品種結束了新疆棉花育種初期品種多、亂、雜的局面,使新疆逐步發展為我國的主要海島棉種植區。 在引進海島棉的同期,我國從蘇聯引進司3173、108 夫、司1470 等早熟、大鈴的陸地棉品種,逐步淘汰了原先種植的草棉(G.herbaceumL.)和黑籽棉[10]。之后,以108 夫、克克1543、司1470 為材料,自育出軍棉1 號、新陸早3 號、新陸中1 號、新陸中3號等棉花品種,其中軍棉1 號是最早育成的中熟陸地棉品種,具有產量高、適應性廣、抗逆性強的特點,其累計推廣面積達2 400 多萬畝,對我國西北棉區品種更替發揮了重要作用,該品種的成功選育也徹底結束了引進蘇聯品種進行推廣應用的局面[16]。 之后陸續培育的新陸早33 號、新陸中54 號和新陸早66 號等品種使得我國新疆植棉區棉花產量大幅度提高[17-18]。

2.3 分子育種技術是棉花育種的“加速器”

分子育種技術是通過利用分子手段對目標材料進行性狀改良,進而培育出符合育種需求的新品種, 主要包括分子標記輔助育種和轉基因育種[19-20]。 借助分子標記輔助選擇技術,我國培育了纖維品質突出的中棉所70,該品種的纖維上半部平均長度達32.5 mm, 斷裂比強度33.5 cN·tex-1,馬克隆值4.3,紡紗均勻性指數166,達到了“雙30”標準(即纖維上半部平均長度超過30 mm,斷裂比強度超過30 cN·tex-1), 是我國首個國審優質抗蟲雜交棉品種[21]。之后,利用該育種方法又陸續培育出中棉所78、中棉所96、中棉所101 等優質抗蟲雜交棉品種[22]。 20 世紀90年代,棉鈴蟲和紅鈴蟲成為我國棉花生產的災難性害蟲。我國科學家成功構建具有自主知識產權的蘇云金桿菌(Bacillus thuringiensis,Bt)轉基因體系,并成功選育出sGK321(1998 年)、中棉所41(2001 年)和中棉所45(2003 年)等轉基因抗蟲棉品種,打破了國外技術壟斷,實現抗蟲棉的國產化[23]。我國成為繼美國之后第二個成功培育出轉基因抗蟲棉品種的國家[24]。 其中,中棉所41 是借助花粉管通道法等技術培育的第一個國審轉基因抗蟲棉品種,使棉鈴蟲危害降低了70%~80%,種植面積曾占山西、陜西2 省種植面積的50%以上,在2009 年榮獲國家科技進步二等獎,被專家評價為“該品種是我國轉基因抗蟲棉育種的重大突破”。 之后,我國科學家又相繼培育出轉基因雜交棉品種魯棉研28 號、中棉所63、中棉所66、湘雜棉7 號、銅雜411、鄂雜棉29 等,徹底打破美國抗蟲棉的壟斷。 自1997 年我國開始商業化種植轉基因棉花以來,種植規??焖僭鲩L,由當年的150 萬畝增長到5 850 萬畝,在2002 年,國產轉基因抗蟲棉的種植面積占轉基因棉總種植面積的52%,首次超過國外品種[24-26]。

分子標記輔助育種也推動了多基因控制的重要農藝性狀的協同改良。 中國農業科學院棉花研究所馬雄風等在傳統育種基礎上借助高通量基因分型平臺,篩選了聚合優異基因、遺傳背景優良的中間材料,選育了集早熟(110 d)、高產(畝產量450 kg)、 優質 (纖維上半部平均長度超過31 mm,斷裂比強度超過31 cN·tex-1)、穩產的突破性品種——中棉113。該品種于2019 年通過甘肅省審定,并在北疆植棉區引種種植,連續入選新疆生產建設兵團主推品種,其推廣應用令北疆部分風險棉區轉變為適宜棉區。 該品種有望成為北疆地區確保高品質棉花供應、超越“澳棉”品質標準的“芯片品種”[27-29]。 由于綜合性狀突出,中棉113 入選了農業農村部2022 和2023 年度主導品種,并獲批出口“一帶一路”沿線國家,通過塔吉克斯坦共和國品種審定[30-31]。

3 棉花分子設計育種的重要成果

隨著分子生物技術特別是基因編輯技術、高通量測序技術的發展,分子設計育種將“經驗育種”轉變為“精準育種”,大大提高了育種效率。 近十年,由科技部實施的“七大農作物育種”項目和由中國科學院啟動實施的戰略性先導科技專項(A 類)“分子模塊設計育種創新體系”“種子精準設計與創造”項目,分別開展了水稻、玉米、大豆、小麥、棉花等復雜性狀的解析和設計育種技術的開發[32-34]。 雖然棉花分子育種相關研究開展較晚,但在“863”和“973”重大計劃、國家重點研發計劃等項目支持下, 我國棉花基礎研究取得不少突破,在棉花基因組研究、群體遺傳研究、重要農藝性狀的分子模塊解析等方面都取得較大進展,其中基因組研究已處于國際領先水平。

3.1 棉花基因組測序取得重大進展

棉花基因組測序的完成和不斷更新對群體遺傳研究、基因定位、分子育種模塊構建等起到巨大的推動作用。 目前大面積種植的陸地棉是由A 基因組和D 基因組大約在100 萬~160 萬年以前雜交加倍而形成的異源四倍體棉種[35]。 2012年,美國科學家和我國科學家分別公布了陸地棉D 亞基因組供體雷蒙德氏棉 (G.raimondiiL.)基因組序列[36-37]。 隨著基因組測序技術的發展,又先后重新組裝和更新了雷蒙德氏棉的基因組序列,最終確定其基因組大小為737~750 Mb[38-39]。2014 年, 我國科學家首次公布了A 基因組亞洲棉的基因組序列[40],經過不斷更新,確定該基因組大小為1 637 Mb[39,41-42]。 同時,另一個A 基因組棉種草棉(非洲棉)的基因組序列也完成組裝,其基因組大小為1 556 Mb[41]。 針對陸地棉A 亞基因組供體的爭議, 朱玉賢院士團隊明確了A 亞基因組的供體來源并不是上述的亞洲棉和非洲棉,而是草棉和亞洲棉已經滅絕的共同祖先基因組A0[41]。

陸地棉和海島棉是世界上廣泛種植的2 個四倍體棉種。 2015 年,中國農業科學院棉花研究所和南京農業大學分別牽頭組裝了陸地棉遺傳標準系TM-1 的全基因組序列, 首次揭示四倍體棉花的全基因組參考序列和進化規律[43-44]。 經過先后6 次數據更新,確定其基因組大小為2287Mb,并將97.4%的序列錨定到26 條染色體上[41,45-50]。為彌補我國自育陸地棉品種基因組的空白,我國科學家分別在2019 年和2021 年公布了中棉所24 和農大棉8 號的全基因組數據,為研究棉花基因組結構變異及我國本土棉花遺傳改良提供了參考圖譜[50-51]。 在開展陸地棉基因組測序的同時,2015 年公布了第一個海島棉栽培種——“3-79”的基因組序列,之后我國科學家對海島棉品種新海21、海7124、Pima90 的基因組序列進行組裝,為海島棉重要基因的挖掘和陸地棉品種的改良提供了新的資源和參考,最新公布的海島棉基因組大小為2 210 Mb[45,48,51-53]。

3.2 棉花纖維發育分子模塊鑒定

棉花產量和纖維品質是育種改良的重要性狀,而纖維發育對其有直接影響。 1992 年科學家首次克隆了在初生細胞壁合成后期和次生細胞壁合成早期階段高表達、與纖維表皮細胞發育相關的基因pCKE6[54],自此開始棉纖維發育分子調控機理的研究。

轉錄因子在調控棉花纖維發育方面發揮著重要作用,包括MYB、bHLH、WRKY 等。 MYBWD40-bHLH 復合體在纖維起始分化中扮演關鍵的角色[55]。 MYB 轉錄因子是植物中數量龐大的一類家族,目前在棉花中發現524 個MYB[56]。 通過無纖維棉突變體和轉基因試驗驗證發現,GhMYB25和GhMYB109正向調控纖維的起始和伸長, 過表達會導致纖維起始數目和葉片毛狀體增加[57-58]。圖位克隆定位到兩個MYB25-like基因——GhMML3_A12和GhMML4_D12, 在GhMYB109和GhMYB25上游分別調控短絨和長纖維兩種胚珠表皮細胞的纖維起始,對棉纖維的發育具有重要作用[59-61]。 在光子突變體N1中,GhMML3_A12能產生小RNA,經自我剪切,導致GhMML3_A12低水平表達, 影響棉纖維發育[60]。位于Dt12 染色體上的GhMML4_D12主要控制長絨纖維起始分化,被視為調控纖維發育起始的“開關”[61]。 對短纖維突變體和野生型棉纖維進行甲基化組和轉錄組聯合分析, 發現轉錄因子GhMYB44的m6A 甲基化修飾程度在兩種材料中差異顯著,沉默GhMYB44能顯著提高棉纖維的伸長[62]。 WRKY 類轉錄因子GhWRKY16 在纖維發育早期被GhMPK3-1 蛋白磷酸化后,能直接激活GhHOX3、GhMYB109、GhCesA6D-D11和GhMYB25基因的轉錄, 從而促進纖維的起始和伸長[63]。

激素是植物體內的微量有機化合物,調節各種生理過程,在棉纖維發育中發揮重要功能。 赤霉素(gibberellic acid, GA)能夠促進棉花纖維伸長, 而加入GA 合成抑制劑會使纖維短而少[64]。GhHOX3是GA 信號通路的一個重要轉錄因子,沉默該基因會導致棉纖維縮短80%,進一步研究發現,GhHOX3 可以結合到棉花細胞壁松弛蛋白基因GhRDL1和GhEXPA1的啟動子上,進而促進棉纖維伸長[65]。 而GhRDL1和GhEXPA1均屬于細胞壁蛋白編碼基因,共表達之后能顯著改善棉纖維長度、強度和馬克隆值[66]。 此外,當GA 濃度升高時,組成DELLA 阻遏蛋白的GhSLR1 被蛋白酶降解,釋放GhHOX3 與增強子GhHD1 結合,促進棉纖維伸長[65-67]。 茉莉酸(jasmonic acid,JA)在表皮毛發育中起著重要作用。 JA 在纖維起始階段可抑制纖維發育的負調控因子GhJAZ2的表達, 影響GhJAZ2與下游的MYB25-like和GhGL1相互作用,進而促進棉纖維形成[68]。 油菜素內酯(brassinosteroid, BR)是調控細胞伸長的重要激素,外源施加BR 能夠正向調控纖維發育[69]。沉默編碼BR 應答激酶受體蛋白的基因GhBRI1會使細胞次生壁的發育受到強烈抑制,影響纖維素在次生細胞壁中的沉積, 導致纖維成熟度降低[70]。類固醇5α 還原酶是BR 合成通路中的關鍵限速酶, 在種皮特異性表達編碼類固醇5α 還原酶的基因GhDET2能夠增加棉纖維的數量和長度[71]。 Yang 等[72]創制的功能獲得型突變體pag1中,過表達編碼細胞色素P450 的基因GhPAG1導致內源BR 失活從而抑制纖維伸長,該突變體植株矮小、纖維長度顯著低于野生型。作為BR 信號通路下游的正調控因子,GhPRE1A 能夠與GhAIF3 相互作用,解除GhAIF3 和bHLH 轉錄因子GhPAS1 的結合,重新激活GhPAS1 對下游靶基因的調控,從而促進棉花纖維的伸長[73]。酸性調控蛋白Gh14-3-3 可以與BR 信號轉導途徑中的關鍵轉錄因子GhBZR1 相互作用調節棉纖維的起始和伸長[74]。除BR 外,外源施加乙烯(ethylene,ETH)能夠顯著促進棉纖維細胞伸長。 1- 氨基環丙烷-1- 羧酸氧化酶(1-aminocyclopropane-1-carboxylic acid oxidase, ACO)是ETH 合成途徑中的一個酶,目前在棉花中已克隆了3 個同源基因GhACO1、GhACO2、GhACO3,這些編碼限速酶的基因在纖維伸長期高表達[75]。生長素(auxin,AUX)是植物重要的激素之一,利用表皮特異啟動子FBP7 在棉花中表達外源吲哚-3- 乙酸(indole-3-acetic acid,IAA)合成基因iaaM能夠顯著提高棉株中生長素的含量, 促進纖維起始、增加纖維數量[76]。 作為典型的CIN 類TCP基因,GhTCP4在纖維次生壁加厚期受到miR319 的調控,與IAA 合成途徑中的關鍵基因GhAUX1、GhIAA3和GhPIN2的啟動子結合,調控棉纖維的發育[77]。脫落酸(abscisic acid, ABA)是纖維發育的負調控因子,在徐州142 無絨無絮突變體的纖維起始早期階段檢測到較高的ABA 含量,同時, 外源施加ABA 也會抑制離體培養的胚珠的纖維起始和伸長[78-79]。

木聚糖是纖維細胞壁中半纖維素的重要組分,研究人員鑒定了參與半纖維素合成的糖基轉移酶基因,發現GhGT43A1和GhGT43C1均在次生壁合成期大量表達;基因突變和回補實驗表明,GhGT43A1和GhGT43C1基因可能通過調節棉纖維細胞壁中木聚糖的積累影響棉纖維發育[80]。 糖轉運蛋白SWEETs 負責蔗糖的運輸和存儲,是植物碳分配的重要調節因子。 轉錄因子GhMYB212 在纖維伸長期能直接調控蔗糖轉運蛋白基因GhSWEET12的表達,介導胚珠中的蔗糖運輸到纖維,從而調控棉纖維的伸長[81]。Gh-SWEET15在纖維次生壁合成期特異表達,突變該基因引起植株活性氧增加,導致纖維中蔗糖含量降低、次生壁變薄,進而影響纖維的長度和馬克隆值[82]。

除了上述的調控機制,表觀遺傳修飾在棉纖維發育中也起著重要作用[83]。 組蛋白去乙?;鳛橹匾谋碛^遺傳修飾之一,在植物的生長發育過程中發揮著重要作用。 利用胚珠離體培養發現組蛋白去乙?;种苿┣乓志谹 顯著抑制棉纖維起始發育;組蛋白去乙?;梢哉{控多個植物激素途徑的關鍵基因,進而抑制ABA 合成和信號轉導,促進纖維細胞起始[84]。GhHAD5基因編碼一個去乙?;?,在纖維發育起始階段高表達,其RNA 干擾株系中纖維發育相關基因啟動子區的H3K9 乙?;斤@著升高,抑制了纖維起始,導致長纖維數量減少[85]。 組蛋白H2B 單泛素化酶GhHUB2 通過泛素-26S 蛋白酶體途徑降解轉錄抑制因子GhKNL1,消除其對棉纖維長度和細胞壁厚度的抑制作用,促進棉纖維增長和次生壁增厚;GhHUB2超表達株系中纖維長度、細胞壁厚度以及纖維素和木質素的含量、纖維強度均顯著高于對照[86-87]。

3.3 棉花抗病分子模塊鑒定

棉花枯萎病和黃萎病均是由真菌引起的土傳病害,是棉花生產上危害最為嚴重且化學藥劑難以有效防治的維管束病害[88-89]。 鑒定棉花對枯、黃萎病抗性調控的分子模塊對培育抗病棉花品種具有重要意義。 枯萎病由尖孢鐮刀菌萎蔫?;停‵usarium oxysporumf.sp.vasinfectum)引起,MAPK 級聯信號通路可調控植物抗毒素的生物合成和植株的防衛反應,由棉花GhMKK6介導的MAPK 級聯信號通路在枯萎病抗性方面發揮著重要作用。GhMKK6是棉花A 亞基因組MEKs基因,利用病毒介導的基因沉默技術沉默GhMKK6后發現,棉花對枯萎病菌的抗性顯著下降。 通過酵母雙雜交技術篩選到GhMKK6 的互作蛋白GhMORG1 可作為MAPK 級聯信號通路的支架蛋白,調控GhMKK6 介導的MAPK 級聯信號通路,影響棉花對枯萎病菌的抗性[90]。深入研究發現,轉錄因子GhbHLH122 在GhMKK6-GhMPK4 信號通路的下游發揮枯萎病抗性調控功能,GhMPK4 參與介導了GhbHLH122 調控的1- 氨基環丙烷-1- 羧酸(1-aminocyclopropane-1-carboxylate, ACC) 合成酶基因GhACS6a和GhACS6b的轉錄激活過程,進而促進ETH 的生物合成,最終正調控植株對枯萎病的抗性[91]。ETH 不敏感蛋白3(ethylene insensitive 3, EIN3)和EIN3-like(EIL)蛋白是ETH 信號轉導途徑中重要的轉錄因子,在枯萎病菌脅迫和外源ETH處理下,GhEIN3基因顯著上調表達;GhEIN3沉默植株更易感病,在GhEIN3沉默植株中病程相關基因GhPR1、GhPR2、GhPR4和ETH 響應因子基因GhERF1、GhACO表達水平顯著降低,表明GhEIN3基因能正向調控棉花枯萎病抗性[92]。GhERF5 是位于ETH 信號傳導通路下游的轉錄因子,其通過參與ETH、JA途徑調控下游相關抗病防衛基因的表達,進而提高棉花對枯萎病的抗性[93]。

黃萎病是由大麗輪枝菌(Verticillium dahliae)引起的一種土傳真菌性病害,是造成棉花產量和品質下降的重要病害,被稱為棉花的“癌癥”[94-95]。防治黃萎病的有效手段之一就是挖掘抗病基因用于品種改良。 Li 等[96]篩選和鑒定了與大麗輪枝菌2 號生理型抗性相關的基因GbANA1,過表達該基因能提高擬南芥的抗性水平,且群體遺傳學分析表明該基因在陸地棉中發生單核苷酸缺失,無法編碼完整的核酸結合位點和富含亮氨酸重復結構域,進而導致對2 號生理型小種的抗性降低。 陸地棉核糖體蛋白基因GhRPL18A-6調控細胞壁和木質素合成,在過表達GhRPL18A-6的棉花中,木質部薄壁組織細胞壁的木質化及活性氧水平提高,且一些與抗病相關的標記基因顯著上調,莖稈及根中大麗輪枝菌數量減少[97]。GhROP6編碼Rho 鳥苷三磷酸酶,受茉莉酸甲酯誘導上調表達,在擬南芥中超表達GhROP6能增加茉莉酸-異亮氨酸含量和木質素含量,增強其對黃萎病菌的抗性[98]。 GhBIN2 是BR 通路中重要的蛋白激酶,能夠磷酸化JA 信號通路的負調控因子茉莉酸ZIM 結構域蛋白(jasmonate ZIM-domain,JAZ),從而抑制JA 信號的傳導,導致棉花植株對黃萎病的抗性降低[99]。 促絲裂原活化蛋白激酶基因GhMAPKKK2響應黃萎病菌及外源JA、SA處理,沉默GhMAPKKK2基因后,植株的病情指數、 維管束褐變程度以及莖段菌絲數量明顯提高,表明該基因在棉花抗黃萎病反應中發揮正調控的作用[100]。 鈣調蛋白(calmodulin,CaM)是生物體中存在的Ca2+傳感器,對植物免疫至關重要。在棉花被病原菌侵染后,GhCaM7 作為次級信使與Ca2+結合,導致GhCaM7 乙?;斤@著提高,進而提高植株對黃萎病的抗性[101]。 細胞壁相關的類受體激酶GhWAKL 在受到黃萎病菌侵染時,與棉花DnaJ 蛋白相互作用激活SA 生物合成,正向調節對黃萎病菌的抗性[102]。 Zhou 等[103]通過蛋白質修飾組學聯合分析發現,在大麗輪枝菌脅迫下GhDEK2D 被磷酸化、乙?;头核鼗?,進而正向調控棉花抗病性,而沉默GhDEK2D導致棉花體內活性氧水平顯著升高,與防御相關的基因表達水平顯著下降。 這些研究結果為防治棉花黃萎病提供了重要的理論基礎和基因資源。

3.4 基于測序數據挖掘棉花重要性狀分子模塊

棉花的產量、纖維品質、抗性等多是數量性狀,多由數量性狀位點(quantitativetraitlocus,QTL)控制,基因間存在多效性、協同耦合性。 解析重要性狀間耦合的遺傳調控網絡,明確關鍵調控單元是分子設計育種的關鍵科學問題[33]。 由多單位合作對318 份棉花的全基因組重測序揭示了我國陸地棉品種的遺傳基礎和演化規律, 鑒定出25個品種改良相關位點和119 個產量、 纖維品質、黃萎病抗性等關聯位點,為棉花“精準育種”提供了優異的基因資源和理論指導[104]。 華中農業大學張獻龍團隊為揭示人工馴化對基因組的影響,構建了陸地棉的首個綜合變異圖譜,在全基因組范圍內鑒定了93 個馴化選擇區間,其中4 個位點影響纖維品質, 研究還明確了At 基因組的馴化選擇基因與纖維長度相關,Dt 基因組的馴化基因與逆境響應相關[49]。 中國農業科學院棉花研究所和河北農業大學合作首次利用重測序構建了419 份陸地棉核心種質的基因型和表型變異數據,發現了分別位于Dt11 和At10 染色體上控制棉纖維長度的2 個主效候選基因,鑒定到大量與纖維長度、纖維強度密切關聯的主效QTL 位點,為陸地棉分子育種提供了關鍵的標記選擇依據[105]。 浙江大學張天真團隊構建了一套包含920份材料的多親本重組自交系(multiparent,advanced generation, inter-cross, MAGIC)群體,鑒定到54個與產量、纖維品質性狀關聯的基因位點,結合839 份不同年代培育的栽培種,明確約85%的優良等位基因來自早期的美國引種,該研究為揭示中國棉花栽培種的遺傳組成及育種歷程提供了指導[106]。

隨著測序技術和研究方法的發展,除了在核苷酸變異層面解析表型影響機制外,結構變異如何影響復雜性狀已成為新的熱點。 華中農業大學張獻龍團隊構建了1 913 份棉花種質資源的遺傳變異組,挖掘到29 萬個結構變異,利用泛基因組數據分析了124 個與纖維品質等性狀相關的獲得/缺失變異(present-absent variation,PAV)在馴化和改良中的頻率變化,剖析了馴化和改良中的基因組分歧,共鑒定到162 個與纖維品質、產量、開花期等16 個性狀相關的QTL,從泛基因組學的角度為棉花重要性狀的精準改良提供新思路[107]。該團隊還構建了棉屬的泛三維基因組圖譜,明確結構變異、轉座子插入和染色質開放程度驅動了非編碼調控元件與同源基因間調控網絡的演化,結合1 005 份纖維發育的轉錄組數據, 解析了結構變異對纖維表型差異的影響,發現SGNH基因的拷貝數變異和調控演化與不同棉種纖維品質的差異相關[108]。中國農業科學院棉花研究所李付廣團隊利用單分子長讀長測序(single-molecule long reads) 和Hi-C 測序技術組裝了陸地棉品種TM-1 和ZM24 的基因組, 基因組比較分析發現At08 染色體上存在著最長的3 個結構變異,占該染色體總長度的30%,該倒位可能影響陸地棉群體分化,對推動棉花基礎生物學研究和遺傳改良具有重要意義[50]。 浙江大學張天真團隊通過圖形泛基因組聯合關聯分析, 挖掘到222 個與產量、纖維品質、成熟期相關的新結構變異位點,其中位于At04 染色體的與長絨棉衣分關聯的結構變異位點可能是由南美洲的野生種和農家品種導入到美國匹馬(Pima)棉[109]。

分析7 個異源四倍體棉種以及其他野生棉種的基因組圖譜為解析棉種的進化過程和鑒定重要性狀的分子機制提供了新的視角。 陸地棉產量高、海島棉纖維長且抗逆性較強,比較基因組發現編碼磷酸肽結合蛋白的基因結構變異可能引起纖維長度發生改變,而烯酰輔酶Aδ 異構酶3 和乙烯響應因子RAP2-7 可能通過調節植物激素相關的生化途徑,提高棉花對非生物脅迫的耐受性[110-111]。 中國農業科學院棉花研究所杜雄明團隊對我國不同棉區的230 份亞洲棉和13 份草棉的群體結構變異研究,揭示了與抗病性、產量和生育期等性狀相關的遺傳分化位點[42]。 為進一步明確二倍體棉種的遺傳貢獻, 該團隊還分析了3 000 多份棉花種質資源,鑒定到2 個新的與纖維品質密切關聯的優異等位變異,這2 個變異分別源自二倍體栽培種亞洲棉和野生種瑟伯氏棉,其中來自亞洲棉的優異等位變異對纖維長度和纖維強度的提升貢獻接近15%,具有顯著的纖維品質改良潛力,從基因組水平證實了遠緣雜交對陸地棉纖維品質的影響[112]。

4 我國棉花分子設計育種發展路徑

傳統育種很難實現由多基因控制的復雜性狀的協同改良,分子設計育種能夠將新型生物技術和育種相結合,實現精準育種目標,提高育種效率,是未來作物育種的發展方向。

4.1 棉花公共數據庫平臺的建立

隨著棉花基因組測序的完成及海量組學數據的出現,整合多組學數據,建立系統的公共數據庫勢在必行。 中國農業科學院棉花研究所通過整合18 個棉屬物種的高質量基因組序列以及變異位點、轉錄組和基因互作網絡等信息,搭建了棉花資源與網絡數據庫(Gossypiumresource and network database,GRAND),有效提高了棉花多組學數據的利用效率[113]。 多家單位聯合整合了25個棉花基因組、76 個組織樣本的轉錄組、5 個物種的表觀遺傳學、4 180 個樣本的群體遺傳變異數據、20 個表型和768 個代謝物含量等的公共多組學數據,構建了目前最為系統和全面的棉花多組學數據庫CottonMD,該數據庫利用多種關聯分析方法挖掘“變異- 基因表達- 表型”之間的關聯信息,并提供相應數據可視化查詢[114]。 浙江大學農學院建立的棉花多組學數據庫COTTONOMICS收集了3.25 Tb 的多組學數據,具有高效、便捷的分析模塊和可視化功能,為棉花精準育種提供重要的科研平臺[115]。 中國農業科學院生物技術研究所張銳團隊建立了棉花CottonFGD 數據庫,該數據庫經過不斷更新,目前也包含了比較全面的棉屬基因組數據[116]。 然而,這些數據庫目前僅應用在基礎研究,無法直接用于實際育種工作,主要原因是育種者很難找到針對所用育種材料的遺傳信息, 而這些數據庫有不同的操作流程,很難實現不同數據庫的交互式切換。 下一步,應構建標準化的基因型檢測系統,建立分子育種數據庫登記平臺,摸清不同育種材料的遺傳背景信息,在系統中存檔,并基于傳統機器學習和深度學習對種質資源的性狀數據和遺傳數據進行分析,搭建“一站式”人工智能決策系統,設計最佳育種方案,定向、高效改良和培育新品種,實現由傳統經驗育種到智能設計育種的轉化。

4.2 基因編輯技術助力棉花分子設計育種

基因編輯是對特定DNA 序列進行剪切、堿基替換或插入,實現對基因組的修改[117]。 基因編輯技術是目前全球育種行業競爭的制高點,也是現代育種4.0 時代的技術核心,其中成簇的規律性間隔的短回文重復序列及其相關蛋白(clustered regularly interspersed short palindromic repeats/CRISPR-associated protein, CRISPR/Cas)系統以其操作簡便、周期短、效率高等優點得到廣泛應用和迅速發展,成為農作物品種改良強有力的工具[5,118]。 棉花作為異源多倍體的模式作物,在基因編輯遺傳研究方面也取得進展。 華中農業大學金雙俠團隊利用高通量測序方法,詳細評估了CRISPR/Cas9 系統在棉花基因編輯過程中的脫靶效應,發現CRISPR/Cas9 編輯后代中存在數千個單核苷酸多態性 (single nucleotide polymor phism,SNP)和插入缺失(insertion-deletion Indel)變異, 而這些遺傳變異來源于同一親本的后代,個體間的差異或者組織培養中體細胞變異的數量遠遠大于CRISPR 脫靶位點的數量, 表明CRISPR/Cas9 系統對多倍體植物基因組的編輯具有高度特異性,其脫靶率極低[119]。此外,中國農業科學院棉花研究所建立了無基因型限制的棉花遺傳轉化體系,可將轉化周期縮短至2.5~3.0個月;同時,利用花青素顯色原理建立的可視化基因編輯工具檢測體系能提高基因編輯的檢測效率[120]。這些方法的建立加速了基因編輯技術在棉花基因功能研究中的應用,但是如何將其運用于育種中還有許多問題要解決,例如,如何減少產業化種植過程中的基因漂移? 以CRISPR/Cas9為代表的基因編輯工具對操作者及實驗室環境有嚴苛的要求,如何將其應用于常規育種環境也是必須要解決的一個問題。

4.3 合成生物學開辟棉花使用新路徑

合成生物學是融合了生命科學、工程學和信息科學等多個研究領域的交叉學科,是以分子生物學和分子遺傳學等為基礎,結合多種組學和系統生物學的手段,根據實際應用需要,通過合成生物功能元件和系統,對細胞或生物模塊、生物系統進行從頭設計、改造,使其具有滿足人類需求的生物功能[121-122]。 作為重要的經濟作物,棉花全株都具有重要的價值, 除纖維可直接用于紡紗、棉籽用于榨油外,棉酚與紫杉醇同為萜類化合物,具有重要的藥用價值。 研究發現棉酚可以廣譜抑制多種冠狀病毒,以新型冠狀病毒(SARSCoV-2)為實驗模型,采用多學科交叉的方式,篩選并發現棉酚可以靶向結合到RNA 依賴的RNA 聚合酶活性口袋區域,阻遏SARS-CoV-2 及其變異株的復制;另外,棉酚還對豬流行性腹瀉病毒、豬急性腹瀉綜合征冠狀病毒、豬德爾塔冠狀病毒等多種冠狀病毒具有抑制作用[123]。纖維素合酶復合體是合成生物學的另一個研究重點。 纖維素是植物細胞初生壁和次生壁的主要組分,由位于質膜的纖維素合酶復合體合成。 最近研究人員利用冷凍電鏡解析了纖維素合成酶CesA 同三聚體結構,該結構與次生細胞壁形成有關[124]。 而棉花纖維細胞壁的特性決定了纖維品質, 因此,未來可利用合成生物交叉學科創造纖維體外發生器來改良棉花纖維品質。

5 結論

分子設計育種為快速突破現有品種的局限提供了契機,然而目前基因組中與重要性狀相關的有效遺傳信息仍比較匱乏,也缺乏完整的分子調控網絡。 隨著棉花公共數據庫的建立、基因編輯體系的完善和市場化以及合成生物學的有效利用,棉花將逐步建立起從功能基因挖掘、驗證,到遺傳數據的更新和整合,以及育種材料的選育和技術體系的改良,為我國棉花產業安全和打好種業翻身仗提供技術支撐。

附表:

詳見本刊網站(https://journal.cricaas.com.cn/Jweb_mhxb/CN/home)本文網頁版。

附表1 1949―2022 年我國棉花播種面積和總產量

Table S1 China cotton area and production in 1949-2022.

猜你喜歡
棉纖維基因組棉花
關于“雙顯法”對木棉纖維和棉纖維定性鑒別的探討
羊毛/腈綸/棉纖維混紡產品定量化學分析方法探討
棉花是花嗎?
牛參考基因組中發現被忽視基因
棉花
ICAC: 全球棉纖維消耗增速放緩
棉纖維長度指標電算化程序設計
心中的“棉花糖”
基因組DNA甲基化及組蛋白甲基化
第三講 棉花肥害診斷及其防治
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合