繪圖:黃怡可
泛基因組(Pan-genome)是一個(gè)物種內(nèi)所有基因組信息的總和,它比單一參考基因組涵蓋了更多的遺傳多樣性。
近年來(lái),科學(xué)家已經(jīng)獲得了多個(gè)作物的泛基因組。如何利用這些更為全面的基因組信息培育下一代良種,成為科學(xué)家們關(guān)心的課題。
北京時(shí)間2022年6月8日,《自然》在線發(fā)表了中國(guó)農(nóng)業(yè)科學(xué)院深圳農(nóng)業(yè)基因組研究所(以下稱“基因組所”)黃三文團(tuán)隊(duì)有關(guān)泛基因組的兩項(xiàng)研究成果。
一篇論文中,他們首次獲得了番茄的圖泛基因組,并借此找回了番茄育種中“丟失的遺傳力”,為解析生物復(fù)雜性狀的遺傳機(jī)制提供了新思路。論文評(píng)審專家認(rèn)為,“這項(xiàng)工作是對(duì)圖泛基因組概念最全面的分析。” “圖泛基因組將可能成為基因組分析和作物基因組育種的標(biāo)準(zhǔn),在這個(gè)意義上,這篇論文是奠基性的(foundational)”。
另一篇論文中,他們首次解析了二倍體馬鈴薯的泛基因組,研究了茄科茄屬(Genus Solanum)的物種進(jìn)化,破解了馬鈴薯如何結(jié)薯的分子機(jī)制,并為雜交馬鈴薯育種改良提供了豐富的遺傳變異信息?!蹲匀弧吠诎l(fā)表的觀點(diǎn)性文章指出,組裝數(shù)量如此之多的異交和高雜合馬鈴薯高質(zhì)量基因組,是一項(xiàng)非凡的成就(remarkable feat)。泛基因組全面鑒定了參與重要生物學(xué)過(guò)程的基因,能夠賦能馬鈴薯育種。
意味著更準(zhǔn)確更詳盡
“在一個(gè)物種內(nèi),有些基因是某些個(gè)體所特有的。比如任意兩個(gè)番茄所含有的基因是不完全相同的,基因不同可能導(dǎo)致口感不同。” 論文通訊作者黃三文在接受《中國(guó)科學(xué)報(bào)》采訪時(shí)解釋道,番茄有很多品種,如大果番茄、櫻桃番茄和醋栗番茄等,如果只是用大果番茄的參考基因組進(jìn)行研究,那其中不會(huì)包含櫻桃番茄和醋栗番茄特有的基因組信息。
黃三文說(shuō),把一個(gè)物種所有的基因都找到,并按照順序排列,就形成了泛基因組。而圖泛基因組 (graph pangenome)是借助數(shù)學(xué)和計(jì)算機(jī)中被稱為圖(graph)的數(shù)據(jù)結(jié)構(gòu)來(lái)展示一個(gè)物種所有的基因排列和結(jié)構(gòu)。
論文第一作者、基因組所副研究員周姚告訴《中國(guó)科學(xué)報(bào)》,由于泛基因組比單一參考基因組更加準(zhǔn)確和詳盡地代表了整個(gè)物種的遺傳多樣性,而詳盡和準(zhǔn)確的變異對(duì)下游的遺傳學(xué)分析提供了完美的基礎(chǔ),所以借助泛基因組做研究不容易漏掉重要的基因和信息。
“此前有很多作物都獲得了泛基因組圖譜,如水稻、玉米、小麥、大麥、棉花、番茄、油菜等。這次我們首次獲得了番茄的圖泛基因組,并第一次完成了二倍體馬鈴薯的泛基因組。”黃三文說(shuō)。
在關(guān)于番茄圖泛基因組的研究中應(yīng)用了“圖”這個(gè)概念。“圖是數(shù)學(xué)和計(jì)算機(jī)科學(xué)中一種常見的數(shù)據(jù)結(jié)構(gòu)。已有研究發(fā)現(xiàn),利用該數(shù)據(jù)結(jié)構(gòu)整合泛基因組,可以減少單一基因組帶來(lái)的參考基因組偏差問(wèn)題。”周姚說(shuō),為了構(gòu)建一個(gè)準(zhǔn)確的圖泛基因組,他們首先利用高準(zhǔn)確率的三代測(cè)序技術(shù)重新組裝了骨架基因組,其組裝質(zhì)量在完整性、連續(xù)性和準(zhǔn)確性等指標(biāo)上均優(yōu)于之前的版本。
隨后,他們選取了31份具有代表性的番茄材料進(jìn)行了組裝,并鑒定出相關(guān)的遺傳變異;在整合已公布的結(jié)構(gòu)變異和短片段測(cè)序信息后,最終構(gòu)建了來(lái)自838個(gè)番茄基因組的圖泛基因組。
法國(guó)農(nóng)業(yè)科學(xué)研究院研究員Mathilde Causse認(rèn)為,圖泛基因組資源對(duì)番茄遺傳和基因組研究非常重要,促進(jìn)了后續(xù)的基因定位。這篇文章將成為番茄研究領(lǐng)域里的基石。
二倍體馬鈴薯泛基因組論文的第一作者、基因組所博士生唐蝶告訴《中國(guó)科學(xué)報(bào)》,為了獲得高質(zhì)量的二倍體馬鈴薯泛基因組,他們挑選了地方栽培種、野生種、近緣野生種等44份具有代表性的二倍體馬鈴薯種質(zhì)進(jìn)行了重測(cè)序和基因注釋,最終完成了第一個(gè)二倍體馬鈴薯泛基因組。
審稿人評(píng)價(jià)說(shuō),馬鈴薯泛基因組的構(gòu)建和分析結(jié)果令人印象深刻。這項(xiàng)研究展示了基于廣泛選材的“馬鈴薯組”和“類馬鈴薯組”泛基因組學(xué)的力量,能為其他作物泛基因組研究提供參考方法。
好吃的番茄:找回“丟失的遺傳力”
黃三文告訴記者,作物的性狀由遺傳因素和環(huán)境因素的共同作用而決定??茖W(xué)家用“遺傳力”這個(gè)概念表示一種作物的性狀受遺傳調(diào)控的比例。遺傳力越高,說(shuō)明性狀的決定過(guò)程中遺傳因素占比越大,環(huán)境因素占比越小。
在未來(lái)的作物育種中,基因組選擇技術(shù)將被廣泛應(yīng)用。當(dāng)番茄還是幼苗的時(shí)候,就對(duì)它的基因組進(jìn)行測(cè)序,以此來(lái)預(yù)測(cè)它是否抗病、產(chǎn)量如何、好吃不好吃等。
然而,現(xiàn)在的預(yù)測(cè)還不是很準(zhǔn)。“這是因?yàn)檎{(diào)控上述復(fù)雜性狀的基因有很多,有些基因的作用明顯,其遺傳力容易被檢測(cè)到;而另一些基因的作用比較微弱,這些基因難于檢測(cè)到的遺傳力被稱為‘丟失的遺傳力’。”黃三文說(shuō),“遺傳力丟失”是一個(gè)經(jīng)典的數(shù)量遺傳學(xué)問(wèn)題,即通過(guò)遺傳標(biāo)記估計(jì)的遺傳力以及通過(guò)全基因組關(guān)聯(lián)分析(GWAS)發(fā)現(xiàn)的所有相關(guān)基因所貢獻(xiàn)的遺傳力總和均低于實(shí)際的遺傳力。
“找回這些丟失的遺傳力,將有助于理解復(fù)雜性狀的遺傳機(jī)制。”周姚說(shuō),遺傳力是研究基因型與表型相關(guān)性的基礎(chǔ),如何更準(zhǔn)確和系統(tǒng)地找到更多的決定表型的遺傳變異是作物育種中的基礎(chǔ)問(wèn)題。無(wú)論是分子標(biāo)記輔助育種還是分子設(shè)計(jì)精準(zhǔn)育種,都需要大量的已知功能的遺傳變異來(lái)指導(dǎo)品種選擇或改良。
受訪者供圖
“目前認(rèn)為遺傳力丟失的主要原因有以下幾個(gè):遺傳標(biāo)記與真實(shí)影響表型的基因之間存在著不完全連鎖,導(dǎo)致模型估計(jì)產(chǎn)生偏差;稀有等位基因的貢獻(xiàn)不易被察覺(jué);某個(gè)基因的不同突變表現(xiàn)出相同的表型使得遺傳分析遺漏;基因與基因的互作和基因與環(huán)境的互作增加了分析的復(fù)雜性。傳統(tǒng)短片段測(cè)序可對(duì)長(zhǎng)度較小的變異進(jìn)行鑒定,但對(duì)復(fù)雜結(jié)構(gòu)變異的檢測(cè)能力較差,無(wú)法全面評(píng)估復(fù)雜結(jié)構(gòu)變異對(duì)遺傳力的具體影響。”論文共同第一作者、基因組所張智洋說(shuō)。
此前,在人類中遺傳力丟失問(wèn)題研究最為豐富。但受限于技術(shù),這些研究主要關(guān)注單核苷酸變異與表型之間的聯(lián)系,而忽視了更多的隱藏的大結(jié)構(gòu)變異對(duì)表型的影響。
由于番茄的遺傳資源豐富,其馴化歷史、表達(dá)調(diào)控以及風(fēng)味代謝方面都已有了相關(guān)的研究基礎(chǔ),為進(jìn)一步研究遺傳力丟失奠定了基礎(chǔ)。
論文共同第一作者、基因組所鮑志貴說(shuō),通過(guò)構(gòu)建番茄圖泛基因組,他們的研究準(zhǔn)確鑒定了番茄基因組中的結(jié)構(gòu)變異,并發(fā)現(xiàn)大的結(jié)構(gòu)變異是遺傳力丟失的關(guān)鍵原因之一,為遺傳力丟失問(wèn)題提供了新的解決思路。
進(jìn)一步研究發(fā)現(xiàn),與利用單一參考基因組相比,基于圖泛基因組的遺傳變異可將估計(jì)的遺傳力提高24%,展現(xiàn)了圖泛基因組在找回“丟失的遺傳力”上的重要作用。
以影響番茄產(chǎn)量和糖度的重要代謝物可溶性固形物為例,采用上述分析方法,該團(tuán)隊(duì)共鑒定出2個(gè)潛在的與可溶性固形物含量高度相關(guān)的結(jié)構(gòu)變異,可以用于未來(lái)的分子標(biāo)記輔助選擇。通過(guò)對(duì)影響番茄風(fēng)味的33種代謝物進(jìn)行分析發(fā)現(xiàn),利用全部的結(jié)構(gòu)變異作為分子標(biāo)記進(jìn)行基因組選擇的效果最佳。
因此,他們進(jìn)一步精心構(gòu)建了一個(gè)包含近2.1萬(wàn)個(gè)結(jié)構(gòu)變異的數(shù)據(jù)集。如果利用該數(shù)據(jù)集設(shè)計(jì)育種芯片,評(píng)估基因組選擇的準(zhǔn)確率可能超過(guò)利用全部的單核苷酸多態(tài)性。
西湖大學(xué)教授楊劍長(zhǎng)期從事數(shù)量遺傳學(xué)研究。他在接受《中國(guó)科學(xué)報(bào)》采訪時(shí)說(shuō),遺傳力丟失的問(wèn)題不只局限在番茄里,它是各個(gè)物種,包括人類中廣泛存在的數(shù)量遺傳學(xué)問(wèn)題。這篇論文“很好地利用番茄這個(gè)作物回答了這個(gè)廣義的普遍性問(wèn)題”。
該團(tuán)隊(duì)通過(guò)圖泛基因組鑒定了大量結(jié)構(gòu)變異后,提出了一個(gè)重要問(wèn)題:結(jié)構(gòu)變異是否能解決遺傳力丟失的問(wèn)題?結(jié)果是肯定的。“結(jié)構(gòu)變異的神秘面紗被揭開了,它們才是遺傳力這輛‘汽車’的‘司機(jī)’,發(fā)揮著主導(dǎo)作用,而簡(jiǎn)單變異可以說(shuō)是‘乘客’。”楊劍說(shuō),這篇論文將讓大家更加重視對(duì)結(jié)構(gòu)變異的研究。
培育“優(yōu)薯”:破解結(jié)薯密碼
作為世界第三大主糧作物,傳統(tǒng)馬鈴薯栽培以四倍體為主,依靠薯塊無(wú)性繁殖。然而,四倍體遺傳分析復(fù)雜,育種不可積累;薯塊運(yùn)輸成本高,易感染病蟲害。
為徹底打破產(chǎn)業(yè)發(fā)展中的障礙,2017年,在農(nóng)業(yè)農(nóng)村部、深圳市和中國(guó)農(nóng)科院的支持下,黃三文聯(lián)合國(guó)內(nèi)外優(yōu)勢(shì)單位發(fā)起了“優(yōu)薯計(jì)劃”,旨在用基因組學(xué)和合成生物學(xué)指導(dǎo)馬鈴薯產(chǎn)業(yè)的綠色革命,即用二倍體替代四倍體,用雜交種子替代薯塊,對(duì)馬鈴薯育種和繁殖方式進(jìn)行顛覆性創(chuàng)新。
“馬鈴薯種質(zhì)資源豐富,自然界中70%的馬鈴薯是二倍體,其中大部分是野生材料,充分利用這些資源中的優(yōu)異性狀,有利于加快馬鈴薯的遺傳改良。此外,馬鈴薯無(wú)性繁殖方式對(duì)馬鈴薯基因組的影響以及薯塊形成的遺傳演化機(jī)制還沒(méi)有被充分解析。”黃三文說(shuō),目前已發(fā)表馬鈴薯的基因組序列只捕獲馬鈴薯有限的生物多樣性,不足以全面了解馬鈴薯基因組以用于育種指導(dǎo)。
約70%的馬鈴薯是二倍體。受訪者供圖
唐蝶介紹,在構(gòu)建二倍體馬鈴薯泛基因組的同時(shí),他們還挑選了馬鈴薯姊妹類群——類馬鈴薯組(Section Etuberosum)的兩個(gè)種進(jìn)行基因組的組裝和注釋。同番茄一樣,Etuberosum也是馬鈴薯的近緣物種,其植株外型和馬鈴薯非常相似,也會(huì)形成地下分枝,不同的是Etuberosum不會(huì)產(chǎn)生薯塊。以往的分類學(xué)研究關(guān)于馬鈴薯、番茄和Etuberosum的系統(tǒng)發(fā)生關(guān)系一直存在爭(zhēng)議。
“高質(zhì)量的基因組為解析馬鈴薯及近源物種的系統(tǒng)發(fā)生關(guān)系提供了契機(jī)。”唐蝶說(shuō),他們發(fā)現(xiàn)馬鈴薯與近源物種番茄、Etuberosum之間,以及馬鈴薯類群內(nèi)部,都存在廣泛的種間雜交和不完全譜系分選現(xiàn)象,說(shuō)明馬鈴薯類群經(jīng)歷了復(fù)雜的演化歷史。
利用高質(zhì)量的泛基因組,他們發(fā)現(xiàn)相比于番茄和Etuberosum,馬鈴薯的抗病基因拷貝數(shù)明顯擴(kuò)張。“我們推測(cè),這是由于馬鈴薯依賴于生長(zhǎng)在土壤中的薯塊進(jìn)行無(wú)性繁殖,其相比于種子更容易受到病原菌的侵染。馬鈴薯的無(wú)性繁殖可能促使了抗病基因數(shù)量的擴(kuò)張以應(yīng)對(duì)病原菌對(duì)薯塊的侵染。”論文共同第一作者、基因組所博士生李宏博說(shuō)。
馬鈴薯類群、番茄類群和Etuberosum類群是進(jìn)化距離很近的近緣物種,但只有馬鈴薯演化出了薯塊這一重要的生物學(xué)性狀。論文共同第一作者、基因組所博士后賈玉鑫說(shuō),Etuberosum和馬鈴薯都會(huì)產(chǎn)生地下分枝,但Etuberosum的地下分枝向上生長(zhǎng)發(fā)育成新的植株;而馬鈴薯的匍匐莖向下生長(zhǎng),并在頂端膨大形成薯塊;番茄不含有地下分枝,也不形成薯塊。“因此我們推測(cè)Etuberosum是薯塊形成的過(guò)渡態(tài)。”
通過(guò)對(duì)上述三者的多組學(xué)比較分析,該團(tuán)隊(duì)鑒定到一個(gè)可能在薯塊發(fā)育過(guò)程中發(fā)揮關(guān)鍵作用的TCP轉(zhuǎn)錄因子。
進(jìn)一步地,他們?cè)诙扼w馬鈴薯中創(chuàng)制了上述轉(zhuǎn)錄因子的基因純合缺失突變體。表型觀察發(fā)現(xiàn),相比于野生型,突變體匍匐莖頂端無(wú)法正常膨大形成薯塊,轉(zhuǎn)而發(fā)育成了側(cè)枝。“這證明該基因在薯塊發(fā)育的起始時(shí)期發(fā)揮關(guān)鍵作用。”論文共同第一作者、中國(guó)農(nóng)科院蔬菜花卉所助理研究員張金喆說(shuō)。該基因被命名為薯塊身份基因。
馬鈴薯和不結(jié)薯種都存在地下分枝,前者發(fā)育成匍匐莖并在頂端膨大形成薯塊,后者向上生長(zhǎng)發(fā)育成新的植株。受訪者供圖
進(jìn)一步發(fā)現(xiàn)栽培馬鈴薯內(nèi)部共線性缺失現(xiàn)象,這說(shuō)明栽培馬鈴薯材料中廣泛的遺傳多樣性。在對(duì)馬鈴薯進(jìn)行雜交育種時(shí),必須謹(jǐn)慎考慮這些共線性缺失片段,以及可能導(dǎo)致共線性缺失的大結(jié)構(gòu)變異帶來(lái)的連鎖累贅等影響。他們發(fā)現(xiàn),馬鈴薯基因組中存在很多大的結(jié)構(gòu)變異,而馬鈴薯的無(wú)性繁殖方式很難將這些結(jié)構(gòu)變異清除出去的。
其中,馬鈴薯3號(hào)染色體的倒位事件與薯塊中控制類胡蘿卜素積累的基因緊密連鎖,在自交后代中該倒位區(qū)域重組率顯著下降。這意味著在育種中選擇黃肉薯塊這個(gè)重要的營(yíng)養(yǎng)性狀,就選擇了該倒位區(qū)間的所有基因,這可能帶來(lái)嚴(yán)重的連鎖累贅現(xiàn)象。
“水稻、玉米等作物是二倍體,用種子來(lái)繁殖,育種改良相對(duì)方便。我們平時(shí)吃到的馬鈴薯都是四倍體,塊莖繁殖,遺傳改良一直很慢。”上海師范大學(xué)生命科學(xué)學(xué)院教授、水稻基因組專家黃學(xué)輝告訴《中國(guó)科學(xué)報(bào)》,2021年《細(xì)胞》發(fā)表的黃三文團(tuán)隊(duì)培育的第一代高純合的二倍體馬鈴薯自交系和雜交馬鈴薯品系“優(yōu)薯1號(hào)”改變了這種情況。
作為優(yōu)薯計(jì)劃的后續(xù),充分挖掘二倍體馬鈴薯中的等位變異將是進(jìn)一步育種改良的關(guān)鍵。該團(tuán)隊(duì)在高質(zhì)量馬鈴薯泛基因組基礎(chǔ)上,獲得了一些重要的基因功能線索,尤其是成功鑒定了馬鈴薯結(jié)薯的核心調(diào)控基因,發(fā)現(xiàn)其在薯塊發(fā)育過(guò)程中發(fā)揮關(guān)鍵作用。
“優(yōu)良的變異要怎樣聚合到新品種中?如何優(yōu)中選優(yōu)?這份成果獲得的大量遺傳多樣性信息將對(duì)未來(lái)二倍體馬鈴薯改良產(chǎn)生重要作用。”黃學(xué)輝說(shuō)。
瑞典斯德哥爾摩大學(xué)生態(tài)、環(huán)境與植物科學(xué)系Juanita Gutiérrez-Valencia和Tanja Slotte在《自然》同期發(fā)表的觀點(diǎn)性文章中說(shuō),該研究大大擴(kuò)展了馬鈴薯的基因組資源,利用泛基因組鑒定的遺傳變異無(wú)疑會(huì)推進(jìn)其基礎(chǔ)和應(yīng)用研究。
“了解與薯塊形成相關(guān)的基因可以幫助育種家選育高產(chǎn)馬鈴薯品種,而對(duì)抗病基因的全面分析使得從野生種中定向引入抗性基因成為可能,從而提高馬鈴薯的抗病性。”文中寫道,該研究提供的組學(xué)信息資源將助力基因組學(xué)輔助育種。
該研究將為馬鈴薯研究供豐富的基因組大數(shù)據(jù)支持,加深對(duì)馬鈴薯重要生物學(xué)性狀的理解,有力地推動(dòng)雜交馬鈴薯育種,并加速馬鈴薯作為重要主糧作物的育種進(jìn)程。
相關(guān)論文信息:
https://doi.org/10.1038/s41586-022-04822-x
https: //doi.org/10.1038/s41586-022-04808-9
https://doi.org/10.1038/d41586-022-01419-2