我國科學家提出人工智能推動葡萄育種新方法
一種結合人工智能的育種技術,正在大幅度縮短傳統的葡萄育種時間。記者從中國農科院基因組所獲悉,該所周永鋒團隊提出利用人工智能進行葡萄育種的新方法,將大幅縮短育種週期,且預測準確度高達85%,相比傳統方法,育種效率可提高400%。該研究有望實現葡萄的精準育種設計,加速葡萄品種創新,並為其他多年生作物育種提供方法參考。相關研究成果發表在《自然·遺傳學(Nature Genetics)》上。
葡萄育種技術的數次跨越
葡萄是人類喜愛的水果,富含多種營養成分,且用途多樣。然而一粒葡萄種子從萌發到結出果實,需要3年。而想要培育出「令人滿意的」葡萄品種,需要的時間更久。
有研究表明,約1萬多年前,人們就開始嘗試「改造」葡萄,所謂「改造」,就是有選擇性地通過特定手段對原有葡萄性狀進行改良,這一過程又被稱為育種。
早期,人們發現野生葡萄後,會把品質優良的葡萄苗保存下來,通過一代又一代的繁育,只留下符合要求的後代,這種方法固然有用,但高度依賴自然種質資源,可改良程度有限,因此,被稱為育種1.0技術。後來,人們發現如果既想要葡萄「產量高」,也想要「甜度高」,可以把「產量高」的葡萄品種和「甜度高」的葡萄品種進行雜交,以培育出聚合了雙親優良性狀的雜交後代,這種方法滿足了有針對性選育葡萄品種的需求,但育種週期十分漫長,往往需要經過數十年的篩選,工作量極大,且由於葡萄高度雜合,雜交後,後代會出現性狀分離,雜交效果並不理想,該方法被稱為育種2.0技術。
進入二十一世紀以來,隨著分子生物學、數量遺傳學、生物信息學等學科的興起,育種家提出育種3.0技術,即分子育種,通過分子標記來「設計」性狀,並在此基礎上,提出育種4.0,即智能設計育種,基於海量基因組和遺傳數據進行分析預測,以提高育種效率和精確度,全基因組選擇育種便是其中最具代表性的一種。
首個葡萄泛基因組發佈
目前,葡萄育種仍停留在2.0階段。要想實現從2.0到4.0的跨越,首先需要足夠全面、準確的基因組數據。
為此,周永鋒團隊自2015年起,便開始聚焦葡萄的設計育種工作,並於2023年發佈首個葡萄端粒到端粒完整參考基因組圖譜,相關研究以封面文章發表在《園藝研究(Horticulture Research)》上。
然而,要實現精準「設計」,一個基因組數據遠遠不夠。在此基礎上,周永鋒團隊又陸續對包括野生種和栽培種在內的9個二倍體葡萄品種進行測序、組裝,得到18個端粒到端粒的單倍型基因組,並整合已有的基因組數據,構建了目前首個最全面、最準確的葡萄泛基因組,是單個參考基因組大小的近3倍。
為了進一步弄清楚葡萄基因與性狀之間的關聯,周永鋒團隊從近萬份葡萄品種中選取了400多份有代表性的葡萄品種,連續3年對包括果穗大小、漿果中代謝物含量、漿果大小和果皮顏色等在內的29個農藝性狀進行調查,構建了葡萄基因型圖譜和性狀圖譜。在此基礎上,周永鋒團隊利用數量遺傳學分析,鑒定到148個與農藝性狀顯著相關的位點,其中122個位點為首次發現。
研究發現,調控不同性狀的位點間存在關聯性,如可溶性固形物含量和漿果寬度相關位點鄰近。此外,不同葡萄群體(釀酒、鮮食、美洲鮮食雜種)之間存在顯著分化的區域,這些區域中存在與漿果顏色、果皮澀味、漿果形狀、果穗重量、果肉硬度、果實大小等多個性狀相關的遺傳位點,表明對農藝性狀歧化選擇促進了釀酒與鮮食葡萄的分化。
「AI」指導葡萄育種
全面、準確的基因組數據是精準「設計」育種的基礎,而如何深入挖掘這些數據來優化育種策略並指導育種?是智能育種必須回答的問題。
周永鋒團隊決定引入機器學習,通過構建預測模型,根據評分進行早期個體的預測和選擇,從而指導、優化育種策略。
在本研究中,研究人員將包含了性狀和基因型的數據劃分為三個子集:訓練集、驗證集和測試集。利用機器學習算法解析基因型與性狀數據間的複雜網絡關係,運用訓練數據集構建了首個葡萄全基因組選擇模型,研究進一步通過驗證集調整模型參數,對模型進行優化,最後測試數據集評估最終模型的性能。研究結果表明,結合了結構變異信息和機器學習模型的計算多基因評分預測準確率高達 85%。
通過這一模型,育種家可以快速準確地評估大量育種材料的遺傳潛力,從而更好地選擇優良品種。與雜交育種需要根據葡萄成熟後的表型作出判斷相比,全基因組選擇育種技術在葡萄幼苗時期就可以預測其成熟後的性狀,儘早剔除掉不符合條件的幼苗,減少了不必要的人工成本和投入,在葡萄育種應用中有很大的應用潛力,提高葡萄育種效率,加速葡萄新種質的創製,革新葡萄育種策略。
目前,相關研究成果已申請獲批國家發明專利6項,已申請國際專利1項。該研究獲得了國家重點研發計劃、國家優秀青年科學基金(海外)、國家自然科學基金、中央政府引導地方科技發展專項資金等項目的支持。
新京報記者 周懷宗
編輯 張樹婧 校對 王心