南繁基地中,來了一群用大數據「育種」的年青人

十月深秋,長江南北的農田中,進入了秋收的最後階段,一層又一層秋風,把玉米、水稻、大豆吹得金黃一片。而遠在海南三亞,溫暖如春的海島上,也迎來了一年一度南下育種的人們。

海南是育種聖地,冬季溫暖的氣候,使需要世代選育的育種,在這裏可以增加一代。所以,每年冬天,都有來自全國各地的育種人,帶著他們正在選育的種子,播種在三亞的農田中,這一過程,被稱為「南繁加代」。

不過,與以往不同的是,如今的海南三亞,有一群年輕的育種人,他們沒有自己的農田和種子,甚至也不是農學專業出身。他們學習分子生物學或者現代信息技術,利用大數據、人工智能等,在數據之中,開闢自己的「田園」,在虛擬世界,育成「新的品種」。

「電腦上的育種人」

一台電腦,就是陳守坤的「試驗田」。

陳守坤。受訪者供圖陳守坤。受訪者供圖

幾年中,從打造自己的「大模型」開始,到蒐集數據、進行配組、測試千萬種不同的組合,再到找到育種者需要的作物基因組合,同樣的工作,不知道重覆了多少次。陳守坤也不記得,到底成功了多少種組合。

一粒種子的育成,從選擇父本和母本開始,然後進行一次又一次雜交,一代又一代種植和選擇。傳統時代的育種家們,需要六到八年的時間,才能選出一個新的品種。南繁加代的出現,使得育種家們每年能多種一季,將這個時間縮短了三分之一到一半。

陳守坤原本也是眾多南繁加代育種大軍中的一員。每年秋冬,他都會帶著自己培育的種子,一路南下,在三亞的土地種植。第二年春天,北方開始播種的時候,三亞的種子正好成熟,他又帶著種子北上。周而複始,像候鳥一樣,追逐著氣候的變化而遷徙。

直到轉做分子設計育種,陳守坤「失去」了自己的農田。

這是一種利用大數據、人工智能、機器學習等各種新技術的育種新模式。育種者們建立數字化的育種模型,將育種材料的基因數據導入模型,尋找自己需要的組合,進行大量匹配,再輸入各種環境參數,通過模型預測,就可以精準地組合成想要的品種。這個過程,通常在一週之內就能得出結果,最快的情況下,只要一天。

整個分子設計育種的過程,完全在電腦上完成,幾乎徹底離開了農田。

和陳守坤同在一個課題組的年輕學生們,有許多從來沒有下過地,甚至也沒有農學背景。今年研二的郭曉冰和馮曉軒,兩個人都是學習統計學的,在南繁基地,他們每天的工作就是操作電腦,和各種各樣的數據打交道。這些數據來自過去到現在許多的育種家們,漫長的育種史中,積累了大量的數據。而隨著分子生物學的進步,基因組測序每天都會增加更多的作物基因數據。他們在龐大的數據中,挖掘一切有價值的基因,然後根據需要,配成不同的組合,再通過大模型,預測每一種組合的效果。

農學生的數字莊園

考入中國農科院南繁院之前,統計學專業的郭曉冰,幾乎對農業完全不瞭解,也沒有想過,育種究竟該如何進行。馮曉軒同樣如此,他們考研的專業,叫作「生物信息學」,聽起來和農業、育種毫無關係。他們只知道,考上之後,未來三年的學習,都在海南三亞,一個四季都是夏天的地方。

中國農科院南繁院研二學生郭曉冰。受訪者供圖中國農科院南繁院研二學生郭曉冰。受訪者供圖

中國農科院南繁院建於5年前,位於南繁育種的核心地帶,海南三亞崖州灣科技城。這裏雲集了中國最多的農業科研機構,最多的育種科學家,還有最先進的育種設施。

對郭曉冰他們來說,這裏也有最豐富的育種數據。課題組的師生們,都住在南繁院的宿舍里,每天早晨,迎著海風和朝陽,一路騎車到實驗室,坐在電腦前,開始一天的學習和工作。

風雨、氣溫、土壤、微生物、病菌、水分……大自然中的一切,變成一組組數據,不斷交互作用,模擬出真實世界的農田。

在這個看不見的虛擬世界中,一粒種子落入「土壤」,生根發芽,經歷風雨,開花結果,重新長出新的種子。

當外界急劇變化的氣候、頻發的極端天氣和高發的病蟲害,不斷影響著人們的糧食時,這間實驗室的電腦中,也在不斷增加新的數據。

乾旱高溫、極速降溫、病蟲害高發……農民需要可以抵抗各種逆境的作物新品種,而傳統育種漫長的時間,很難完全應對快速變化的農業環境。作為最尖端的育種方式,分子設計育種可以用最快的方式,進行不同目標的育種預測,通過龐大的作物基因數據庫以及各種環境數據,一天到一週之內,就可以組合出相應的品種,並進行預測。

遍佈攝像頭的農田

「我們是把袁隆平院士這樣的育種家的工作,從田間搬到了電腦上。」中國農科院南繁院分子設計育種課題組博士趙盈說。

中國農科院南繁院博士趙盈。受訪者供圖中國農科院南繁院博士趙盈。受訪者供圖

從許多年前開始,育種就不再只是農業科學家的領域。中國農科院副院長孫坦介紹,在國外,分子設計育種已經發展多年,國際上知名的種業企業,耗費數十億美元,打造自己的分子設計育種平台,育成了大量新品種。我國分子育種起步較晚,但發展很快,尤其在技術應用上,已經非常廣泛,不論是玉米、小麥、水稻等大田糧食作物,還是蔬菜水果,都在利用分子設計育種技術。

趙盈正在進行一項大豆育種的分子設計和預測,大豆是我國最大的油料和飼料作物,也是我國進口最多的作物,提升我國大豆的產量,是關係糧食安全的重要部分,「目前大豆育種最大的目標,首先是單產提升。我國耕地有限,很難通過大規模擴大面積的方式提高大豆產量,提高單產是唯一的途徑。同時,因為氣候變化等各種影響,未來的大豆生產面臨著重重威脅,亟須培育高產且抗逆的大豆品種。」

電腦上的設計和預測,在整個分子設計育種中,是最關鍵的部分,但並不是全部過程。在預測完成之後,還要在田間進行驗證,收集和觀察配組之後的各種表型數據。

中國農科院南繁院表型大樓。受訪者供圖中國農科院南繁院表型大樓。受訪者供圖

在同一座大樓中,還有另外一個表型鑒定的課題組。所謂表型,即生物所有可被觀察和鑒定的特徵,比如人的身高、血型,植物的株高、顏色等。在育種中,一些典型的表型,必須在作物真實的生長中觀察和收集。比如株高、節數、節間距等,這些特徵直接關繫著作物的生長能力、抗倒伏能力等。再如穗數、穗粒數、千粒重等,直接關繫著產量。

在過去,像袁隆平這樣的育種家們,需要年複一年,長時間蹲在田里,用肉眼一株株觀察,用筆一個個記錄。而在現代智慧育種中,遍佈田間的傳感器和攝像頭,代替了人的眼睛和手中的筆,進行表型鑒定的育種者們,同樣在辦公室里,用電腦或監視器,觀察田間的情況,攝像頭會把各種作物的各種表型數據,包括環境的變化蒐集起來,傳輸到後方,育種者們則通過電腦進行彙總、分析、處理。

在趙盈工作的大樓旁邊,就有一處我國目前最專業、技術含量最高的田間「高通量植物表型平台」。這是一座5.7米高、21米寬的鋼架,橫跨在金色的稻田中,彷彿一個小型的「龍門吊」,稻田遍設軌道,鋼架搭載十多種監測儀器,在田間自由移動,監測植物從播種到收穫全週期的表型數據。

中國農科院南繁院基地中的「高通量植物表型平台」。受訪者供圖中國農科院南繁院基地中的「高通量植物表型平台」。受訪者供圖

智慧育種的新時代

育種的新模式,遠超馮曉軒想像。在進入中國農科院南繁院之前,她只是一個剛剛大學畢業、從未下過田的學生。學習統計學的她,要從零開始,學習育種中的一切知識。儘管她的工作不需要農學背景也可以進行,但她覺得,農學也同樣很重要。

中國農科院南繁院研二學生馮曉軒。受訪者供圖中國農科院南繁院研二學生馮曉軒。受訪者供圖

「我們是從零開始做分子設計與育種的,需要自己設計模型,蒐集數據,進行模擬預測。」馮曉軒說,「所以學習農學知識也是有必要的。」

雖然同樣沒下過地,但趙盈學過農學,她本科學農學,碩士學生物,也曾經在實驗室里做過農作物的分子實驗。

陳守坤自己找了一小塊地,延續著以前種地的習慣。雖然新的工作並不需要,但他覺得,有一塊自己的地,可以隨時驗證電腦上的設計結果,同時也保留了一點點過去種地的記憶,「習慣了,總想著有一小塊地更好。」

不論是從傳統育種轉入分子設計育種,還是剛剛進入育種領域的年青人,他們其實都走在整個世界的最前列。

「我國分子育種的理論,在全球也處於領先地位。」孫坦說。

中國農科院副院長孫坦。受訪者供圖中國農科院副院長孫坦。受訪者供圖

從很多年前開始,各種新技術就開始運用到育種,從大數據到雷達,從攝像頭到計算機,越來越多領域的研究者們,加入了育種的大軍。「最開始當然需要磨合,一個計算機專業的博士,和一個傳統育種的博士,兩個人同在一個課題組,可能連對話都難。但慢慢地,不同領域的科學技術,逐漸融合成一體,變成了現代化的智慧育種。」孫坦說,「和所有科學一樣,農業科學的發展,同樣越來越超出普通人可感知的世界,向著超微觀和超宏觀兩極發展。如超微觀的基因、分子,需要特定的儀器,才能被人們所觀察和干預。超宏觀的層面,整個地球的生態環境、土壤、植保、栽培,還有計算機、傳感器、衛星遙感等技術,都已經融合到了育種之中。所以,今天的育種,和以往的育種已經完全不同,超出了普通人的認知。」

領先的理論水平,並不意味著所有的科研領域都領先。孫坦介紹,我國在基礎性研究、數據積累等領域,仍然相對落後,「智慧育種是一個很龐大的系統,不亞於芯片設計和製造,事實上,育種本身也是農業的芯片。它是一個漫長且龐大的工程,舉例來說,基因的精準鑒定,需要龐大的人力物力和財力,軟件研發,需要很多年青人參與和創新,數據累積,需要漫長的時間和龐大的人力物力,英國的表型數據、環境數據有百年的積累,我們還差得很遠。」

對於陳守坤和他的同事、同學們來說,眾多的困難,其實也正蘊含著無限的未來。畢竟,他們走在一個全新的世界里,而且是這個世界中的先行者。

新京報記者 周懷宗

編輯 張樹婧 校對 張彥君