清華率先開源AI製藥智能體平台!生物科研進入Autopilot時代
LG 衡宇 發自 凹非寺
量子位 | 公眾號 QbitAI
AI智能體,確實到了爆發時刻。
不論是因為會炒出圈的Manus,還是後續一眾迅速跟進的OpenManus們……都在印證之前「AI智能體元年」的論斷——背後核心印證的是基礎大模型能力,已經到了足夠支撐上層建築的時候。
無獨有偶,在更加垂直專業的生命科學領域,AI智能體也迎來了標誌性事件。
就在最近,一個名為OpenBioMed的智能體平台低調亮相,率先對外開源開放。作為全球首個AI製藥領域的智能體開源平台,生命科學領域、製藥領域的研發人員人人可用。
生命科學研究,開始進入智能體驅動的新範式時代。
而驅動OpenBioMed智能體平台的,是清華智能產業研究院(AIR)和清華系專注於AI製藥的高精尖創業公司——水木分子。
以及雖然是新團隊,但核心人物卻是AI老面孔——大牛聶再清,他是水木分子的首席科學家,也是前天貓精靈背後的首席AI科學家,一個因為AI騷擾電話不堪其擾而打造「二哈」反騷擾AI的硬核程序員。

現在,他希望通過為製藥研發人員打造智能體,把AI之力,AI智能體之用,帶入每一個人都是受眾、每一個人都會受益的製藥產業中。
清華果然是清華,俠之大者果然為國為民。
恰如清華大學智能科學講席教授、清華大學AIR院長張亞勤院士所說,經過近四年的發展,清華大學AIR已彙聚了一批既懂科研又懂產業的人工智能領域學者:
如今,大模型與生成式AI技術正引領科學研究進入一個全新的人機協作新範式。生命科學智能體的出現與廣泛應用,將徹底改變科學發現的進程,大幅提升科研效率。
在這一新範式下,科學家的角色將更加聚焦於提出高質量的問題和任務描述,充分發揮人類的創造力、經驗和直覺。而智能體則通過高通量的文獻閱讀、海量實驗數據分析、算法迭代與任務執行,成為科學家最得力的助手。這種深度的人機協作,將推動科學研究進入一個全新的時代。

全球首個生命科學與製藥智能體開源平台
名叫OpenBioMed,架構如下:

最底層是AI製藥任務用到的科研數據和知識圖譜,中間則是專為生命科學和製藥打造的垂直大模型和該領域研發中涉及的核心任務算法,然後最上層集成了最新最強的基座大語言模型、智能體設計平台……
最後可以實現面向場景的定製化應用。
流程全自動,效率指數級提升。
OpenBioMed可以實現什麼?實現藥物設計項目、生命科學研究項目的Autopilot。
舉個例子,在過去,如果要發起一項藥物設計,即便是一份報告生成,可能也需要一位老法師(製藥專家),描述需求後讓一個團隊來配合執行。
但如果通過水木分子打造的AI智能體平台,完全可以Autopilot——老法師發出議題:針對攜帶KRAS G12C突變的局部晚期或轉移性非小細胞肺癌(NSCLC)患者,設計新型藥物分子。
接著AI智能體就會調動大模型展開推理,然後調用工具並形成工作流。

整個流程完全實現了完全自動化,大模型能力之下,整合了蛋白質結構分析、AI分子生成、計算篩選等技術和工具調用,形成從靶點分析到候選藥物確定的閉環設計報告。
顯而易見,按照Autopilot這樣的節奏,過往數週數月甚至數年的製藥設計週期,會被顯著加快。
而且容易忽略的是,由於基座大模型的加持,Autopilot對於老法師的門檻也在降低,即便無法實現「人人都是老法師」,但對於製藥領域的資源依賴降低也大有助益。
以及智能體可以7×24小時工作——未來製藥領域,可能會出現智能體在淩晨3點自主優化分子結構的場景。
需要說明的是,Autopilot是水木分子在製藥AI智能體上的最新成果,但不是全部路線。
作為智能雙引擎的另一個,基於旗下ChatDD——AI製藥領域的DeepSeek,水木分子還推出了Copilot模式,主打人類專家的「智能助手」。
在製藥領域,類似設計報告一樣的工作已經是非常成熟、標準化的任務,或者在某些特定領域中,智能體當前的能力已經足夠強大,可以達到人類專家的水平,Autopilot作為全流程自動化執行角色,可以大大縮短研發週期。
而在需要高度專業知識和經驗的任務中,把關者和決策者就必須是人類專家。
所以有了Copilot模式,就可以實現智能體與人類專家共同協作,智能體提供輔助支持,但最終決策權在人類專家手中。
具體如針對難成藥靶點3D構象生成、藥物篩選等任務,Autopilot來執行;AI靶點挖掘、驗證實驗方案優化,則由Copilot來實現。
Autopilot和Copilot被水木分子視為生物醫藥的智能雙引擎,二者配合之下,可以顯著縮短研發週期,降低系統誤差,從而實現藥物研發成本的下降。
當然,Autopilot和Copilot只是生命科學領域研發的最新進展,是行業智能體落地應用的表現。
在水木分子的設計中,完整的製藥研發新範式,由三部分構成——
通用大模型底座+行業大模型+行業智能體。
三位一體,缺一不可。

一個時代有一個時代的製藥研發範式
大模型為核心技術的製藥研發範式,被水木分子命名為ChatDD,Chat Drug Design——對話式藥物設計。
ChatDD將專家的認知和大模型的知識連接起來,通過人機協作對話式的方式進行藥物研發。這一模式不僅重新定義了藥物研發,還通過藥物研發AI智能體(Copilot / Autopilot)實現了更高的靈活性和效率。
而在此之前,連點成線回溯,人類的製藥研發大致歷經了三大階段:
第一代:TMDD——傳統手工藥物設計。
在遠古時代至19世紀末,藥物設計主要依賴傳統手工方法(TMDD,Traditional Manual Drug Design)。科學家通過手工合成、提取和篩選藥物,基於大量試驗和經驗進行探索。然而,這種方法存在低通量、缺乏系統性、耗時長和成本高等局限性。
第二代:CADD——計算機輔助藥物設計。
20世紀中葉,計算機技術的興起帶來了計算機輔助藥物設計(CADD,Computer-Aided Drug Design)。CADD通過計算機技術加速藥物發現和設計過程,具有高通量篩選和工具屬性強的特點,但仍依賴研究人員的經驗和直覺。
第三代:AIDD——人工智能藥物設計。
21世紀初,人工智能技術的發展推動了人工智能藥物設計(AIDD,AI Drug Design)。AIDD具有超高通量和流程化的特點,能夠從大規模高質量標註數據中挖掘藥物發現和設計的規律。然而,AIDD缺乏模型與專家的交互,且對大規模高質量標註數據的依賴成為瓶頸。
在第四代製藥範式中,科學家的角色將更加聚焦於提出高質量的問題和任務描述,充分發揮人類的創造力、經驗和直覺。
而智能體則通過高通量的文獻閱讀、海量實驗數據分析、算法迭代與任務執行,成為科學家最得力的助手。
按照水木分子的架構圖譜,最底層是「知識」,上面是大模型和工具,再往上就是智能體,通過調用大模型能力,完成立項決策、臨床前藥物發現、藥物開發、臨床試驗以及其他企業私有任務的部署。

但即便架構圖譜清晰,路徑明確,智能體要真正成為第四代製藥範式的主角,就需要解決最核心的行業痛點——打通兩大模態。
一個模態是文本模態,或者可以稱為自然語言模態,是通用大模型底座。
另一個模態則是生物模態,以生物數據為「語言」,是行業大模型基礎。
類比來說,兩個模態很像目前基礎大模型領域文本和圖像兩個模態,文生圖和圖生文如果要相互轉換,就需要「跨模態翻譯」,或者說對齊。
於是在生物數據大模型層面,水木分子打造了PharMolixFM。
它採用全原子建模的方式,把小分子、肽、蛋白質、DNA、RNA和離子等結構生物學研究對象的基本單元,實現了多尺度統一。
其次又把蛋白質摺疊、蛋白質序列與結構設計、大小分子對接、基於靶點的分子生成等多任務統一。
最終完成了全原子基礎大模型PharMolixFM。
該模型在多個關鍵任務上也實現了SOTA,包括分子對接任務、基於靶點結構的藥物設計任務等,都在對應的行業基準測試數據集,創造了性能新紀錄。
並且為了把分子結構翻譯為化學家可理解且機器可利用的文本,水木分子還打造了「圖生文」工具OCSU。
在通用大模型層面,基於最新DeepSeek-R1帶來的推理技術,站在行業巨人肩膀上,水木分子與清華AIR聯手推出了升級版的生物醫藥多模態開源基礎大模型BioMedGPT-R1,把強推理慢思考的範式,帶到了醫藥研發領域。
效果也非常顯著,不僅以67.1%的正確率通過了USMLE美國醫師資格考試,還在CheBI-20化學分子理解任務中,實現了15%的性能提升,進一步提高了由BioMedGPT-10B創造的最好成績。

而這一系列技術能力和工具,被封裝集成,然後在智能體平台OpenBioMed實現了All in One。
更難能可貴的是,作為全球首個該領域的智能體平台,OpenBioMed發佈即開源,或者說為開源而生——OpenBioMed站在了開源基礎大模型、開源生命科學成果的基礎上,然後也通過開源的方式,進一步把智能火炬傳遞更深入、更廣泛。
彙集眾智,賦予眾人。
在製藥或者更廣泛的生命科學研發領域,如果最好的資源能無差別覆蓋到更多研發者,或許會讓整個領域的推進更快更高效,一旦生物醫藥領域進入了湧現期,商業價值和社會價值,無疑會輻射到每一個人。
但依然有問題懸而未決,作為水木分子首席科學家,聶再清不只一次被問及這個問題——
會有AI獨立製藥的一天嗎?
「AI在製藥領域必須是助手」
「AI在製藥領域,必須是助手。」
這就是水木分子首席科學家聶再清的回答。實際上,作為科學家、AI領域的大牛,聶再清很少有如此絕對的論斷,但這一次他無比肯定,他補充說,從價值觀上就需要明確AI的「助手」設定。
這也是AI在深入生命科學等前沿領域之時,常被人討論的話題。
一方面,AI的能力正在不斷突破人類的極限,或許用不了多久,AI就會獨立發現新規律、新材料、新方法,人類已經不再是最聰明的那一個;另一方面,生命醫藥領域關係的是人類最基本最脆弱的身體健康……
有一派的觀點是需要最大化助力AI的發展,包括在「獨立」問題上,因為只有如此才能打造出真正強大的AI模型和系統,如果矽基正在覺醒,那碳基讓出統治權也是歷史發展的必然選擇。
但另一派不這樣認為,他們堅守的依然是「以人為本」的原則和信條,AI需要為人所用、幫助人向善,並且從一開始設計的時候就要確保其安全性。
很顯然,聶再清選擇站在以人為本這一邊。
他本科碩士都畢業於清華大學計算機系,博士師從美國人工智能學會前主席Subbarao Kambhampati教授,先後在微軟、阿里巴巴達摩院從事AI技術研發,是能力、資歷和影響力兼具的AI大牛,帶隊獲得過中國AI領域的最高獎項吳文俊人工智能科技進步獎。
2020年開始,他獲得張亞勤院士感召,加入清華大學AIR智能產業研究院,擔任清華大學國強教授、清華大學智能產業研究院首席研究員,並以水木分子首席科學家身份對外亮相。
但聶再清自己來說,他覺得自己始終在做的事情只有一件——
智能助手。
他說從微軟亞洲研究院開始,做的其實就是「助手」相關的工作,比爾蓋茨對智能助手「Personal Assistant」情有獨鍾,希望打造出一套人機交互里的完美助手。
後來去阿里巴巴達摩院,負責的天貓精靈,更是直接的AI助手,只不過交互方式更偏向於語音。
現在在清華大學智能產業研究院,「AI助手」也是其主軸,水木分子所做的事情,只不過是把「助手」放在了AI與生命科學兩大前沿的交叉創新地帶。
即便Agent智能體的定義業內還沒有清晰的共識,但聶再清看來,AI智能體就是AI助手的另一種表述——更時尚流行的表述而已。

水木分子為生物製藥領域的研發人員提供Autopilot和Copilot兩種智能體可選模式。
OpenBioMed是由清華AIR和水木分子共同推出的全球首個生命科學與製藥智能體開源平台,可以開源供業界開發生物醫藥智能體。
ChatDD是水木分子的商用平台和產品,通過Copilot助手和AutoPilot智能體兩種模式,支持多種醫藥行業和企業的藥研任務,場景包括例如: 立項、藥物設計和分析報告生成等。
二者放在一起,組成的就是生物醫藥的智能雙引擎,可以幫助更多科學家接近他們曾經在科幻里才能接近的嚮往——
之前有個統計說,讓科學家選擇想成為的超級英雄,最後被選擇最多的角色是:鐵甲奇俠。以為他以凡人之軀,借助科技之力比肩神明,打造AI助手發現了新元素、新材料、完成了時空穿越的模型驗證。
哪個科學家不想擁有一個賈維斯\星期五?
現在,水木分子邁出了引領全球的一步,率先開源OpenBioMed的智能體平台,希望生物醫藥研發人員,每一個都可以變成鐵甲奇俠。
GitHub開源倉庫:
https://github.com/PharMolix/OpenBioMed