科學家開發深度學習方法DynamicBind,實現對復合物的動態結構預測
「在學校里做科研時,我們會更喜歡在一個點上深入拓展,最終達到開闢一個新領域的目標。
而我對自己的研究有更多期待,既希望在一個創新點上深入並轉化,又希望能夠啟發未來 AI 在藥物發現領域的全流程覆蓋,使得能逐漸通過 AI 大規模、可持續地產出高價值藥物。」
上海交通大學助理教授、2024 亞洲青年科學家基金項目-生命科學研究員鄭雙佳在近日舉辦的 2024 未來科學大獎週期間表示。
傳統的藥物研發往往漫長且昂貴。例如,開發一款藥物,通常需要 10 年以上的時間,平均投入 26 億美金。
AI 尤其是生成式 AI 的出現,已經開始改變這一過程。目前,它幾乎全鏈條地覆蓋到傳統製藥的每一個環節中,包括靶點發現、臨床前藥物研發和臨床開發等。
不管是從為疾病定位有價值的生物靶點,還是從已知的化學空間里找到一個不錯的起始分子,AI 都能在其中發揮有效作用。
利用生成式 AI 加速藥物研發的進程,也正是鄭雙佳近年來專注的研究領域。
在該領域,他曾取得諸多優秀成果,比如,為實現動態復合物結構預測而設計的幾何深度生成模型 DynamicBind[1],針對難成藥靶點的生成式智能藥物設計算法 [2],有效融合原子結構和分子網絡尺度之間多尺度信息的學習框架 MUSE[3] 等。
憑藉這些貢獻,他成功獲得 2024 亞洲青年科學家基金項目資助,成為生命科學領域的獲獎人。
開發深度學習方法 DynamicBind,實現對動態復合物的結構預測
GoogleDeepMind 團隊推出的 AlphaFold 系列模型,讓 AI 在實現靜態蛋白質結構預測方面取得顯著進展。
然而,由於其不具備預測蛋白質結構動態變化的能力,因此無法助力該領域的研究人員,更好地理解蛋白質功能和推進藥物發現。
基於此,鄭雙佳帶領團隊開發深度學習方法 DynamicBind,能夠在 AlphaFold 完成蛋白質靜態結構預測的基礎上,進行復合物結構的動態結合模式預測。
另外,值得一提的是,與只能預測蛋白質單體結構的 AlphaFold2 相比,DynamicBind 能夠同時預測小分子和蛋白的結合模式和親和力強弱。
「從這一點來看,DynamicBind 實現了從結構到功能的轉變。也就是說,完成從僅僅進行結構預測,到能夠有一定落地場景的藥物發現的轉變。」鄭雙佳表示。
與此同時,對於該成果而言,該團隊也引入了一些 Dynamic 模塊。
這是結構生物學家以及該領域許多研究人員都非常關注的模塊,通常指的是動態建模或動態分析的組件或工具,旨在研究和描述生物分子(如蛋白質、核酸等)在時間和空間上的動態行為。
在研發藥物的過程中,研究人員可能會看到一個蛋白結構出現多個口袋的情況,其中有些口袋在平常是不打開的,直到某些特定場景才會打開。
通過 AlphaFold 預測的結構,往往捕捉不到這種被稱為隱蔽口袋的東西,但由於引入了 Dynamic 模塊,DynamicBind 能夠很好地捕捉到這種隱蔽口袋是如何出現的,以及它們和小分子是怎麼結合的。
「換言之,可以幫助我們找到特異性更好的藥物,實現對症下藥的目標。」鄭雙佳表示。
他指出,課題組很早就將 DynamicBind 以及系列工作投入到實際應用中。
「我們當時做了一個比較暴力的事情,就是選了 15 至 20 個高價值靶點,包括一些難成藥靶點,用 AI 的方法對每個靶點進行層次化的藥物篩選,而後每個靶點都會送測 100 至 200 個分子去進行濕實驗驗證。」鄭雙佳說。
從中,他們也看到令人驚喜的效果。
那就是,在這 15 至 20 個靶點中,有 85% 的靶點都能找到很不錯的苗頭化合物。
同時,在整個過程中獲得的篩選成功率,比用傳統的計算化學方法以及高通量實驗方法獲得的成功率要高許多。
「我們每送測 100 至 200 個分子,按照生物學家製定的活性標準,平均在這近二十個靶點上的篩選命中率能達到 20%。」鄭雙佳表示。
如上所說,除了這個成果,他也系統地開發了一套針對難成藥靶點的生成式智能藥物設計算法,用於蛋白水解靶向嵌合體(PROTAC,Proteolysis-Targeting Chimera)的設計。
需要說明的是,PROTAC 作為一種創新的藥物設計策略,擁有特異性地降解目標蛋白質的功能。
它的設計難點在於,讓分子在擁有降解活性的同時,也有良好的選擇性和成藥性。也就是降低毒副作用且提高生物利用度。
為攻克這一問題,該團隊通過生成式 AI 構建了一個化學大模型,然後配合強化學習的方式,去優化 PROTAC 中間的連接子。這就是上述算法背後的原理。
基於該算法,研究人員設計了 6 個分子,並進行實驗驗證。結果顯示,其中 3 個都表現出很好的降解活性,且在成藥性上得到明顯提高。
「諾獎進入‘AI 時代’,未來會有更多 AI 學者獲得該獎項」
2024 年,盧保物理學和化學獎接連頒發給 AI 研究者。這在很多人看來,是諾獎進入「AI 時代」的表現。
那麼,鄭雙佳是如何看待的呢?
首先,他表示很開心,因為看到 AI 獲得了更多關注。
其次,他認為,獲得化學諾獎的大衛·貝克(David Baker)在蛋白設計領域做出了先驅式的工作,卻還未真正開發出一款非常優秀的藥物產品進入產業界。換句話說,他的研究讓人看到希望,但還未到達終點。
「然而,不管怎樣,諾獎確實是進入到 AI 時代了,未來我相信會有更多國內外的 AI 學者獲得諾獎。」鄭雙佳表示。
回到生命科學領域,很多人都覺得,以 AlphaFold 為代表的 AI 技術,給結構生物學家帶來了衝擊。
對此,鄭雙佳認為,不僅僅只有衝擊,而是賦能和革新了結構生物學。
「但這並不意味著結構生物學會消失,或者結構生物學家會消失。就像馬車升級變成了汽車,駕駛員的形式和職能也會隨之升級進步。所以,這隻是時代發展的必然。」鄭雙佳說。
從這個層面來看,結構生物學是在更加蓬勃地發展,而且變得愈發重要,能夠作為生命科學的基座,支撐科研人員在此基礎上開展進一步的科學研究和轉化落地。
此外,對於蛋白質 3D 結構預測來說,目前的 AI 技術已經能將預測精度提升至 90% 以上。面向未來,還會存在哪些新的發展方向?
鄭雙佳認為,順著業務設計的角度,他看到三個方面的發展空間。
其一是朝著 Dynamic 方向發展。
原因在於,目前即便 AlphaFold 已經能實現超高的預測結構精度,卻還是一個偏靜態的預測方式,但所有的生物分子都是動態的,並會在動態中形成功能。所以,像 Dynamic 這種動態預測,必將成為未來的發展趨勢。
其二是回到功能。
當下領域內學者已經能利用 AI 預測出一個好的結構,但這個結構如何和其他生物分子相互作用從而行使具體生物功能,還有待進一步探究。
其三是朝著設計的方向發展。
「這也是貝克能拿到盧保化學獎的核心原因。他並不是被獎勵在蛋白結構預測上做得有多好,而是被獎勵在他為蛋白設計領域的開闢和成熟化所做出的貢獻。」鄭雙佳表示。
由此,他認為,基於結構預測方法的逆向設計,不管是結構啟髮式的,還是功能啟髮式的,都將是該領域發展的重點方向。
如果從更長遠的角度來講,結構生物只是整個生物鏈條中的一部分。所以,對於 AI 而言,還需要更多跨尺度的思考。
「說到底就是回到組學概念上,通過不同尺度的組學去更好地表徵生命。當然,這是一個長期的事情,但我覺得 AI 會在其中扮演非常重要的角色。」鄭雙佳如是說。
參考資料:
1.Lu, W., Zhang, J., Huang, W. et al. DynamicBind: predicting ligand-specific protein-ligand complex structure with a deep equivariant generative model. Nature Communications 15, 1071 (2024). https://doi.org/10.1038/s41467-024-45461-2
2.Zheng, S., Tan, Y., Wang, Z. et al. Accelerated rational PROTAC design via deep learning and molecular simulations.Nature Machine Intelligence 4, 739–748 (2022). https://doi.org/10.1038/s42256-022-00527-y
3.Rao, J., Xie, J., Yuan, Q. et al. A variational expectation-maximization framework for balanced multi-scale learning of protein and drug interactions.Nature Communications 15, 4476 (2024). https://doi.org/10.1038/s41467-024-48801-4
運營/排版:何晨龍