藥物研發新突破!中國科大、哈佛等聯合開發PocketGen模型,可高效生成蛋白質口袋
調節蛋白質功能的主要方法涉及蛋白質與小分子配體的相互作用。這些相互作用在生物過程中起著至關重要的作用,例如酶催化、信號轉導和細胞內的調節機制。小分子與蛋白質上特定位點的結合可以誘導構象變化、調節活性或抑制功能。該機制是研究蛋白質功能和設計具有定製特性的小分子結合蛋白以用於治療和工業應用的寶貴工具,包括設計酶來催化沒有天然催化劑的反應,以及開發可以通過傳遞信號檢測環境中的化合物的生物傳感器,可用於環境監測、臨床診斷、病原體檢測、藥物輸送系統和食品工業中的應用。
蛋白質口袋的設計逐漸成為關鍵一環。
蛋白質口袋,即蛋白質中具有特定形狀和化學性質的口袋結構,其能夠通過特異性地結合一些小分子化合物,如同鎖和鑰匙的相互作用,開啟或調控生物體內眾多的生理過程。從酶的催化反應到信號傳導,再到細胞的調節機制,這些相互作用無處不在。因此,設計能夠與特定小分子緊密結合的蛋白,即高質量的蛋白質口袋,對於藥物研發來說意義非凡。
但是,傳統的計算方法在生成高質量的蛋白質口袋時面臨諸多困難,常常需要克服蛋白質-配體相互作用的複雜性、配體和氨基酸側鏈的靈活性,以及序列結構依賴性等。
近日,一種全新的深度生成模型 PocketGen 的出現,為解決這些難題帶來了新的解決方案。該模型由來自中國科學技術大學、哈佛醫學院等機構的研究人員共同開發,研究成果發表在 Nature Machine Intelligence 期刊上,通過將人工智能與生物醫學相融合,為蛋白質口袋的設計提供了全新的思路和方法。
PocketGen 可以生成具有優異結合親和力和結構有效性的高保真蛋白質口袋。它的運行速度比基於物理的方法快十倍,成功率達到 95%,成功率定義為生成的口袋中結合親和力高於參考口袋的百分比。此外,它的氨基酸回收率超過 64%。
PocketGen 模型的最核心的創新之處在於其獨特的架構設計。它採用了一種協同設計方案,能夠根據給定的配體分子和蛋白質支架(除口袋區域外的部分),同時預測蛋白質口袋的序列和結構。
PocketGen 模型主要由兩個關鍵模塊構成,即雙層圖轉換器(bilevel graph transformer)和序列優化模塊。
雙層圖轉換器是 PocketGen 的「結構探測器」。它可以將蛋白質-配體復合物建模為塊的幾何圖,以此來捕捉原子、殘基和配體等不同層面的相互作用。在這個過程中,其獨特的雙層注意力機制,猶如一雙敏銳的眼睛,既能關注原子級別的細微相互作用,又能把握殘基/配體層面的宏觀關係,從而全面理解蛋白質口袋內的複雜環境。在生成蛋白質口袋結構時,它可以直接更新口袋區域所有原子的坐標,而不是分別處理骨架和側鏈,這種方式大大提高了結構預測的準確性和效率。
而序列優化模塊則十分巧妙地將蛋白質語言模型(pLMs)融入其中。通過在 pLMs 中植入輕量級結構適配器,實現了序列與結構特徵之間的交叉注意,從而確保生成的序列與結構相互匹配、協調一致。
為了驗證 PocketGen 模型的卓越性能,研究團隊在兩個廣泛使用的數據集——CrossDocked 和 Binding MOAD 上進行了嚴格的測試。研究人員採用了一系列全面的評估指標,包括親和力、結構有效性以及氨基酸回收率(AAR)等。
與其他六種先進的方法相比,PocketGen 模型展現出了顯著的優勢。在生成高質量蛋白質口袋方面,它的表現尤為突出。例如,CrossDocked 數據集上,PocketGen 生成的蛋白質口袋在結構有效性上超過了其他方法,其設計能力比部分方法卡奧出 2% – 3%,Vina 分數也比最強的基線方法 RFAA 高出 0.199。在氨基酸回收率方面,PocketGen 平均達到了 63.40%,遠高於其他方法,在生成效率上,PocketGen 更是脫穎而出。傳統的基於物理的方法(如 PocketOpt)和模板匹配方法(如 DEPACT)生成 100 個蛋白口袋可能需要超過1000 秒,而先進的蛋白骨架生成模型 RFdiffusion 和 RFAA 由於其擴散架構的計算複雜性,也需要較長時間(分別為 1633.5 秒和 2210.1 秒)。相比之下,PocketGen 僅需 44.2 秒即可完成同樣的任務,速度提升了數十倍,大大提高了蛋白口袋生成的效率,為大規模的生化實驗提供了可能。
不僅如此,PocketGen 模型還為後續研究開闢了新的方向。例如,它可以進一步拓展到設計蛋白質的更大區域,而不僅僅局限於口袋區域。研究人員也可以通過引入更多的生化先驗知識、子口袋和交互模板,進一步提高 PocketGen 模型的泛化能力等。
此外,研究人員還展示了 PocketGen 在先前研究的基礎上重新設計針對特定靶配體的抗體、酶和生物傳感器口袋的能力。
抗體:皮質醇 (HCY) 是一種主要的壓力激素,可提高血液中的葡萄糖水平,並可作為壓力和其他疾病的生物標誌物。研究人員重新設計了皮質醇特異性抗體 ( PDB ID 8cby )的口袋,以潛在地幫助開發免疫測定。
酶:阿呱沙班 (APX) 是一種口服抗凝劑,於 2012 年獲得 FDA 批準,用於治療非瓣膜性房顫患者,以降低中風和血栓風險。阿呱沙班靶向 Xa 因子 (fXa) ( PDB ID 2p16 ),這是一種凝血過程中的關鍵酶,可將凝血酶原轉化為凝血酶,從而形成血栓。因此,重新設計 fXa 的口袋可能具有治療意義。
生物傳感器:芬太尼 (7V7) 已成為一種被廣氾濫用的藥物,導致阿片類藥物危機。芬太尼結合蛋白(生物傳感器)的計算設計可以促進毒素的檢測和中和。例如,Baker 等人開發了一種用於檢測植物中芬太尼的生物傳感器( PDB ID 5tzo )。
PocketGen 能夠建立有利的蛋白質-配體相互作用,從而為這些藥物配體生成高親和力口袋。對於 PocketGen,生成的口袋中親和力高於參考值的百分比數別為 11%、40% 和 45%。相比之下,排名第二的最佳方法 RFAA 在相同情況下僅達到 0%、10% 和 18%。
總而言之,目前階段 PocketGen 模型能生成如此具有高親和力和結構有效性的蛋白口袋,對於藥物研發具有重要意義,相信未來在 PocketGen 模型的幫助下,我們有望開發出更高效、更具特異性的藥物,為疾病治療帶來新的希望。
參考文獻:
1.Zhang, Z., Shen, W.X., Liu, Q. et al. Efficient generation of protein pockets with PocketGen.. Nat Mach Intell (2024). https://doi.org/10.1038/s42256-024-00920-9