David Baker再發Science重磅研究:用AI從頭設計一種功能性酶

酶作為生物催化劑,在溫和的條件下能夠加速生物化學反應速率,對眾多領域具有重要應用價值。然而,如何按照需要設計能夠催化複雜反應的酶,尤其是從頭設計絲氨酸水解酶,一直是酶工程領域的重大挑戰。

近年來,人工智能(AI)在蛋白質設計中的應用取得了顯著進展,尤其是最新的深度學習技術為從頭設計複雜的功能性蛋白質提供了新的機會

今天,Science 雜誌再次發佈 2024 年盧保化學獎得主、生物化學家和計算生物學家、華盛頓大學教授David Baker的一項重磅成果。研究團隊通過一種深度學習模型 PLACER 和一種生成式模型 RFdiffusion,成功設計了一系列具有高催化效率的絲氨酸水解酶。這些設計不僅在活性位點的幾何結構上具有創新性,而且在催化效率上也顯著優於以往的計算設計酶。

論文鏈接:www.science.org/doi/10.1126/science.adu2454論文鏈接:www.science.org/doi/10.1126/science.adu2454

研究團隊認為,這是一種突破傳統方法限制的從頭設計酶的方法,這項研究不僅在酶設計領域取得了重大突破,而且為未來設計更多新型酶提供了新的思路和方法,將對生物催化、醫藥和工業應用產生深遠影響。

此外,這項研究還展示了 AI 蛋白質設計在解決複雜生物化學問題中的巨大潛力,為未來的酶工程研究提供了重要的參考。

突破限制的蛋白質 AI 設計方法

絲氨酸水解酶是一類以絲氨酸為催化基團的酶,能夠催化酯類化合物的水解反應,在工業、醫藥等領域有著廣泛應用。然而,從頭設計絲氨酸水解酶,一直是酶工程領域的重大挑戰

一方面,絲氨酸水解酶的活性位點非常複雜,需要精確排列多個催化殘基,包括絲氨酸、組氨酸和天冬氨酸/穀氨酸,形成特定的氫鍵網絡,才能實現高效的催化反應。

另一方面,活性位點的預組織對於酶的催化效率至關重要,但實現這種預組織非常困難,尤其是在多步反應機制中。當前的方法在評估設計預組織時存在準確性和計算成本的限制。

傳統酶設計方法通常基於已有的蛋白質骨架,這限制了活性位點的精確實現,導致許多設計酶的活性較低。而且目前評估設計預組織的方法在準確性或計算成本上存在局限。

為瞭解決這些問題,David Baker 團隊構建了一種用於生成蛋白質骨架的 RFdiffusion 工具。RFdiffusion 是一種基於深度學習的蛋白質設計方法,具體來說,RFdiffusion 首先會從一個完全隨機的噪聲狀態開始,然後逐漸減少噪聲,同時引導生成過程朝著目標蛋白質結構的方向發展。

這個過程類似於在蛋白質結構空間中進行隨機遊走,但每次遊走的方向都會受到目標結構的引導。通過這種方式,RFdiffusion 能夠生成具有所需活性位點的蛋白質骨架,這些骨架能夠支撐特定的化學反應。

論文的共同作者 Ivan Anishchenko 等人,則構建了一種用於評估設計的蛋白質在反應過程中的活性位點預組織情況的 PLACER 網絡。它能夠根據蛋白質骨架的坐標、氨基酸殘基的身份以及結合小分子的化學結構,生成結合位點的全原子坐標集合。這使得研究團隊能夠評估設計的蛋白質在反應過程中各個關鍵狀態的活性位點預組織情況。

圖|使⽤ PLACER ⽐較天然和設計的絲氨酸⽔解酶的預組織圖|使⽤ PLACER ⽐較天然和設計的絲氨酸⽔解酶的預組織

PLACER 的核心思想是通過模擬蛋白質和小分子之間的相互作用,生成一個包含多種可能構象的集合。這些構象反映了蛋白質在反應過程中的動態變化,從而為評估設計的酶的催化效率提供了更全面的信息。

在生成過程中,PLACER 首先會對輸入的蛋白質結構和小分子進行編碼,然後通過解碼器生成可能的結合構象。通過這種方式,PLACER 能夠預測蛋白質和小分子之間的相互作用,並生成一個包含多種可能構象的集合。這個集合可以用於評估蛋白質在反應過程中的穩定性和活性,從而幫助研究團隊優化酶的設計。

通過結合 RFdiffusion 和 PLACER 網絡,研究團隊希望能夠突破傳統方法的限制,設計出具有高催化效率的絲氨酸水解酶。

從頭設計一種功能性酶

研究團隊首先利用 RFdiffusion 從幾何描述的活性位點出發,生成能夠支撐絲氨酸水解酶活性位點的蛋白質骨架。通過采樣催化基團在反應過渡態周圍的排列,生成活性位點基序,並枚舉每個催化殘基的 α-螺旋和 β-摺疊骨架構象。

然後,研究團隊使用 LigandMPNN 和 Rosetta FastRelax 進行序列設計和骨架優化,最終通過 AlphaFold2 預測設計結構,並篩選出與設計模型匹配的結構進行實驗表徵。

為了評估設計的活性位點在反應過程中的預組織,研究團隊又借助 PLACER 網絡,根據蛋白質骨架坐標、氨基酸殘基身份和結合小分子的化學結構,生成結合位點的全原子坐標。通過對反應路徑上的每個關鍵狀態(包括底物結合、四面體中間體、酰基-酶中間體等)進行建模,研究團隊能夠評估設計酶在每個反應步驟中的活性位點預組織情況。

在初步設計中,研究團隊構建了相對簡單的活性位點,通過兩輪設計,他們篩選出了一系列具有潛在催化活性的設計,並在大腸杆菌中表達和測試。

實驗結果顯示,從第二輪設計中篩選出的設計具有更高的 FP 探針標記率和酯酶活性,表明PLACER 過濾在選擇具有催化活性的設計方面具有重要作用

在第三輪設計中,研究團隊進一步增加了活性位點的複雜性,包括引入組氨酸穩定的催化酸和第二個氧陰離子孔氫鍵供體。通過 PLACER 預組織進行過濾,研究團隊篩選出了一系列能夠進行催化周轉的設計,其中兩個設計表現出顯著的催化效率。

圖|計算機設計的酶的結構(大面板)和AI預測的活性位點集合(小面板)圖|計算機設計的酶的結構(大面板)和AI預測的活性位點集合(小面板)

為了驗證設計的準確性,研究團隊對兩個表現顯著的設計結構進行了 X 射線晶體學分析。晶體結構顯示,這兩個設計的 Cα 原子均方根偏差(RMSD)小於 1 Å,分別僅為 0.8 Å 和 0.83 Å,表明設計模型與實驗結構高度一致。此外,活性位點的側鏈構象也與設計模型非常接近,進一步證實了設計方法的有效性。

這也意味著,研究團隊通過結合 RFdiffusion 和 PLACER 網絡,成功設計了一系列具有高催化效率的絲氨酸水解酶。這些設計不僅在活性位點的幾何結構上具有創新性,而且在催化效率上也顯著優於以往的計算設計酶

研究團隊認為,這項研究不僅有助於解決絲氨酸水解酶設計中的關鍵科學問題,還為其他酶家族的設計了新的工具和方法,也將對生物催化、醫藥和工業應用產生深遠影響。

總之,這項研究展示了AI 在生命科學和醫學研究中的變革潛力,不僅使具有複雜活性位點的酶的設計成為可能,而且為醫學、生物技術和更廣泛的科學領域的突破鋪平了道路。隨著 AI 技術的進一步發展,我們可以期待在酶設計和藥物發現方面取得更多突破,從而改善人類健康和福祉。

本文來自微信公眾號「學術頭條」(ID:SciTouTiao),作者:木木,36氪經授權發佈。