盧保化學獎，為何也青睞人工智能？

▲大衛·貝克、德米斯·哈薩比斯和約翰·江珀。圖/盧保獎委員會官網

2024年的盧保化學獎，也給了人工智能。

10月9日，瑞典皇家科學院宣佈將本年度盧保化學獎授予三位科學家，其中，一半授予美國華盛頓大學的大衛·貝克，以表彰其在計算蛋白質設計方面的貢獻，另一半則共同授予英國倫敦Google旗下人工智能公司「深層思維」的德米斯·哈薩比斯和約翰·江珀，以表彰其在蛋白質結構預測方面的貢獻。

無論貝克的蛋白質設計發明，還是哈薩比斯和江珀的蛋白質測定的發現，都極大地開拓了人類對蛋白質的認知。蛋白質不只是生命的基本物質，而且還有更多的作用，如充當激素、信號物質、抗體和不同組織的組成部分。而深入瞭解蛋白質，將給人類帶來更多更大的益處。

人類可以創造蛋白質

2003 年，貝克成功地使用一個人工智能模型設計了一種不同於任何其他蛋白質的新蛋白質。之後，他的研究小組創造了一個又一個富有想像力的蛋白質，包括可用作藥物、疫苗、納米材料和微型傳感器的蛋白質。

早在1998年，貝克團隊設計了稱為羅塞塔（Rosetta）預測蛋白質結構和設計蛋白質的軟件。它可以通過修改氨基酸序列來設計出具有特定功能或性質的蛋白質，如增強蛋白質的穩定性、改變蛋白質的結合親和力等。

2003年，貝克團隊讓羅塞塔計算哪種類型的氨基酸序列可以產生所需的蛋白質。羅塞塔不辱使命，搜索了所有已知蛋白質結構的數據庫，並尋找與所需結構相似的蛋白質短片段。然後，設計出了一個全新的與現在所有已知的蛋白質完全不同的蛋白質，稱為Top7。

而且，Top7的結構是自然界中並不存在的獨特結構，它有93個氨基酸，比以前設計生產的任何蛋白質都大。

這個發現的重要意義在於，人類可以像自然一樣創造蛋白質，但不同於自然創造蛋白質是隨機的，而是有目的的，能夠研發有針對性和有效的藥物。例如，研發破除細菌耐藥的抗生素，以及治療癌症和愛滋病的藥物。

預測蛋白質結構的新方法

此次共享一半諾獎的哈薩比斯和江珀，則創建了一個人工智能模型，從根本上改變了AI模型對蛋白質結構的測定。

在蛋白質中，氨基酸以長鏈的形式連接在一起，這些長鏈摺疊形成三維結構，對蛋白質的功能起決定性作用。從20世紀70年代以來，研究人員一直試圖從氨基酸序列中預測蛋白質結構，但這似乎難於上青天。

為瞭解決蛋白質結構檢測問題，1994年，以美國馬里蘭大學約翰·莫爾特為首的一些科學家啟動了一個名為蛋白質結構預測關鍵評估（CASP）項目，之後發展成為一項競賽。

幾年前，研究人員在CASP競賽中人工預測蛋白質結構最多隻能達到40%的準確率。但哈薩比斯團隊借助他們的AI模型阿爾法摺疊對蛋白質的預測準確率達到了近60%，能夠預測過去已經鑒定出的幾乎所有2億種蛋白質的結構。而要全面瞭解蛋白質的功能，必須對其結構的預測準確率達到90%。

之後，哈薩比斯和江珀聯手研發了新的AI模型阿爾法摺疊-2。2020年，他們帶著這一AI模型參加CASP，評估結果時幾乎讓所有人震驚，他們明白生物化學50年的挑戰已經結束。在大多數情況下阿爾法摺疊-2的性能幾乎與X射線晶體學一樣好。

這個發明的意義在於，人類有了預測蛋白質結構的新方法。過去，測定蛋白質三維結構有三大手段，X射線晶體學、核磁共振技術和雪藏電鏡三維重構技術。這些方法都有其優點和缺陷，不同的研究對象需要採用不同的方法。

阿爾法摺疊的橫空出世，幾乎克服了現有的幾種測定蛋白質結構的弱點，在準確性、速度、效率，以及適用性上都體現了優勢。

這項發明的重要意義，同樣體現在研發藥物、診治疾病方面。如愛滋病病毒表面突起蛋白gp120主要與人免疫T細胞表面蛋白結合，如果進一步確定gp120蛋白的結構，就可以設計出阻止其與T細胞結合的藥物，以防治愛滋病。

此外，更要看到的是，今年的物理學獎和化學獎都授予了與人工智能相關的研究結果，這或許意味著，人工智能不只是未來人們工作和研究的工具，還是人類社會發展不可或缺的利器。

撰稿 / 張田勘（科普作者）