2024盧保化學獎得主:「模型幻覺」給我無限創造力

編輯:KingHZ

【新智元導讀】AI「幻覺」可能在一般人看來是模型的胡言亂語,但它為科學家提供了新的靈感。David Baker甚至利用AI「幻覺」贏得了盧保化學獎。紐約時報發文AI正在加速科學發展,但「幻覺」一詞,在科學界仍有爭議。

萬萬沒想到,一直備受批評的AI「幻覺」問題,竟然在科學領域具有極大的應用價值?

就在最近,計算機科學家Amy McGovern表示:「公眾認為這完全是壞事。但實際上,它為科學家提供了新的靈感,讓他們得以探索一些原本可能不會想到的思路。」

AI「幻覺」可以幫助科學家通過測試「夢幻式」的新概念,來追蹤癌症、設計藥物、發明醫療設備並揭示氣像現象AI「幻覺」可以幫助科學家通過測試「夢幻式」的新概念,來追蹤癌症、設計藥物、發明醫療設備並揭示氣像現象

AI「幻覺」激發科學創造力

科學在人們心中的形象冷靜而理性。

然而,在科學發現的早期階段,往往充滿了直覺和大膽的猜想。正如科學哲學家Paul Feyerabend所言,這是一種「無拘無束」的探索狀態。

如今,AI的「幻覺」正在重新激發科學的創造力

這種技術加速了科學家和發明家提出新想法並驗證其是否符合現實的過程。

這可以被視為科學方法的加速版。以往需要數年完成的任務,現在可能在幾天、幾小時甚至幾分鐘內實現。

有時候,甚至幫助科學家加速了研究週期,開闢了全新的研究領域

麻省理工學院教授James J. Collins說:「我們正在探索」。他最近稱讚AI的「幻覺」加速了他對新型抗生素的研究進展。「我們讓模型提出完全新穎的分子。」

科學家向生成式計算機模型輸入特定主題的信息,然後讓機器對主題進行重新加工,從而產生AI的「幻覺」。

結果可能有細微的偏差,也可能超越現實。有時,它們會帶來重大發現。

「幻覺」帶來的盧保化學獎

去年十月,華盛頓大學的David Baker因其開創性的蛋白質研究獲得了盧保化學獎。這些複雜的分子是生命活動的關鍵動力。

盧保委員會稱讚他發現了快速構建完全不同於自然界中蛋白質的新方法,並稱其成就「幾乎不可能」。

在獎項宣佈前的一次採訪中,Baker博士將AI的「突發想像」描述為「從零開始設計蛋白質」的關鍵。

他補充說,這項新技術幫助他的實驗室獲得了約100項專利,其中許多用於醫療用途。一個專利用於一種新的癌症治療方法,另一個旨在支持全球抗擊病毒感染的工作。他還創辦或協助創立了超過20家生物技術公司。

他說:「發展速度非常快,即使是專門研究蛋白質的科學家,也不瞭解目前的進展有多大。」

他的實驗室設計了多少種蛋白質?

他回答道:「一千萬種, 而且都是全新的。它們在自然界中並不存在。」

盧保獎獲得者Baker博士對「幻覺」採取了直截了當的態度。

在2021年, 他在Nature上發表了一篇論文,標題為《通過深度網絡幻覺進行從頭蛋白質設計》(De novo protein design by deep network hallucination)。

論文地址:https://www.nature.com/articles/s41586-021-04184-w論文地址:https://www.nature.com/articles/s41586-021-04184-w

標題中的「從零(De novo)」一詞源自拉丁文,意為「從零開始」,與1980年代初科學家開始修改自然界已知蛋白質結構的做法形成了鮮明對比。

2003年,Baker博士及其同事實現了一個更宏偉的目標:從零構建世界上第一個全新蛋白質。

他們將其命名為Top7。這一成就被視為一項重要的突破,因為蛋白質的複雜性堪稱驚人。

專家將DNA的結構比作一串珍珠,而將大型蛋白質的結構比作糾結的毛球。即使是詳細的圖示,也只能粗略地表現蛋白質的複雜結構。

在流感病毒表面的血凝素蛋白的棱周圍會形成一種粘合劑蛋白,針對這些易受攻擊的點可以阻止病菌附著在肺部和其他地方的細胞上在流感病毒表面的血凝素蛋白的棱周圍會形成一種粘合劑蛋白,針對這些易受攻擊的點可以阻止病菌附著在肺部和其他地方的細胞上

隨著AI發展成為一種強大的新技術,Baker博士開始思考它是否能夠加速從零開始的蛋白質設計。

他在2021年的論文中提到,新方法受到了GoogleDeepDream模型的啟發。

DeepDream模型可以將現有圖像轉化為迷幻風格,創造全新的視覺內容。

當人們看滿月時看到一個人的臉,這被稱為「空想性錯覺」(pareidolia),即一種將模糊圖案轉化為有意義圖像的感知現象。DeepDream正是利用了這種特性來創造超現實的圖像。

Baker博士的計劃是測試AI是否可以將這種「空想性錯覺」應用於模糊的氨基酸集合——氨基酸是蛋白質的基本構建塊。

他的團隊將隨機的氨基酸序列輸入一個經過訓練的模型,而該模型能識別真實蛋白質的結構特徵。

結果大大超出了預期。

論文指出,測試運行生成了數千種虛擬蛋白質,並將其比作互聯網中氾濫的貓圖片。

論文寫道:「就像由深度網絡幻覺生成的貓圖像可以清晰地被識別為貓一樣。這些人工蛋白質結構與天然結構相似,但並不完全相同。」

隨後,貝克團隊嘗試將這些虛擬的蛋白質轉化為現實——這一過程類似於讓電子貓變為真實存在的生物貓。首先,團隊將這些虛擬分子的結構信息作為藍圖,用以生產形成基因的DNA鏈。接著,正如2021年的論文所述,當這些基因被插入微生物體內後,這些微生物成功產生了129種從未在科學或自然界中發現的新蛋白質。

2022年初,Baker博士將這一成就描述為「AI加速從零蛋白質設計的首次實證」。

在他於2022年和2023年發表的後續論文中,「幻覺」一詞仍然出現在標題中。

擴散模型帶來蛋白質催化劑

Baker博士表示,他的實驗室最近在創意生成方面取得了新突破,採用了一種稱為擴散(diffusion)的AI方法。這也是DALL-E和Sora等流行視覺生成器的核心技術。

Baker博士稱讚擴散技術在設計新蛋白質方面比「幻覺」更高效, 他說:「速度更快,成功率也更高。」

近年來,一些分析人士擔心科學正在走向衰退。他們指出,過去幾十年來,突破性發現的數量正在減少。

AI的支持者則認為,創造性爆發正在扭轉這一趨勢。

在設計領域,Baker博士及其同事看到一普波域治蛋白質催化劑即將誕生。這些催化劑可能幫助收集太陽能、將老舊工廠改造成高效節能設施,並為構建一個可持續的新世界提供支持。

Baker團隊的成員Ian C. Haydon認為這種加速仍在繼續並表示「這令人難以置信。」

「幻覺」是天才的表現

Google旗下AI公司DeepMind科學部負責人Pushmeet Kohli在一次採訪中稱讚了「幻覺」在促進科學發現方面的作用。

不久前,他的兩位同事與David Baker博士共同分享了2024年的盧保化學獎。

Pushmeet Kohli表示:「我們擁有一項能夠展現創造力的驚人工具」。

Pushmeet Kohli博士舉了一個例子,說明了這種工具的創造力。

2016年,DeepMind的計算機在圍棋比賽中擊敗了世界冠軍。

這場比賽的轉折點是第37步,發生在比賽的早期階段。

Kohli博士回憶道:「我們一開始以為那是個錯誤。但隨著比賽的進行,人們意識到那是一種天才的表現。因為,這些模型能夠產生非常新穎的見解。」

他認同AI在加速生物科學的發展:「接下來的幾年中會出現許多令人驚歎的成果」。

他認為,AI正在解鎖生命最深層的奧秘,並為治癒疾病、改善健康和延長壽命奠定了強大的新基礎。

他說:「一旦我們破譯並真正理解生命的語言,那將是奇蹟」。

更多的「幻覺」

另一方面,曼哈頓紀念史隆凱特琳癌症中心實驗室負責人Harini Veeraraghavan,在一篇關於利用AI改善模糊醫學圖像的論文中提到了「幻覺」一詞。

這篇論文的標題部分直接寫道「幻覺MRI」。

論文地址:https://pmc.ncbi.nlm.nih.gov/articles/PMC7225573/pdf/nihms-1586979.pdf

德克薩斯大學奧史甸分校的研究人員也接受了這一術語。他們的一篇論文標題寫道:「從幻覺中學習」,討論如何改進機器人導航。

論文地址:https://www.cs.utexas.edu/~xiao/papers/hallucination.pdf

「幻覺」設計的新事物需要驗證

儘管AI「幻覺」在科學發現中的吸引力巨大,但一些科學家認為這一術語具有誤導性

他們認為,生成式AI模型的「想像」並非完全虛幻,而是具有一定實現可能性的,就像科學方法早期階段的假設一樣。因此,他們認為「幻覺」一詞不夠準確,並傾向於避免使用。

此外,「幻覺」一詞還因其與迷幻藥(如LSD)導致的幻覺聯想而受到質疑。迷幻藥在過去曾讓許多嚴肅的科學研究裹足不前。

最後,在科學和醫學交流中,AI生成的信息可能被錯誤信息所混淆,就像像聊天機器人的回覆那樣,這也讓「幻覺」一詞更加備受爭議。

今年七月,白宮發佈了一份關於促進公眾信任AI研究的報告,其中唯一提到「幻覺」的部分是關於如何減少它們的存在。

盧保獎委員會似乎也遵循了這一思路。在對Baker博士工作的詳細評價中,沒有提及AI「幻覺」。相反,在新聞稿中,僅稱讚了他的團隊「創造了一種又一種富有想像力的蛋白質」。

科學界的部分機構似乎越來越傾向於將「幻覺」視為一個不宜提及的詞彙。

儘管如此,專家們在紐約時報的採訪中指出,科學AI的「想像」相比聊天機器人等的「幻覺」具有顯著優勢。

最根本的一點是,這種創造性爆發基於自然和科學的硬性事實,而非人類語言的歧義或互聯網中的偏見和虛假信息。

「幻覺」並不可靠

加州理工學院的數學與計算機科學教授Anima Anandkumar表示:「我們正在教授AI物理學」。她曾擔任AI芯片領先製造商英偉達的AI研究主管。

Anandkumar博士補充說,對於科學而言,基於可靠事實的物理學基礎可以帶來高度準確的結果。

她指出,聊天機器人的大語言模型無法實際驗證其陳述和斷言的正確性。

她強調,最終的驗證來自科學家將這些AI生成的構想與物理現實的具體細節進行比較。

她談到AI的成果時說道:「你需要對其進行測試,AI靠『幻覺』設計的新事物需要經過驗證。」

最近, Anandkumar博士及其同事利用AI的「幻覺」幫助設計了一種全新的導管。

這種導管可以顯著減少細菌汙染——這一全球性問題每年導致數百萬例尿路感染。

她表示,團隊的AI模型設計了數千種導管幾何形狀,並最終選出其中最有效的一種。

這種新導管的內壁上覆蓋著鋸齒狀突起,能夠防止細菌附著並向上遊移動,從而感染患者的膀胱。Anandkumar博士提到,該團隊正在討論這種設備的商業化。

與其他科學家一樣, Anandkumar博士表示她不喜歡「幻覺」這個術語。

她的團隊在關於新導管的論文中避免使用該詞。

「幻覺」是概率分佈?

Amy McGovern博士是AI研究所的負責人,也是俄克拉荷馬大學氣象學和計算機科學的教授。

她認為AI的「幻覺」或許更適合被稱為「概率分佈」——這是科學領域一個傳統的術語。

她補充道,天氣研究人員現在經常使用AI來創建數千種細微的預測變化或概率範圍。這些豐富的想像幫助他們發現了可能引發極端事件(如致命熱浪)的意外因素。

她認為這是一種非常有價值的工具。

參考資料: