從「天才少年」到被迫「追趕者」:諾獎得主、AlphaGo之父Demis Hassabis眼中的AI未來
Demis Hassabis 現任 Google DeepMind 首席執行官,他 過去常常在午夜至淩晨 3 點之間完成一些最有成就感的工作 。他稱自己為「夜行人」,會把自己的獨處時間用於閱讀科學論文、提出新想法以及純粹的思考。
如今, Hassabis 的淩晨工作時間卻變得「不夠用」了 。他的許多團隊成員都工作在矽谷的Google總部,那邊的上班時間要比倫敦早八個小時。因此,他的影片會議經常會持續到當地第二天。「大約 18 個月前,我的作息時間依然很好,」他若有所思地說。隨著Google把 DeepMind 和 Google Brain 合併為 Google DeepMind,Hassabis 也被任命為這一部門的負責人。自此以後, 曾經那樣的珍貴寧靜時光便不複存在了 。
這是一個巨大的責任。儘管Google多年來一直在談論要成為一家以 AI 為先的公司,但當前這一波生成式 AI 狂潮卻是由 OpenAI 在 2022 年 11 月推出的 ChatGPT 掀起的。 儘管Google擁有所有的技術實力,也一直在努力將自己確立為將新興技術轉化為實際產品的領導者,但如今正在被迫與無數其他公司競爭 ,其中就包括 OpenAI 和 OpenAI 的合作夥伴微軟。
Google將重心放在了 Gemini 上,這是一個大語言模型(LLM),支持Google搜索「AI 概覽」摘要、起草 Gmail 電子郵件等功能。Gemini 還取代 Google Assistant 成為安卓系統的預設語音 AI。然而, Gemini 還無法取代 ChatGPT 作為頭部 AI 聊天機器人的地位,後者具有內置搜索等新功能,正在更加直接地與Google展開競爭 。Google的一些 AI 產品發佈也曾淪為公關噩夢,暴露了顯而易見缺陷,比如「建議使用膠水把乳酪粘在披薩上」,Google願意傳播可能出錯的 AI,意味著其早期更為謹慎的心態發生了明顯轉變,在 ChatGPT 表明當前技術的不成熟不會阻礙其採用之前:「坦率地說,我從來不相信社會可以容忍如此多的幻覺,但事實就是這樣,」Google DeepMind 首席運營官 Lila Ibrahim 說。
儘管如此,Google還是從其競爭優勢中獲益了:只需輕輕一按,就可以讓 AI 技術惠及大量人群。「目前,Google的每一款 10 億用戶產品都集成了 Gemini,」Google DeepMind 產品副總裁 Eli Collins 表示,「我們有 9 款用戶超 10 億的產品。」
正如 Hassabis 所說:「事實證明,我們現在是Google的引擎室。」然而, Google DeepMind 的使命遠不止於此,與 OpenAI、Anthropic 等公司一樣,致力於實現通用人工智能(AGI) 。儘管對 AGI 的確切定義各不相同,但業內一致認為,AGI 涉及的領域比當前更加廣泛。20 多年前,Shane Legg 建議將 AGI 作為 Ben Goertzel 所著書籍的書名,從而推動了這一術語的普及。
現在,作為 Google DeepMind 首席 AGI 科學家, Legg 將 AGI 定義為「至少可以在人們通常可以完成的認知任務中與人類能力相匹配的東西」 。Hassabis 對於某個實體(不一定是Google)何時能實現 AGI 留了很大的餘地,一邊說,「10 年後有 50% 的機會」,又一邊說,「如果它發生得更早,我也不會感到驚訝。」
Hassabis 為人謙遜和藹,說話平靜,但語速很快。他一生都在取得巨大成就,最近因 AlphaFold 這項工作與他的同事 John Jumper 一起獲得了世界上最崇高的榮譽——盧保獎。AlphaFold 是 AI 輔助蛋白質研究的一項突破,可能會徹底改變藥物發現。
儘管如此,Hassabis 的職業生涯卻正進入一個充滿挑戰的新階段。多年來,他一直被 AI 解決人類最大挑戰的潛力所激勵,這是他和Google共同的願景,後者允許他以極大的自主權去追求這一目標。 但現在,他必須將其與日益增長的壓力結合,不斷推出新技術,保持產品的相關性 。成功與否,取決於他在科學理想和商業現實之間取得平衡的能力。
我 10 月初到訪時,經過幾天的細雨,倫敦的天空已經放晴,陽光照進會議室里,Hassabis 向我解釋了他是如何努力工作,以確保 Google DeepMind 的工作場所沒有矽谷特有的密閉氛圍。
Google DeepMind 的辦公室獨具一格,有以「交流電之父」 Nikola Tesla 命名和裝飾的,還有向世界上第一個程序員 Ada Lovelace、「人工智能之父」 Alan Turing 和其他科技傑出人物致敬的,這並不令人驚訝;也有向哲學家 Baruch Spinoza 和 Ludwig Wittgenstein 致敬的;還有以英國小說家 Mary Shelley 命名的,她最著名的作品《科學怪人》(Frankenstein)講述了 200 年前 AI 出錯的故事;還有一家咖啡館以科幻小說作家 Isaac Asimov 的名字命名,他在 1942 年提出了機器人三定律——第一條是「機器人不得傷害人類,也不得因不作為而讓人類受到傷害」。
他們的圖書館,收藏了各種主題的紙質書籍,Hassabis 對物理學家 David Deutsch 於 1997 年出版的量子理論著作《現實的結構》(The Fabric of Reality)特別感興趣。圖書館內還有科技風格的藝術品,包括大廳里的兩個巨大的玻璃鋼多面體。根據旁邊的標語,這些結構由英裔美國雕塑家 Anthony James 創作,旨在「為數字計算的抽像之美賦予了一種剛硬而閃亮的觸感」。
這種多學科氛圍反映了 Hassabis 的多元興趣,涵蓋「哲學、藝術和人文」等各個領域,他說, 「在價值觀和社會方面,我也是這麼想的。我覺得世界需要投入它想要的 AI —— 而不僅僅是加州一百平方英里的一塊地方。」
遊戲,是另一個影響 Hassabis 的重要因素 。1976 年,Hassabis 在倫敦出生,他的父親是希臘裔塞浦路斯人,母親是新加坡人。僅在 4 歲時,他就在國際象棋比賽中擊敗了他的父親和叔叔。8 歲時,他在國際象棋比賽中賺到了足夠的錢,買下了自己的第一台個人電腦;後來,他擁有了一台 Commodore Amiga 500,這台電腦在他的記憶中留下了深刻的印象,以至於他們已經從Google的其他部門招募了其中一名聯合創始人。
17 歲時,Hassabis 開始專業開發影片遊戲,其中一款遊樂園模擬器遊戲賣出了數百萬份。1997 年,他從劍橋大學計算機科學專業畢業時,IBM 的國際象棋計算機「深藍」擊敗了世界冠軍 Garry Kasparov。Hassabis 為之著迷。但他表示,這一里程碑式時刻也是「一個奇怪的死胡同」。「深藍」是被稱為專家系統的一個示例,天生就是為國際象棋大師而生的,但無法接受訓練來玩其他遊戲,更不用說執行其他類型的工作了。
Hassabis 發現,他對 AI 的另一種方法很感興趣:神經網絡。 通過模仿人腦的運作方式,基於該模型構建的軟件可以像人一樣學會做很多事情。該技術一直受到計算能力的限制,但 Hassabis 堅信,隨著超級計算機的功能越來越強大,神經網絡可以取得長足進步。
2010 年,DeepMind 成立了,這家初創公司非常低調,最初的網站只有一個標誌,沒有其他內容。 早期,該公司開發了可以玩 20 世紀 70 年代 Atari 影片遊戲的軟件——不是因為世界需要玩 Atari 遊戲的計算機,而是作為開發 AI 的起點,這種 AI 可以自己找出規則和目標,而不需要費力地將它們編碼進去。(老式 Atari 遊戲卡帶仍然堆放在 Google DeepMind 遊戲室里。)
在破解了《太空侵略者》和《打磚塊》之後,DeepMind 將注意力轉向了一項更大的挑戰:圍棋。這項擁有 2500 年歷史的棋盤遊戲非常複雜,許多人認為計算機可能永遠無法掌握它。2016 年,AlphaGo 軟件擊敗了傳奇圍棋大師李世石——這是 AI 史上比擊敗 Kasparov 更偉大的時刻。第二年,一個名為 AlphaGo Zero 的新版本出現了,它無需使用人類遊戲數據進行訓練,就可以通過自學成為一名更優秀的圍棋選手,這是 AI 的另一個重大進步,它以與人類相同的方式學習,但速度要快得多。
但是,DeepMind 作為獨立公司的短暫生命很快就結束了。 2014 年 1 月,Google以 4 億美元至 6.5 億美元的價格收購了這家初創公司——與 OpenAI 目前 1570 億美元的估值相比,這顯得很微不足道,但在當時也是一筆不錯的數字。當時,投資者並不看好 AI,作為一家初創公司,「籌集 1000 萬美元非常困難」,Hassabis 回憶道。他與Google聯合創始人 Larry Page 和 Sergey Brin 因共同致力於開發 AI 而結緣。
出售給Google,「意味著 Hassabis 不必一直花時間與投資者交談」 ,DeepMind 的首批員工之一、現任 Google DeepMind 高級總監 Helen King 表示,「他可以專注於推動研究向前發展。」
在 AlphaGo 與李世石的比賽進行時,Hassabis 的思緒轉向了涉及比遊戲更實質性內容的 AI 研究。 「在我看來,下一步是走出實驗室,將其應用於現實世界的問題,」 他說,「蛋白質摺疊是我的首選。」確定蛋白質如何摺疊成 3D 結構,可以為藥物發現和其他生物技術領域提供關鍵見解,但這是一個非常艱巨的過程,在數十億種可能性中,只有大約 100000 種這樣的結構被確定下來。AI 能夠提供幫助的可能性,是 90 年代的一位大學朋友植入他的腦海中的,當時他們在酒吧玩桌上足球,這位朋友會癡迷地談論它。
DeepMind 發起了一項將這一過程自動化的計劃,並將其命名為 AlphaFold。AlphaFold 的第一個版本,就在 2018 年贏得了兩年一度的蛋白質預測競賽,這對生物技術和 AI 來說都是一個更加非凡的進步。這也證明了 DeepMind 以研究為先的文化可以在Google內部蓬勃發展。在撰寫了關於使用機器學習進行蛋白質預測的博士論文後,Jumper 加入了 DeepMind,他在 2021 年告訴我,在那裡工作「就像每天都在參加 AI 會議一樣」。
今年 5 月,Google首席執行官 Sundar Pichai 在 Google I/O 開發者大會上將 Hassabis 請上台。 這讓人覺得這似乎是一個姍姍來遲的舉動(Hassabis 當時已在Google工作十多年) ,但時機卻恰到好處,因為 Hassabis 的工作已迅速成為公司未來的核心。
Hassabis 身穿標誌性的藍色襯衫,戴著藍框眼鏡,發佈了一段影片,展示了「Project Astra」,這是Google對下一代 AI 智能體的實驗性願景。Astra 由 Gemini 提供支持,旨在在智能手機或智能眼鏡上運行。
從某種程度上來說, 這感覺像是一種競爭的必然結果 :如果Google不發明世界上最好的帶眼睛的 AI 助手,就會有其他公司來做這件事。OpenAI 已經預覽了類似的 ChatGPT 功能,包括可以解決手寫數學問題和根據面部表情讀取人的情緒的功能。即使是蘋果,儘管對 AI 的態度很謹慎,也正在為 iPhone 提供更多相機輔助智能。
然而,Hassabis 告訴我,他「深度參與」了 Astra 的開發,但他所做的不僅僅是打造一個更智能的 AI 助手。教會軟件理解周圍環境,也是 Google DeepMind 實現 AGI 的關鍵。他說, 要讓計算機像人類一樣思考,「你不能只生活在語言和數學的世界里。你必須瞭解物理世界。」
只關注 AGI 何時到來,會低估 Google DeepMind 和其他研究機構已經取得的進展。例如,AI 已經在理解多種語言方面擊敗人類,這是Google 20 多年來一直熱衷的話題。Legg 表示,一個出色的 LLM 「可以說 100 種語言,而且可以非常流利地說 30 或 40 種語言。據我所知,沒有人能夠做到這一點。」Gemini 的一些版本現在可以用多達 102 種語言交談,包括英語、法語和西班牙語,以及科薩語、馬拉地語和烏爾都語等。
無論距離實現 AGI 還有多遠,Google DeepMind 都在推進具有巨大潛力的研究項目和機會,而這些項目和機會與Google的直接利潤無關。2021 年,該公司成立了一家名為 Isomorphic Labs 的公司,致力於將 AlphaFold 技術商業化,Hassabis 擔任首席執行官,Google DeepMind 首席商務官 Colin Murdoch 擔任總裁。Isomorphic Labs 現在擁有 150 名員工和獨立的辦公空間, 專注於加速藥物研發,為 Google DeepMind 提供了另一個與物理世界接觸的機會 。
此外,Google DeepMind 的研究人員還在努力開展 其他應對現實挑戰的項目 :GraphCast 使用 AI 在不到一分鐘的時間內生成準確的 10 天天氣預報。GNoME 已經確定了 220 萬種新的無機晶體,其中包括 38 萬種穩定的晶體,可用於製造從電池到太陽能電池板等各種產品。他們與 EPFL 的瑞士等離子中心合作開發了 Torax,旨在幫助預測如何控制核聚變所需的高於太陽的溫度。
「我們擁有一些世界上最好的核聚變專家、生物學家和材料科學家,」研究副總裁 Pushmeet Kohli 說。
這些努力的範圍,正是當時的首席執行官 Larry Page 於 9 年前創建 Alphabet(Google和其他子公司的控股公司)時所考慮的。他希望開發「登月計劃」——新的、可能改變世界的業務,這些業務可能需要數年時間才能孵化,並且不一定與Google現有的成功掛鉤。
如今, 其中一些項目已經褪去光環 。即便是其中最知名、最有前途的項目,Waymo 的無人駕駛出租車(Google DeepMind 參與開發了其軟件),也只在鳳凰城、洛杉磯和舊金山實現了全面商業部署。但 Isomorphic Labs 無疑是 Alphabet 級別的項目。Google DeepMind 希望找到更多這樣的項目,並讓它們實現商業可行性:「我們現在有了一些藍圖,」Murdoch 說。
在大型上市公司內部運營一個雄心勃勃的研究實驗室的想法,並不新鮮。Hassabis 對巴爾實驗室和施樂帕洛阿爾托研究中心這兩家最著名的實驗室的歷史瞭如指掌。「這都是我的靈感來源——它們的黃金時代,它們的鼎盛時期——這是我在 DeepMind 嘗試創造的東西,」他說。
即使經過深思熟慮,並擁有Google規模的資源,也沒有什麼是萬無一失的。 科技分析師 Benedict Evans 指出,儘管 AT&T 與巴爾實驗室合作取得了成功——發明了激光、晶體管和光伏電池等——但「建立一個通用的創新實驗室並推出產品一直很睏難。」儘管施樂帕洛阿爾托研究中心是 20 世紀 70 年代許多現代計算元素的誕生地,但它之所以知名,部分原因是施樂未能利用這些元素。
儘管如此,Isomorphic Labs 已經度過了概念驗證階段。今年 1 月,該公司宣佈與製藥巨頭 Eli Lilly 和 Novartis 建立戰略合作夥伴關係,該公司表示,這可能會帶來近 30 億美元的預付款,甚至在它參與研發的藥物可能獲得的特許權使用費之前也是如此。
對於 Alphabet 來說,30 億美元並不算什麼,2023 年該公司的營收為 3070 億美元,主要來自廣告。這筆錢無法滿足該公司近期的需求:為其現有的、無處不在的軟件產品注入突破性的 AI 功能。然而,Hassabis 的預測卻很美好。
「 除了治療可怕的疾病,AI 還有什麼更好的用途呢? 」他問道。「但我認為,到最後,它對 Alphabet 來說也會非常有價值。我認為這並不矛盾。」
一款面向作家和研究人員的 AI 增強型筆記工具,似乎最不可能在網上成名 15 分鐘。但 9 月下旬,Google通過音頻概覽吸引了 TikTok、X 和 YouTube 上的用戶,這是去年推出的免費 NotebookLM 網絡應用的一項新功能。向其輸入參考資料(如 PDF 和網頁),它就會使用 Gemini 在兩個合成主持人之間就任何主題製作類似播客的對話。他們的對話聽起來如此自然——充滿了「嗯」、「啊」、笑話和離題話——以至於不知情的聽眾可能會誤以為這是一些由真人主演的晦澀難懂的節目。
Hassabis 看起來有點興奮,因為他對這種病毒式的喜愛感到高興(這與Google早期的一些 AI 失誤形成了鮮明對比),他說他對這種反應感到開心,有些人稱之為 Gemini 的 ChatGPT 時刻。「在科學領域,你發表論文,得到評論者,然後你會看到引用,諸如此類的事情,」他說,這「在某些方面更直觀,而且非常令人興奮。」
然而,並不是所有人都對科技行業急於開發越來越強大的 LLM、讓基於 LLM 的產品廣泛普及以及越來越接近 AGI 感到興奮。Google內部一直存在緊張局勢,在 Google DeepMind 成立後不久,被稱為「AI 教父」、Google Brain 領導者之一的 Geoffrey Hinton 辭職就是一個很好的例子。 Hinton 說,他離開是為了可以更自由地談論未來的危險 。
未來生命研究所執行董事 Anthony Aguirre 表示,Google最近推出的一系列 Gemini 功能表明,「他們被迫與 LLM 競爭,因為一旦 OpenAI 打開了這扇門,每個人都必須這樣做。」這家非營利組織於 2023 年 3 月發佈了一封公開信,呼籲 LLM 開發暫停六個月,已有 33000 多人簽名。「我認為這有點不幸,因為我非常喜歡設計 AI 來解決我們實際存在的問題的目標。」
儘管Google和其他 AI 公司一樣,沒有遵從暫停研究的呼籲,但這封公開信確實引發了關於 AGI 潛在生存風險的更坦率的討論。今年 5 月,Hassabis 和 Legg、Hinton、OpenAI 首席執行官 Sam Altman、Anthropic 聯合創始人 Dario Amodei 和 Daniela Amodei、微軟首席技術官 Kevin Scott 等簽署了一封令人警醒的 23 字公開信:「減輕 AI 滅絕的風險應該成為全球優先事項,與其他社會規模的風險(如流行病和核戰爭)一樣。」
Hassabis 強調,他並不認為可怕的情況是不可避免的;控制 AGI 可能比一些人擔心的更簡單。 但他解釋說,通過在這封信上署名,他打算發表一份聲明。「我想確保那些談論這些事情的人能夠得到另一群人的保護,他們會說,‘這裏沒什麼可看的,一切都會好起來的——這隻是正常的技術’」他說。
負責任地部署 AI 可能只在最近才成為頭條新聞,但 DeepMind 早在初創時期就深諳這一點:「在我採訪 Legg 時,他談到了智能體和安全的重要性,」早期招募的現任高級責任總監 King 說。2018 年,隨著公司的重點從遊戲 AI 轉向具有更大潛在影響的工作,如 AlphaFold,擁有一支致力於這項工作的團隊,至關重要。
Ibrahim 負責組建這個委員會,她之前曾在英特爾和 Coursera 等公司工作多年,最近才出任首席運營官。起初,「我們實際上稱之為‘稍後命名的委員會’,因為我們不想暗示風險很高,」她回憶道。「我們的目標是,建立一種符合 DeepMind 的文化,但又能引導和解決其中一些問題。」
隨著時間的推移,CTBNL 的正式名稱變成了「安全與責任委員會」。該委員會由來自整個公司的領導組成,負責對正在進行的項目提供反饋,重點是在潛在問題真正出現之前就發現它們。「早期參與是最好的參與方式,這樣實際上有助於塑造和影響工作,」負責任開發總監 Dawn Bloxwich 說道。
這種對 AI 安全的預期方法並沒有阻止Google發佈存在明顯缺陷的功能 ,例如那些搜索 AI 概覽無法理解人類何時在開玩笑而不是提供有用的建議。「對於我們所做的所有測試,我們永遠不會涵蓋世界上每個人可能嘗試的所有事情,因為人類是有創造力的,」King 說,並指出在某些情況下,問題可能更多地與特定產品的實施有關,而不是 Google DeepMind 為其他Google團隊提供的核心技術。「每當我們看到安全問題時,它對我們來說都是有用的,因為這樣我們就可以推動模型開發的變化。」
Google不得不為用戶發現的故障道歉,這凸顯了它在後 ChatGPT 時代推出新功能的緊迫性。 根據 The Information 的 Jon Victor 在 4 月發表的一篇文章,Hassabis 本人對日益強調迅速將 AI 商業化以惠及大眾感到不安,這導致 DeepMind 和 Google Brain 合併為 Google DeepMind。
最初,「我有點擔心會損害我們的研究路線圖,」Hassabis 向我坦言。但隨著時間的推移,他認為,整合Google的 AI 專業知識和技術堆棧的好處已經變得更加明顯:「 我們是一家以研究為主導的公司。我們仍然是一個以研究為主導的部門。 這與我們對世界的影響完全相輔相成。」 Astra 項目就是一個例子。10 月,Google重組讓 Hassabis 負責 Gemini 應用程序,縮小了 Gemini 產品與其底層 LLM 之間的距離。
在倫敦的總部, 走廊牆上掛滿了海報,紀唸著該公司研究人員在 Science 和 Nature 等科學期刊上發表的每一篇論文 。Hassabis 似乎並沒有屈服於短期的競爭壓力。「他一直堅持的一件事,我完全同意他的觀點,那就是我們應該用科學的方法來處理所有這些工作,」James Manyika 說,他從 DeepMind 成立之初就認識 Hassabis,並於 2022 年加入Google,擔任高級副總裁,專注於技術與社會的融合。「我們應該做實驗,我們應該保持嚴謹,我們應該發表論文。」
這就是 Google DeepMind 的「DeepMind 部分」——重視它,是保護它的第一步 。
原文鏈接:
https://www.fastcompany.com/91230713/the-future-according-to-google-deepmind-demis-hassabis-ai-agi-alphafold-alphago
本文來自微信公眾號「學術頭條」,作者:Harry McCracken;整理:阮文韻 ,36氪經授權發佈。