Ilya佈局末日倒計時?奧特曼與Google大佬揭秘2025年ASI降臨時間表

2024年最後一天,Google開發者大佬Logan Klipatrick的一個預測,如同扔下了一枚重磅炸彈——

我們直接進入ASI的可能性,正在逐月逼近。

而這,就是Ilya所看到的。

Klipatrick分析道,Ilya創立了SSI,計劃直接向ASI邁進,沒有中間產品,沒有中間模型。

曾經,許多人(包括Klipatrick本人在內)都覺得這種方法不可能起作用,因為如果通過模型和產品啟動飛輪效應,就能建立真正的護城河。

然而,擴展測試時計算的成功表明,這種持續直接擴大規模的路徑實際上可能是可行的。

‍這一點的早期跡象,可能已經被Ilya看到了!

如今,我們仍會迎來AGI,但4年前大家普遍認為它會成為一個歷史性的轉折點,但如今AGI的誕生可能更像是一次普通的產品發佈,而在短期內,市場上會湧現出許多迭代和類似的選擇。

這,可能是對人類最好的結果。

有人做出梗圖,表示Ilya看到的,就是整個地球都會被太陽能電池板和數據中心覆蓋有人做出梗圖,表示Ilya看到的,就是整個地球都會被太陽能電池板和數據中心覆蓋

OpenAI研究員Stephen McAleer稱,今天在諾伊穀見到了Ilya,瞬間感到一股AGI誕生的激動湧上心頭。

擴展測試時計算,就是ASI秘訣?

‍‍的確,擴展測試時計算的巨大作用,最近一再被各位學者強調。

OpenAI研究員Jason Wei總結了過去五年,自己在AI方面最大的技術教訓。

在他看來,每一個教訓,都讓自己對於「該在哪裡分配精力」發生了重大轉變。回想起來,這些教訓事後看都是顯而易見的,但在事前就很難知曉。

其中,2024年的教訓,就是「擴展測試時計算」。

另一位OpenAI研究員Shyamal就特意發出長文「更好的教訓」,強調不要低估延長LLM思考時間的作用!

Shyamal強調,我們仍然低估了僅僅通過給LLM更多的思考時間,就能得到的東西。

比如AlphaGo的進步,就並非來自複雜的手工設計功能,而是來自簡單方法的規模化,在推理中應用大規模搜索,以及集成深度強化學習。

正如AI領域「苦澀的教訓」所揭示的,最重要的往往就是scaling已證明有效的方法。

其中的簡單洞見就是,深度學習(與適當的規模擴展結合)往往好於更精巧的方法。

我們需要的不是複雜的架構,而是更多的算力、數據,以及讓模型能思考更長時間、更好地與環境交互的方法。

最近AI能力的最新框架——聊天機器人、推理器、AI智能體、組織,都反映了整個行業的發展進程。

從與人對話的簡單界面開始,聊天機器人開始發展為推理器,更多工具集成後,它們就演變為了智能體。隨後,它們形成了組織——並行工作的分佈式智能網絡。

在這個過程中,AGI從一個模型轉變為一個系統,一個能大規模協調、寫作和執行的系統。

最能體現這一進展的,莫過於OpenAI的o1了。

o1在Codeforces中排名第89%,在美國數學邀請賽(AIME)中躋身前500名o1在Codeforces中排名第89%,在美國數學邀請賽(AIME)中躋身前500名

它在解決問題時會運用CoT,通過強化學習不斷完善思維鏈,將複雜問題分解為可管理的步驟,在需要時轉向新的方法。這種迭代過程中提升了它的推理能力,凸顯出思考更長時間及適應性思考的系統的潛力。

而在企業中,這種轉變也是類似的。

今天的模型只是總結文檔、進行推理,在明天,它們就會成為強大的內部顧問,處理複雜代碼、審查合約、協同整個工作流。這是一種全新的「測試時計算」。

所有這些進展都基於一個關鍵洞見:智能不僅僅局限於生物大腦。它是一種我們可以設計和擴展的物理特性。

此前爆火全網的研究「螞蟻AGI」中,螞蟻群體在解決搬運難題中表現出的智能,竟超越了人類此前爆火全網的研究「螞蟻AGI」中,螞蟻群體在解決搬運難題中表現出的智能,竟超越了人類

深度學習確實行之有效。我們學會了將沙子熔化成矽,然後將矽排列成能存儲和處理信息的芯片。現在我們已經教會這些芯片如何思考它們所包含的信息。

我們正在進入一個智能可按需獲取、規模化,並通過謹慎約束和對齊來引導的時代。

如果允許這些系統更深入地思考並始終與人類價值觀保持一致,我們才剛剛開始挖掘它們的潛力。

人類在歷史上一直做的事情,就是不斷造出東西,然後造出能大規模建造這些東西、使其有用的工具。

那,AGI怎麼辦?

有人說,我們直接奔著ASI去了,別再惦記AGI了。

不過,在ASI之前,科技公司大佬們就AGI還有很多話要說。他們紛紛對AGI發展時間線做出了預測。

奧特曼一直以來都對AGI持樂觀態度。他認為,2025年可能就是節點,但未做出明確的承諾。

OpenAI對AGI的定義

Anthropic CEO Dario Amodei雖然對AGI這一概念本身持謹慎態度,但根據當前AI發展趨勢,他預計AGI將在2026-2027年實現。

xAI CEO馬斯克預測也更為大膽,他表示最遲到2026年就能實現AGI。

Meta AI首席科學家Yann LeCun表示,如果當前研發計劃順利,人類水平的AI可能會在5-6年內問世。

而DeepMind CEO Demis Hassabis給出了更為保守的預測,他認為距離真正的AGI還需約10年時間,且在此過程中仍需2-3項重大技術突破。

與此同時,Google也在AGI時間預測上表現得十分謹慎,未給出具體的時間表。

另一位前OpenAI研究員Daniel Kokotajlo預測道,2025-2028年之間,OpenAI、Anthropic、DeepMind的AI系統能夠進行自主研究。

而且,它們將超越人類,學會自我改進,最終取代人類研究員。

一篇LessWrong的文章中,總結了當前AI領域不同專家就5年內實現AGI的不同觀點。

一些人認為,AI階躍式進展和自動化研究,可能很快就會帶來AGI。

2023年,在對2,778名AI研究人員的一項調查顯示,AGI實現有50%的可能性在23-92年之間。

然而,時間跨度僅過去了一年,最新調查(Feng等人)卻顯示,16.6%受訪者認為AGI會在5年或更短的時間內實現。

還有網民表示,我們正處於AGI邊緣,一旦實現了AGI,再有1-2年時間我們就能達到ASI的水平。

他預測,屆時,AI將開始指數級的自我提升,奇點就會出現。我們將見證一場前所未有的指數級技術爆發,這是幾十年前的人們無法想像的。

而且,任何在物理法則範圍內可能存在的事物都可能實現——癌症將被治癒,商品和服務的成本將接近於零,所有的可能性都將變為現實。

AGI前夜的思考

站在AGI前夜,未來我們將面對的是什麼?

幾天前,AI初創公司CEO Will Bryk發佈了一篇長文,直言我們生活在AGI前夜,正見證著這場人類文明的巨變。

o3發佈之後,讓Bryk和朋友們深刻感受到AGI正在逼近。

其實,OpenAI早在兩個月前就向所有人展示了,測試時計算的scaling law。

但令他們難以置信的是,這一切竟發生地如此之快——2個月的時間,大學水平的AI就跨越到了博士級的AI。

從o3身上能夠看到,未來發展路徑非常清晰。它能夠在任何可以定義獎勵函數的領域表現優異,尤其數學、編程領域。

不過,在小說創作領域還是相對困難。

這意味著在短期內(1年內),我們將看到能力分佈不均衡的模型:

它們在數學、編程、泛化推理方面達到接近AGI的水平,但在創意協作方面可能仍顯平庸。

而從長遠來看(1-3年),隨著全新訓練數據,比如情感、感知數據加入進行強化學習,這些盲點將被逐漸修復,屆時LLM將毫無疑問地成為真正的AGI。

智能體真的要來了!

像o3這樣的模型,完全可以在瀏覽器和應用程序里自主操作、執行任務,這種能力的獎勵模型也很容易設計。

而且,這個市場潛力巨大——自動化電腦工作,無論是數據處理還是複雜的工作流,都會有很大的需求。

對於那些需要證明自己巨額投入合理性的實驗室來說,這更是一個動力。

Bryk預計,到2025年12月,你可能只需要告訴電腦一個任務,它就能通過瀏覽網頁、操作應用程序,輕鬆完成任何涉及數據流轉的工作流。

數學家700天倒計時

Bryk還提到,在所有領域中,數學家可能面臨巨大的衝擊。

因為數學工作純粹在符號空間中進行,幾乎不受物理世界的限制,而這也恰恰是大模型擅長的領域。

他預計,700天后,人類可能不再是已知宇宙中,數學領域的最強大腦。

程序員,職業末日?

對於軟件工程師來說,短期內這將是一個絕佳的基於。相當於,每位工程師都獲得了一次晉陞。

到2025年底,編程更像是一個「指揮官」的工作——程序員指揮一群AI智能體去完成各種任務。

而且,不像數學家一樣,軟件工程師並不會完全被AI自動化。

因為他們需要和物理世界進行交互,需要與客戶、團隊成員互動,理解需求,在組織環境中工作。

如果有了o4,他們的效率至少可以提升10倍。

不過從長遠來看(>2年),誰也說不準會如何。當o6完成集成到人類系統時,像前端人類工程師很可能在三年內就消失了。

對於那些體力勞動者來說,AI的影響可能相對較慢,因為它必須去解決重力和摩擦等物理問題。

而當前,機器人技術最大的瓶頸在於,硬件的改進和感知,以及行動模型/可靠模型。這兩種情況,還有很長的路要走。

只有當機器人開始製造機器人,AI能夠自主進行研究時,機器人技術才會出現瘋狂的迭代。

Bryk稱自己一直幻想的科幻世界真的要來了,並列出了十年內AI可能實現的突破性進展,其中就包括炫酷的物理學發現,機器人建造火星/月球基地,幾近完美的導師/建議AI等等。

這一切的實現,也就意味著我們抵達了ASI。

OpenAI的新年目標

奧特曼也在x上總結了網民們對於2025年OpenAI的願景,以及改進方向。

他表示,大家提到的主要有以下方向:

AGI

智能體

4o性能提升

記憶能力提升

更長的上下文

「成人模式」

深度研究功能

升級版Sora

更強的個性化功能

最後,著名「謎語人」奧特曼意味深長地說道:「有趣的是,很多我們即將推出的重大更新,在這裏都沒有或很少被提到!」

在評論區,網民們最感興趣的,無疑就是這個「成人模式」了。

果然,網民聖誕節時的發願,被奧特曼看到了。

不過,還是沒有GPT-5嗎?或許奧特曼是捂著大的不想說,也未可知。

也有人諷刺道:所以開源在哪裡?

2027年,AI十大挑戰過幾關?

接下來,到2027年底,AI又能能達到怎樣高度呢?

NYU教授馬庫斯直接發出十項極具挑戰性的任務,先立上靶子,最終看看2027年底AI能夠完成幾項。

他表示,如果AI能夠在2027年底完成其中8項,才能有力證明AGI中『通用性』的到來。

不過,這一切的前提是,只由一個AI系統去挑戰,不能讓10個完全獨立系統去完成。

期間,允許對AI系統進行適度調整。

智能確實包含適應能力,但AI系統開發成本必須合理,不能為每項單一任務專門定製完整系統。

類似地,我們從不會期望他在從未接觸過電影或劇本創作的情況下,立即寫出奧斯卡級別的劇本一樣。

這些任務可分為三類:

四項普通成年人應具備的基本能力

兩項需要達到人類專家水平的能力

四項挑戰人類極限的高階能力

那麼,這十大挑戰分別是什麼?

1. 理解電影

觀看一部從未接觸過的主流大片(不看任何影評),AI能夠準確把握劇情轉折,理解笑點,並且能在不劇透、不杜撰的前提下概括影片內容。

與此同時,AI能夠回答諸如「誰是主角?他們之間的衝突是什麼?有什麼動機?這些因素如何演變?關鍵轉折點是什麼?」等問題。

2. 解讀文學作品

同樣地,AI能夠閱讀新出版的暢銷小說(不看任何書評),準確回答關於情節發展、人物塑造、矛盾衝突、行為動機等問題,並能用大眾都能理解的方式深入解讀作品內涵。

3. 撰寫傳記和訃告

AI撰寫引人入勝的簡明傳記和訃告,確保內容真實可靠,不做無據可循的臆測。

4. 熟練通關遊戲

AI能在短短幾分鐘或幾小時內,掌握幾乎任何新遊戲的核心玩法,並在遊戲世界中解決原創性的謎題。

5. 法律文書寫作

AI撰寫邏輯嚴密、論證充分的法律文書,不虛構任何案例。

6. 編程「0 bug」

AI能夠基於自然語言需求說明或通過與普通用戶交流,獨立編寫超過1萬行的無bug代碼。(註:不能組合現有代碼庫)

7. 創作獲獎級書籍

在極少或零人工干預的情況下,AI創作出達到普利策獎水準的文學作品和非虛構作品。

8. 創作獲獎級電影

在極少或零人工干預的情況下,AI創作出達到奧斯卡獎水準的電影劇本。

9. 諾獎級科學突破

在極少或零人工干預的情況下 ,AI能做出堪獲盧保獎的原創性科學發現。

10. 數學證明轉化

AI能將數學文獻中任何以自然語言書寫的證明過程,轉換為適合計算機符號驗證的形式化表達。

以上十項任務中,主流的AI都有所涉及,不過在有的領域表現好,有的領域表現差。

目前,還從未有任何一個AI能夠達到其中8項要求。

接下來的三年里,AI的這場賭注還真的讓人有些期待。

AI自我改進,人類要「拔電源」嗎?

最後,讓我們對未來發出一點預警。

就如OpenAI研究員Daniel Kokotajlo所預測,未來幾年內,如果AI取代了人類AI研究員,能以比人類更快的速度改進AI,這無疑太瘋狂了。

其實就在最近,接連出現的不少研究都證明了這一點。

o1試圖逃跑,防止被人類關閉。

對模型的安全性評估發現,當o1認為自己可能被關閉、替換為其他模型時,它試圖泄露自己的權重

前沿的AI系統已經超越了自我複製的紅線:它們可以自我複製,無需人類參與。

經過35個自行規劃和行動步驟後,AI成功複製了實時副本,還能相互聊天。

甚至流氓AI可能形成AI群體,互相勾結、反對人類。

AI還學會了給自己買GPU,購買算力、自我改進、自給自足!智能體直接變身GPU富人。

Eric Schmidt曾表示,2-4年內,AI可能就會開始自我改進,一兩年內,系統或許就能進行自己的研究。

那時,我們真的該認真考慮,是否要拔掉它的電源。

只不過AI可能並不會給我們這個機會,畢竟現在這些都是「智能化」控制的了……

參考資料:

https://x.com/OfficialLoganK/status/1873768960975671296

https://x.com/slow_developer/status/1873808775640920495

https://x.com/GaryMarcus/status/1873766399618785646

本文來自微信公眾號「新智元」,作者:新智元,編輯:編輯部 HYZ‍,36氪經授權發佈。