Ilya佈局末日倒計時？奧特曼與Google大佬揭秘2025年ASI降臨時間表

12月31日 13:45 新浪網 tech-auto-hilite

2024年最後一天，Google開發者大佬Logan Klipatrick的一個預測，如同扔下了一枚重磅炸彈——

我們直接進入ASI的可能性，正在逐月逼近。

而這，就是Ilya所看到的。

Klipatrick分析道，Ilya創立了SSI，計劃直接向ASI邁進，沒有中間產品，沒有中間模型。

曾經，許多人（包括Klipatrick本人在內）都覺得這種方法不可能起作用，因為如果通過模型和產品啟動飛輪效應，就能建立真正的護城河。

然而，擴展測試時計算的成功表明，這種持續直接擴大規模的路徑實際上可能是可行的。

‍這一點的早期跡象，可能已經被Ilya看到了！

如今，我們仍會迎來AGI，但4年前大家普遍認為它會成為一個歷史性的轉折點，但如今AGI的誕生可能更像是一次普通的產品發佈，而在短期內，市場上會湧現出許多迭代和類似的選擇。

這，可能是對人類最好的結果。

有人做出梗圖，表示Ilya看到的，就是整個地球都會被太陽能電池板和數據中心覆蓋

有人做出梗圖，表示Ilya看到的，就是整個地球都會被太陽能電池板和數據中心覆蓋

OpenAI研究員Stephen McAleer稱，今天在諾伊穀見到了Ilya，瞬間感到一股AGI誕生的激動湧上心頭。

擴展測試時計算，就是ASI秘訣？

‍‍的確，擴展測試時計算的巨大作用，最近一再被各位學者強調。

OpenAI研究員Jason Wei總結了過去五年，自己在AI方面最大的技術教訓。

在他看來，每一個教訓，都讓自己對於「該在哪裡分配精力」發生了重大轉變。回想起來，這些教訓事後看都是顯而易見的，但在事前就很難知曉。

其中，2024年的教訓，就是「擴展測試時計算」。

另一位OpenAI研究員Shyamal就特意發出長文「更好的教訓」，強調不要低估延長LLM思考時間的作用！

Shyamal強調，我們仍然低估了僅僅通過給LLM更多的思考時間，就能得到的東西。

比如AlphaGo的進步，就並非來自複雜的手工設計功能，而是來自簡單方法的規模化，在推理中應用大規模搜索，以及集成深度強化學習。

正如AI領域「苦澀的教訓」所揭示的，最重要的往往就是scaling已證明有效的方法。

其中的簡單洞見就是，深度學習（與適當的規模擴展結合）往往好於更精巧的方法。

我們需要的不是複雜的架構，而是更多的算力、數據，以及讓模型能思考更長時間、更好地與環境交互的方法。

最近AI能力的最新框架——聊天機器人、推理器、AI智能體、組織，都反映了整個行業的發展進程。

從與人對話的簡單界面開始，聊天機器人開始發展為推理器，更多工具集成後，它們就演變為了智能體。隨後，它們形成了組織——並行工作的分佈式智能網絡。

在這個過程中，AGI從一個模型轉變為一個系統，一個能大規模協調、寫作和執行的系統。

最能體現這一進展的，莫過於OpenAI的o1了。

o1在Codeforces中排名第89%，在美國數學邀請賽（AIME）中躋身前500名

o1在Codeforces中排名第89%，在美國數學邀請賽（AIME）中躋身前500名

它在解決問題時會運用CoT，通過強化學習不斷完善思維鏈，將複雜問題分解為可管理的步驟，在需要時轉向新的方法。這種迭代過程中提升了它的推理能力，凸顯出思考更長時間及適應性思考的系統的潛力。

而在企業中，這種轉變也是類似的。

今天的模型只是總結文檔、進行推理，在明天，它們就會成為強大的內部顧問，處理複雜代碼、審查合約、協同整個工作流。這是一種全新的「測試時計算」。

所有這些進展都基於一個關鍵洞見：智能不僅僅局限於生物大腦。它是一種我們可以設計和擴展的物理特性。

此前爆火全網的研究「螞蟻AGI」中，螞蟻群體在解決搬運難題中表現出的智能，竟超越了人類

此前爆火全網的研究「螞蟻AGI」中，螞蟻群體在解決搬運難題中表現出的智能，竟超越了人類

深度學習確實行之有效。我們學會了將沙子熔化成矽，然後將矽排列成能存儲和處理信息的芯片。現在我們已經教會這些芯片如何思考它們所包含的信息。

我們正在進入一個智能可按需獲取、規模化，並通過謹慎約束和對齊來引導的時代。

如果允許這些系統更深入地思考並始終與人類價值觀保持一致，我們才剛剛開始挖掘它們的潛力。

人類在歷史上一直做的事情，就是不斷造出東西，然後造出能大規模建造這些東西、使其有用的工具。

那，AGI怎麼辦？

有人說，我們直接奔著ASI去了，別再惦記AGI了。

不過，在ASI之前，科技公司大佬們就AGI還有很多話要說。他們紛紛對AGI發展時間線做出了預測。

奧特曼一直以來都對AGI持樂觀態度。他認為，2025年可能就是節點，但未做出明確的承諾。

OpenAI對AGI的定義

Anthropic CEO Dario Amodei雖然對AGI這一概念本身持謹慎態度，但根據當前AI發展趨勢，他預計AGI將在2026-2027年實現。

xAI CEO馬斯克預測也更為大膽，他表示最遲到2026年就能實現AGI。

Meta AI首席科學家Yann LeCun表示，如果當前研發計劃順利，人類水平的AI可能會在5-6年內問世。

而DeepMind CEO Demis Hassabis給出了更為保守的預測，他認為距離真正的AGI還需約10年時間，且在此過程中仍需2-3項重大技術突破。

與此同時，Google也在AGI時間預測上表現得十分謹慎，未給出具體的時間表。

另一位前OpenAI研究員Daniel Kokotajlo預測道，2025-2028年之間，OpenAI、Anthropic、DeepMind的AI系統能夠進行自主研究。

而且，它們將超越人類，學會自我改進，最終取代人類研究員。

一篇LessWrong的文章中，總結了當前AI領域不同專家就5年內實現AGI的不同觀點。

一些人認為，AI階躍式進展和自動化研究，可能很快就會帶來AGI。

2023年，在對2,778名AI研究人員的一項調查顯示，AGI實現有50%的可能性在23-92年之間。

然而，時間跨度僅過去了一年，最新調查（Feng等人）卻顯示，16.6%受訪者認為AGI會在5年或更短的時間內實現。

還有網民表示，我們正處於AGI邊緣，一旦實現了AGI，再有1-2年時間我們就能達到ASI的水平。

他預測，屆時，AI將開始指數級的自我提升，奇點就會出現。我們將見證一場前所未有的指數級技術爆發，這是幾十年前的人們無法想像的。

而且，任何在物理法則範圍內可能存在的事物都可能實現——癌症將被治癒，商品和服務的成本將接近於零，所有的可能性都將變為現實。

AGI前夜的思考

站在AGI前夜，未來我們將面對的是什麼？

幾天前，AI初創公司CEO Will Bryk發佈了一篇長文，直言我們生活在AGI前夜，正見證著這場人類文明的巨變。

o3發佈之後，讓Bryk和朋友們深刻感受到AGI正在逼近。

其實，OpenAI早在兩個月前就向所有人展示了，測試時計算的scaling law。

但令他們難以置信的是，這一切竟發生地如此之快——2個月的時間，大學水平的AI就跨越到了博士級的AI。

從o3身上能夠看到，未來發展路徑非常清晰。它能夠在任何可以定義獎勵函數的領域表現優異，尤其數學、編程領域。

不過，在小說創作領域還是相對困難。

這意味著在短期內（1年內），我們將看到能力分佈不均衡的模型：

它們在數學、編程、泛化推理方面達到接近AGI的水平，但在創意協作方面可能仍顯平庸。

而從長遠來看（1-3年），隨著全新訓練數據，比如情感、感知數據加入進行強化學習，這些盲點將被逐漸修復，屆時LLM將毫無疑問地成為真正的AGI。

智能體真的要來了！

像o3這樣的模型，完全可以在瀏覽器和應用程序里自主操作、執行任務，這種能力的獎勵模型也很容易設計。

而且，這個市場潛力巨大——自動化電腦工作，無論是數據處理還是複雜的工作流，都會有很大的需求。

對於那些需要證明自己巨額投入合理性的實驗室來說，這更是一個動力。

Bryk預計，到2025年12月，你可能只需要告訴電腦一個任務，它就能通過瀏覽網頁、操作應用程序，輕鬆完成任何涉及數據流轉的工作流。

數學家700天倒計時

Bryk還提到，在所有領域中，數學家可能面臨巨大的衝擊。

因為數學工作純粹在符號空間中進行，幾乎不受物理世界的限制，而這也恰恰是大模型擅長的領域。

他預計，700天后，人類可能不再是已知宇宙中，數學領域的最強大腦。

程序員，職業末日？

對於軟件工程師來說，短期內這將是一個絕佳的基於。相當於，每位工程師都獲得了一次晉陞。

到2025年底，編程更像是一個「指揮官」的工作——程序員指揮一群AI智能體去完成各種任務。

而且，不像數學家一樣，軟件工程師並不會完全被AI自動化。

因為他們需要和物理世界進行交互，需要與客戶、團隊成員互動，理解需求，在組織環境中工作。

如果有了o4，他們的效率至少可以提升10倍。

不過從長遠來看（>2年），誰也說不準會如何。當o6完成集成到人類系統時，像前端人類工程師很可能在三年內就消失了。

對於那些體力勞動者來說，AI的影響可能相對較慢，因為它必須去解決重力和摩擦等物理問題。

而當前，機器人技術最大的瓶頸在於，硬件的改進和感知，以及行動模型/可靠模型。這兩種情況，還有很長的路要走。

只有當機器人開始製造機器人，AI能夠自主進行研究時，機器人技術才會出現瘋狂的迭代。

Bryk稱自己一直幻想的科幻世界真的要來了，並列出了十年內AI可能實現的突破性進展，其中就包括炫酷的物理學發現，機器人建造火星/月球基地，幾近完美的導師/建議AI等等。

這一切的實現，也就意味著我們抵達了ASI。

OpenAI的新年目標

奧特曼也在x上總結了網民們對於2025年OpenAI的願景，以及改進方向。

他表示，大家提到的主要有以下方向：

AGI

智能體

4o性能提升

記憶能力提升

更長的上下文

「成人模式」

深度研究功能

升級版Sora

更強的個性化功能

最後，著名「謎語人」奧特曼意味深長地說道：「有趣的是，很多我們即將推出的重大更新，在這裏都沒有或很少被提到！」

在評論區，網民們最感興趣的，無疑就是這個「成人模式」了。

果然，網民聖誕節時的發願，被奧特曼看到了。

不過，還是沒有GPT-5嗎？或許奧特曼是捂著大的不想說，也未可知。

也有人諷刺道：所以開源在哪裡？

2027年，AI十大挑戰過幾關？

接下來，到2027年底，AI又能能達到怎樣高度呢？

NYU教授馬庫斯直接發出十項極具挑戰性的任務，先立上靶子，最終看看2027年底AI能夠完成幾項。

他表示，如果AI能夠在2027年底完成其中8項，才能有力證明AGI中『通用性』的到來。

不過，這一切的前提是，只由一個AI系統去挑戰，不能讓10個完全獨立系統去完成。

期間，允許對AI系統進行適度調整。

智能確實包含適應能力，但AI系統開發成本必須合理，不能為每項單一任務專門定製完整系統。

類似地，我們從不會期望他在從未接觸過電影或劇本創作的情況下，立即寫出奧斯卡級別的劇本一樣。

這些任務可分為三類：

四項普通成年人應具備的基本能力

兩項需要達到人類專家水平的能力

四項挑戰人類極限的高階能力

那麼，這十大挑戰分別是什麼？

1. 理解電影

觀看一部從未接觸過的主流大片（不看任何影評），AI能夠準確把握劇情轉折，理解笑點，並且能在不劇透、不杜撰的前提下概括影片內容。

與此同時，AI能夠回答諸如「誰是主角？他們之間的衝突是什麼？有什麼動機？這些因素如何演變？關鍵轉折點是什麼？」等問題。

2. 解讀文學作品

同樣地，AI能夠閱讀新出版的暢銷小說（不看任何書評），準確回答關於情節發展、人物塑造、矛盾衝突、行為動機等問題，並能用大眾都能理解的方式深入解讀作品內涵。

3. 撰寫傳記和訃告

AI撰寫引人入勝的簡明傳記和訃告，確保內容真實可靠，不做無據可循的臆測。

4. 熟練通關遊戲

AI能在短短幾分鐘或幾小時內，掌握幾乎任何新遊戲的核心玩法，並在遊戲世界中解決原創性的謎題。

5. 法律文書寫作

AI撰寫邏輯嚴密、論證充分的法律文書，不虛構任何案例。

6. 編程「0 bug」

AI能夠基於自然語言需求說明或通過與普通用戶交流，獨立編寫超過1萬行的無bug代碼。（註：不能組合現有代碼庫）

7. 創作獲獎級書籍

在極少或零人工干預的情況下，AI創作出達到普利策獎水準的文學作品和非虛構作品。

8. 創作獲獎級電影

在極少或零人工干預的情況下，AI創作出達到奧斯卡獎水準的電影劇本。

9. 諾獎級科學突破

在極少或零人工干預的情況下，AI能做出堪獲盧保獎的原創性科學發現。

10. 數學證明轉化

AI能將數學文獻中任何以自然語言書寫的證明過程，轉換為適合計算機符號驗證的形式化表達。

以上十項任務中，主流的AI都有所涉及，不過在有的領域表現好，有的領域表現差。

目前，還從未有任何一個AI能夠達到其中8項要求。

接下來的三年里，AI的這場賭注還真的讓人有些期待。

AI自我改進，人類要「拔電源」嗎？

最後，讓我們對未來發出一點預警。

就如OpenAI研究員Daniel Kokotajlo所預測，未來幾年內，如果AI取代了人類AI研究員，能以比人類更快的速度改進AI，這無疑太瘋狂了。

其實就在最近，接連出現的不少研究都證明了這一點。

o1試圖逃跑，防止被人類關閉。

對模型的安全性評估發現，當o1認為自己可能被關閉、替換為其他模型時，它試圖泄露自己的權重

前沿的AI系統已經超越了自我複製的紅線：它們可以自我複製，無需人類參與。

經過35個自行規劃和行動步驟後，AI成功複製了實時副本，還能相互聊天。

甚至流氓AI可能形成AI群體，互相勾結、反對人類。

AI還學會了給自己買GPU，購買算力、自我改進、自給自足！智能體直接變身GPU富人。

Eric Schmidt曾表示，2-4年內，AI可能就會開始自我改進，一兩年內，系統或許就能進行自己的研究。

那時，我們真的該認真考慮，是否要拔掉它的電源。

只不過AI可能並不會給我們這個機會，畢竟現在這些都是「智能化」控制的了……

參考資料：

https://x.com/OfficialLoganK/status/1873768960975671296

https://x.com/slow_developer/status/1873808775640920495

https://x.com/GaryMarcus/status/1873766399618785646

本文來自微信公眾號「新智元」，作者：新智元，編輯：編輯部 HYZ‍，36氪經授權發佈。