奧特曼：ChatGPT不是AGI！OpenAI最強開源模型直擊DeepSeek

04月13日 12:55 新浪網 tech-auto-hilite

新智元報導

編輯：桃子犀牛

【新智元導讀】代碼截圖泄露，滿血版o3、o4-mini鎖定下週！更勁爆的是，一款據稱是OpenAI的神秘模型一夜爆紅，每日處理高達260億token，是Claude用量4倍。奧特曼在TED放話：將推超強開源模型，直面DeepSeek挑戰。

近了，近了！

全網多個流出的代碼截圖顯示，滿血版o3、o4-mini，以及o4-mini high，有極大概率在下週發佈。

不僅如此，在OpenRouter平台上，一款神秘模型Optimus Alpha（ELO得分1387）直接霸榜，據稱就是o4-mini。

另一款Quasar模型也殺入競技場TOP 5，奧特曼對其亮眼的表現做出了回應

另一款Quasar模型也殺入競技場TOP 5，奧特曼對其亮眼的表現做出了回應

另一款Quasar模型也殺入競技場TOP 5，奧特曼對其亮眼的表現做出了回應

這款模型最大亮點在於，上下文長達100萬token，一舉超越了Claude 3.7 Sonnet。

更令人震驚的是，OpenRouter數據顯示，Optimus Alpha才上線沒幾天一夜爆紅，每日處理token數量高達260億。

另一邊，OpenAI正在為開源模型做準備，上週內部召開討論會，邀請了AI社區大佬提建議。

在TED最新對談中，奧特曼再次回應了DeepSeek，「我們正在開發一款強大且媲美頂尖LLM的開源模型」。

不論是o4系的發佈，還是OpenAI開源模型登場，都足以讓AI圈興奮一段時間了。

o4系模型出世，直接霸榜？

大佬Matthew Berman從更多公開測試的蛛絲馬跡中，發現了神秘模型Optimus Alpha的一些亮點。

卓越的多文件協同處理能力
出眾的設計美學感知
對複雜系統的直覺式理解
閃電般的響應速度
自如切換抽像層級的能力

在Aider多語言編程方面，可與o3-mini-medium、Grok 3相媲美，拿下53%的分數。

創意寫作v3基準上，它甚至擊敗了Gemini 2.5 Pro，ELO得分1320.8。另外，在SQL的生成上，平均得分為0.830，其中80%為滿分。

可以明確的是，新模型專為編程和技術任務構建。在SQL查詢生成、Web開發和系統設計方面的性能，均超過了任何公開可用的工具。

比如，在Roo Code社區中，Optimus Alpha使用量已是Claude模型的4倍，深受廣大開發者歡迎。

在編碼測試中，Matthew給出一個簡單的指令——為我創建一個帶有功能購物車的電子商務網站。

Optimus Alpha便智能地設計出完整的UI界面，還製作出了「抽屜式購物車」，要知道大多數AI都會失敗。

再比如，一次性生成貪吃蛇遊戲。

Optimus Alpha可以做到自定義漸變色用於貪吃蛇，深綠色的頭部可便於視覺區分。

而且，簡潔直觀的操控界面，完整的遊戲機制，都印證了其編碼能力的強大。

最關鍵的是，代碼生成速度令人驚歎，這體驗就像隨時召喚一位世界頂級工程師。

更強的o4系模型已預定，那麼關於開源模型，OpenAI又有怎樣的規劃呢？

不如，一起看看TED大會上，奧特曼如何回應的AI開源競賽，以及關於當前爆火GPT-4o生圖、AI下一個突破、對就業創造力影響。

GPT-4o承包創意工作，人類怎麼辦？

週五，奧特曼現身溫哥華TED大會現場，與TED負責人Chris Anderson進行了一場深入的對談。

對談一開始，Anderson用最近爆火的Sora生圖功能生成了一張圖片，圖片中奧特曼正向他分享著驚人的信息。

Anderson表示這圖畫的還不錯，至少是個B+。接著他又展示了一張圖片，這次他讓Sora描繪一下智能和意識的區別。

這張圖真的讓Anderson感到震驚了，因為這顯然不只是圖像的生成，它似乎理解了你想要什麼。

對此奧特曼表示，這個圖像生成的功能是GPT-4o的一部分，包含裡面的所有智能。

「這也是為什麼它能做出這些讓人驚歎的事情。」

面對如此智能的AI，Anderson不禁問奧特曼，「我的未來該怎麼辦？」。

奧特曼說人們對此有兩種看法。一種是「天啊，它把我做的事全幹了，我該咋辦？」。

而另一種是「每次技術革命都這樣」，新的工具能提升人的能力，讓人做的更多。

「所以適應起來應該不難。」

這時，Anderson突然冒出一句：「這會不會是個版權問題啊？」

觀眾哄堂大笑，現場還夾雜著掌聲。看來大家都對這個問題很感興趣。

奧特曼的回應是，如果藝術家願意把自己的風格授權給別人用，那麼可以為他們設計分成機制。

也就是說，未來不只是「版權」問題這麼簡單了，「風格」也將會成為重要的車資產。

不過，真正棘手的，在海量的AI作品面前，要怎麼區分「靈感借鑒」和「抄襲模仿」呢？

OpenAI將推最強開源LLM

Anderson問奧特曼，DeepSeek的出現有沒有讓你有點慌？

奧特曼認為開源很重要。就在昨晚，他們還在開會討論開源模型的參數和方向。

OpenAI正打算開源一款非常強大的模型，性能比現在所有的開源模型都要好。

奧特曼還強調了一下，雖然他們在開源方面行動的有點晚，但他們會做的很好。

雖然DeepSeek形勢迅猛，但並沒有影響ChatGPT的增長速度。

「我從來沒見過任何一家公司有這種增長速度。ChatGPT的增長簡直瘋狂！」奧特曼表示。

根據上次公佈的數據，OpenAI每週有5億的活躍用戶，而且還在飛速增長。

奧特曼還提到了新的「記憶」功能。模型會慢慢瞭解你，陪你走過人生的不同階段。

他希望OpenAI能繼續保持專注，做出這個領域里最頂尖的產品。

AI雙突破，2年研究半天搞掂

奧特曼預計AI將在兩個方向上有重大的突破。

首先是在科學領域。

奧特曼說他相信科學發現是讓人們生活越來越好的最重要推動力。有了新發現，我們就能用更少的資源做更多的事，把「可能」的邊界往外推。

OpenAI最新的模型已經開始讓科學家們興奮了，他們的效率比以前高得多。

借助AI工具，很快會開始看到在對抗疾病方面的一些實質性進展。

至於物理學，奧特曼說可能需要更長時間，但很期待。

另一個重要方向是軟件開發。

奧特曼說未來幾個月，這個領域就會發生翻天覆地的變化。

他說一些工程師現在一個下午就能完成以前兩年才能做完的工作！

對於外界的一些傳聞，奧特曼說他們並沒有偷偷藏著有意識的模型，以及能自我改進的模型。

奧特曼還對他們模型的安全性很有信心。

「有人會說各種事情，但現在全球大概有10%的人正在使用我們的系統，我們對自己的安全記錄非常驕傲。」

他還透露，OpenAI已經準備好了一旦發現危險就迅速叫停的機制。

這就是一個不斷試錯的過程：把系統推向現實世界，在風險還相對可控的時候收集反饋，發現問題，然後解決。

ChatGPT不是AGI

奧特曼說ChatGPT還不能算是AGI，因為它還不能自己持續學習、提升。

它也沒辦法在自己不擅長的領域主動變強，自主地探索新科學、更新知識庫。

甚至還不能像人類一樣坐在電腦前完成各種知識型工作。

對於到底什麼是AGI這個問題，奧特曼直接講了個笑話：「你把10個OpenAI的研究員關一個屋子裡，讓他們定義AGI，估計能整出14個不同的答案。」

目前都沒有個統一的說法。

所以比起「AGI什麼時候來」，更重要的是認識到我們正處在AI能力指數級增長的曲線上。

你可以說「這是我眼中的AGI」，別人可以說「超級智能在那兒」，但不管咋樣，我們都得面對這個超級厲害的系統帶來的好處，同時想辦法讓它安全。

整場近一小時對談中，奧特曼其他的一些精彩觀點：

要盯緊AI智能體的安全問題。
奧特曼分享成為父親對他個人產生了深遠的影響，他否認了AI會對他的孩子未來構成風險，但也承認有更大的責任去塑造一個對孩子有積極影響的世界。
奧特曼還描述了一個未來，AI將比他的孩子更聰明，但他認為這是一個好事。持續的創新、豐富的資源和智能AI將會無縫融入日常生活，未來一代人將會覺得當前人們又辛苦又落後。

參考資料：

https://x.com/TheMattBerman/status/1910813233008509191

https://x.com/FutureJurvetson/status/1910820537783423078