奧特曼:ChatGPT不是AGI!OpenAI最強開源模型直擊DeepSeek

新智元報導  

編輯:桃子 犀牛

【新智元導讀】代碼截圖泄露,滿血版o3、o4-mini鎖定下週!更勁爆的是,一款據稱是OpenAI的神秘模型一夜爆紅,每日處理高達260億token,是Claude用量4倍。奧特曼在TED放話:將推超強開源模型,直面DeepSeek挑戰。

近了,近了!

全網多個流出的代碼截圖顯示,滿血版o3、o4-mini,以及o4-mini high,有極大概率在下週發佈。

不僅如此,在OpenRouter平台上,一款神秘模型Optimus Alpha(ELO得分1387)直接霸榜,據稱就是o4-mini。

另一款Quasar模型也殺入競技場TOP 5,奧特曼對其亮眼的表現做出了回應
另一款Quasar模型也殺入競技場TOP 5,奧特曼對其亮眼的表現做出了回應另一款Quasar模型也殺入競技場TOP 5,奧特曼對其亮眼的表現做出了回應

這款模型最大亮點在於,上下文長達100萬token,一舉超越了Claude 3.7 Sonnet。

更令人震驚的是,OpenRouter數據顯示,Optimus Alpha才上線沒幾天一夜爆紅,每日處理token數量高達260億。

另一邊,OpenAI正在為開源模型做準備,上週內部召開討論會,邀請了AI社區大佬提建議。

在TED最新對談中,奧特曼再次回應了DeepSeek,「我們正在開發一款強大且媲美頂尖LLM的開源模型」。

不論是o4系的發佈,還是OpenAI開源模型登場,都足以讓AI圈興奮一段時間了。

o4系模型出世,直接霸榜?

大佬Matthew Berman從更多公開測試的蛛絲馬跡中,發現了神秘模型Optimus Alpha的一些亮點。

  • 卓越的多文件協同處理能力

  • 出眾的設計美學感知

  • 對複雜系統的直覺式理解

  • 閃電般的響應速度

  • 自如切換抽像層級的能力

在Aider多語言編程方面,可與o3-mini-medium、Grok 3相媲美,拿下53%的分數。

創意寫作v3基準上,它甚至擊敗了Gemini 2.5 Pro,ELO得分1320.8。另外,在SQL的生成上,平均得分為0.830,其中80%為滿分。

可以明確的是,新模型專為編程和技術任務構建。在SQL查詢生成、Web開發和系統設計方面的性能,均超過了任何公開可用的工具。

比如,在Roo Code社區中,Optimus Alpha使用量已是Claude模型的4倍,深受廣大開發者歡迎。

在編碼測試中,Matthew給出一個簡單的指令——為我創建一個帶有功能購物車的電子商務網站。

Optimus Alpha便智能地設計出完整的UI界面,還製作出了「抽屜式購物車」,要知道大多數AI都會失敗。

再比如,一次性生成貪吃蛇遊戲。

Optimus Alpha可以做到自定義漸變色用於貪吃蛇,深綠色的頭部可便於視覺區分。

而且,簡潔直觀的操控界面,完整的遊戲機制,都印證了其編碼能力的強大。

最關鍵的是,代碼生成速度令人驚歎,這體驗就像隨時召喚一位世界頂級工程師。

更強的o4系模型已預定,那麼關於開源模型,OpenAI又有怎樣的規劃呢?

不如,一起看看TED大會上,奧特曼如何回應的AI開源競賽,以及關於當前爆火GPT-4o生圖、AI下一個突破、對就業創造力影響。

GPT-4o承包創意工作,人類怎麼辦?

週五,奧特曼現身溫哥華TED大會現場,與TED負責人Chris Anderson進行了一場深入的對談。

對談一開始,Anderson用最近爆火的Sora生圖功能生成了一張圖片,圖片中奧特曼正向他分享著驚人的信息。

Anderson表示這圖畫的還不錯,至少是個B+。接著他又展示了一張圖片,這次他讓Sora描繪一下智能和意識的區別。

這張圖真的讓Anderson感到震驚了,因為這顯然不只是圖像的生成,它似乎理解了你想要什麼。

對此奧特曼表示,這個圖像生成的功能是GPT-4o的一部分,包含裡面的所有智能。

「這也是為什麼它能做出這些讓人驚歎的事情。」

面對如此智能的AI,Anderson不禁問奧特曼,「我的未來該怎麼辦?」。

奧特曼說人們對此有兩種看法。一種是「天啊,它把我做的事全幹了,我該咋辦?」。

而另一種是「每次技術革命都這樣」,新的工具能提升人的能力,讓人做的更多。

「所以適應起來應該不難。」

這時,Anderson突然冒出一句:「這會不會是個版權問題啊?」

觀眾哄堂大笑,現場還夾雜著掌聲。看來大家都對這個問題很感興趣。

奧特曼的回應是,如果藝術家願意把自己的風格授權給別人用,那麼可以為他們設計分成機制。

也就是說,未來不只是「版權」問題這麼簡單了,「風格」也將會成為重要的車資產。

不過,真正棘手的,在海量的AI作品面前,要怎麼區分「靈感借鑒」和「抄襲模仿」呢?

OpenAI將推最強開源LLM

Anderson問奧特曼,DeepSeek的出現有沒有讓你有點慌?

奧特曼認為開源很重要。就在昨晚,他們還在開會討論開源模型的參數和方向。

OpenAI正打算開源一款非常強大的模型,性能比現在所有的開源模型都要好。

奧特曼還強調了一下,雖然他們在開源方面行動的有點晚,但他們會做的很好。

雖然DeepSeek形勢迅猛,但並沒有影響ChatGPT的增長速度。

「我從來沒見過任何一家公司有這種增長速度。ChatGPT的增長簡直瘋狂!」奧特曼表示。

根據上次公佈的數據,OpenAI每週有5億的活躍用戶,而且還在飛速增長。

奧特曼還提到了新的「記憶」功能。模型會慢慢瞭解你,陪你走過人生的不同階段。

他希望OpenAI能繼續保持專注,做出這個領域里最頂尖的產品。

AI雙突破,2年研究半天搞掂

奧特曼預計AI將在兩個方向上有重大的突破。

首先是在科學領域。

奧特曼說他相信科學發現是讓人們生活越來越好的最重要推動力。有了新發現,我們就能用更少的資源做更多的事,把「可能」的邊界往外推。

OpenAI最新的模型已經開始讓科學家們興奮了,他們的效率比以前高得多。

借助AI工具,很快會開始看到在對抗疾病方面的一些實質性進展。

至於物理學,奧特曼說可能需要更長時間,但很期待。

另一個重要方向是軟件開發。

奧特曼說未來幾個月,這個領域就會發生翻天覆地的變化。

他說一些工程師現在一個下午就能完成以前兩年才能做完的工作!

對於外界的一些傳聞,奧特曼說他們並沒有偷偷藏著有意識的模型,以及能自我改進的模型。

奧特曼還對他們模型的安全性很有信心。

「有人會說各種事情,但現在全球大概有10%的人正在使用我們的系統,我們對自己的安全記錄非常驕傲。」

他還透露,OpenAI已經準備好了一旦發現危險就迅速叫停的機制。

這就是一個不斷試錯的過程:把系統推向現實世界,在風險還相對可控的時候收集反饋,發現問題,然後解決。

ChatGPT不是AGI

奧特曼說ChatGPT還不能算是AGI,因為它還不能自己持續學習、提升。

它也沒辦法在自己不擅長的領域主動變強,自主地探索新科學、更新知識庫。

甚至還不能像人類一樣坐在電腦前完成各種知識型工作。

對於到底什麼是AGI這個問題,奧特曼直接講了個笑話:「你把10個OpenAI的研究員關一個屋子裡,讓他們定義AGI,估計能整出14個不同的答案。」

目前都沒有個統一的說法。

所以比起「AGI什麼時候來」,更重要的是認識到我們正處在AI能力指數級增長的曲線上。

你可以說「這是我眼中的AGI」,別人可以說「超級智能在那兒」,但不管咋樣,我們都得面對這個超級厲害的系統帶來的好處,同時想辦法讓它安全。

整場近一小時對談中,奧特曼其他的一些精彩觀點:

  • 要盯緊AI智能體的安全問題。

  • 奧特曼分享成為父親對他個人產生了深遠的影響,他否認了AI會對他的孩子未來構成風險,但也承認有更大的責任去塑造一個對孩子有積極影響的世界。

  • 奧特曼還描述了一個未來,AI將比他的孩子更聰明,但他認為這是一個好事。持續的創新、豐富的資源和智能AI將會無縫融入日常生活,未來一代人將會覺得當前人們又辛苦又落後。

參考資料:

https://x.com/TheMattBerman/status/1910813233008509191

https://x.com/FutureJurvetson/status/1910820537783423078