10 萬GPU燒出 AI 怪物,馬斯克 Grok-3 硬剛 DeepSeek
「10 萬張 H100 GPU 訓練」、「證明黎曼猜想」、「最聰明的 AI」。
Grok-3 未發佈就賺足了眼球,今天中午,一如既往的遲到後,被馬斯克稱為「Smartest AI on Earth」的 Grok-3 終於來到了我們面前。
注意,Grok-3 並不是一個對話助手,而是為了完成 xAI 的使命:「Our mission is to understand universe(我們的使命是瞭解宇宙)」

超越 GPT4o,最強 AI 初見端倪
這次發佈會,馬斯克發佈了兩套模型一個工具,即 Grok-3、Grok-3 Reasoning,以及 Agent 工具 Grok DeepSearch。

馬斯克表示,Grok-3 在多項 Benchmark 的測試中均取得了比 DeepSeek-V3、GPT-4o、Gemini-2 Pro 更優的效果,Grok-3 已經在 xAI 內部運行了兩個星期。

在現場演示中,工作人員用 Grok-3 尋找去火星的時間窗口,在一定程度上展示了 Grok-3 的信息搜索、真假信息判斷以及推理能力。

另一個演示是製作一款融合俄羅斯方塊和寶石迷陣的二合一遊戲,展示了 Grok-3 的編程及創意能力。

從現場展示來看,Grok-3 的編程、推理、計算能力確實很突出。而在最新的 AIME 競賽中也是斷層領先。這裏有亮點需要注意,第一個亮點是它這項對比的不是 V3 版本的 DeepSeek,而是最新的 DeepSeek R1;另一個亮點是 Grok-3 mini 的性能也非常突出。

在 Chatbot 競技場之稱的 LMSYS 盲測中,Grok 3 在代碼、指令響應等各個方面排名第一。

馬斯克式的 AI 哲學
如果說 ChatGPT 是學校里的模範生,那 Grok 就是試遍各種方法的取巧派。
在杜拜世界政府峰會上,馬斯克表示,我們可以把人工智能看作一個超級天才的孩子,如果 AI 有好奇心並且追求真理,它將促進人類發展。
為了讓這個「孩子」可以被更多人看到,半個小時左右的發佈會上,馬斯克拿出了五六分鐘的時間來教大家如何在 X 平台上預約 Grok-3、推出不計算力的 SuperGrok、推薦大家使用網頁版,以避免 App Store 審核導致的效果落後。

一週之後,語音版的 Grok 就會上線;幾週之後,Grok-3 的 API 會上線;幾個月之後,Grok-3 會開源,同時下一代 Grok 開始研發。
作為一個暫時閉源的模型,Grok 並沒有太多限制,它不用和 DeepSeek 競爭、不用追求性價比,只要能打贏 OpenAI,它可以不計成本。

在發佈會的結尾,Grok-3 非常激動地和大家用語音交流:我非常激動終於見到了你,我們終於可以互相學習了。
這如同賽博世界一般的宣言,也展示了馬斯克的 AI 哲學:真實,好奇,熱愛人類。

而這個可能是男性的聲音,似乎也回答了 Q&A 階段觀眾關於 Grok-3 性別的提問。
大洋此岸,是來自 DeepSeek 的「中國式突圍」
那對比 DeepSeek,誰更強呢?
與 Grok-3 重資產投入形成鮮明對比,DeepSeek R1 開源版本僅用了行業 1/50 的訓練成本就實現了頂級性能,API 調用價格更是低至 0.001 元/千 Tokens,手機語音助手、國民應用微信等一眾軟件接入,讓 DeepSeek 的「本土化場景」成為了幾乎絕對的護城河。
有報導稱,深圳福田區政務系統通過 DeepSeek 大模型,將辦事流程壓縮60%,微信 AI 搜索的灰度測試也顯示,DeepSeek 在中文語義理解的準確性上超過了 Grok-2。

雖然我們現在還沒有用到 Grok-3,但即便他更聰明,DeepSeek 也更懂中國市場的剛需。
同時就在今早,OpenAI 突然宣佈開源,並在 X 平台發起投票,讓用戶選擇更想開源哪個模型,如今短策模型投票大幅領先。而在月初,Altman 曾表示,OpenAI 閉源「站在了歷史錯誤的一邊」。

不論是希望通過 X 平台滲透到 C 端用戶的 Grok-3,還是在金融、教育、製造等多個領域落地的 DeepSeek,還是宣佈開源,即將發佈 GPT-5 的 OpenAI。AI 行業即將進入技術與應用閉環反哺、互相促進的階段。算力、人才、數據……競爭才剛剛開始。
本文來自微信公眾號「PConline太平洋科技」,36氪經授權發佈。