馬斯克用20萬張卡練出的Grok 3能超越DeepSeek嗎?
2月18日,馬斯克所言「地球上最聰明的人工智能」終於亮相,其旗下人工智能公司xAI正式發佈其新一代的大語言模型Grok 3,馬斯克本人也在社交平台X上同步開啟直播演示。
據直播介紹,Grok 3已超越目前市場上所有已發佈的人工智能。在官方公佈的測試數據中,其在數學推理、科學邏輯推理以及代碼寫作等方面表現均優於ChatGPT-4o、DeepSeek-V3等競品。

Grok大模型是馬斯克旗下的xAI公司推出的人工智能模型,其命名源自美國科幻作家羅伯特·卡爾希恩萊因的小說《異鄉異客》(Stranger in a Strange Land)。該系列第一款大模型Grok 1於2023年11月面世,2024年該模型參數量擴展至3140億,遠超GPT-3.5的1750億。2024年8月,Grok 2大模型發佈,在Grok 1基礎上全面升級,並在X平台上面向用戶免費使用。而此次直播推出的Grok 3,據工程師表示,其所涉及的訓練是Grok 2的10倍,且Grok 3已經在xAI內部運行了2周。
據悉,Grok 3訓練所用GPU總量為20萬個,在第一階段通過10萬個GPU進行訓練,耗時144天,而第二階段的92天中,所用GPU數量拓展到了20萬個。此前據報導,印度已啟動一個有超過1.8萬個GPU的公共計算設施,將對初創公司、研究人員和開發者開放,以促進其國內人工智能發展以及本國大語言模型的訓練。相較之下,xAI的Grok 3訓練所用GPU總量已遠超印度國家級項目GPU總量10倍不止。龐大的算力規模成為Grok 3加速問世的最大助力,也讓xAI在日益激烈的市場競爭底氣十足。
在直播活動中,xAI的工程師展示了Grok 3的使用,如現場生成一段太空發射的3D動畫的代碼、製作一款融合「寶石迷陣」和「俄羅斯方塊」的遊戲,Grok 3均表現良好,這也證明了該模型對於複雜知識具有良好的理解。馬斯克表示,Grok 3的功能比Grok 2強大一個數量級。

面對Grok 3的極佳表現,有知名博主Alexandr Wang表示,Grok 3是世界上新的最佳模型,其在聊天機器人競技場中排名第一,且遙遙領先。Amjad Masad也表示Grok 3似乎是最先進的尖端模型,他認為考慮xAI的處境,該模型的發佈無疑是巨大成就。知名播客主持人Lex Fridman同樣對該模型印象深刻,表達了對該模型的稱讚。
而Grok 3所帶來的騷動,實際上比該模型的正式面世要來得早。
此前,DeepSeek在世界範圍內掀起熱潮。由於DeepSeek-R1模型的優秀表現,以及其代表的低成本訓練路線,人們一度開始討論全球AI話語權的歸屬問題。儘管人工智能行業尚處於群雄逐鹿的階段,但是DeepSeek-R1模型無疑為這個世界帶來巨大沖擊。
繼DeepSeek爆火之後,2月13日,OpenAI首席執行官奧特曼發佈博文,宣佈準備推出GPT-4.5和GPT-5,並公佈路線圖。
同樣在2月13日,馬斯克在杜拜世界政府峰會上表示xAI將推出新一代模型Grok 3,並盛讚其「強到讓人感到害怕」。而這也引發了人們對Grok 3的猜測,以至於討論AI話語權可能再度扯向西方。
至此,一場有關人工智能模型的「三國殺」已見雛形。
作為xAI的重要市場競爭對手,OpenAI對Grok 3的反應也引起人們的注意。在今日馬斯克的直播活動開始之前,奧特曼在社交平台X發佈消息,稱GPT-4.5已進入測試階段,並稱其體驗「接近通用人工智能(AGI)」,而這一行為被外界視為對Grok 3的緊急「狙擊」。

相比於明星產品DeepSeek-R1,「推理+測試時間計算」中,在數學推理、科學邏輯推理和編程三個方面,Grok 3 Reasoning Beta版本綜合得分分別為93、85、79,均高於DeepSeek-R1的80、71和65。最新AIME 2025性能測試中,Grok 3 Reasoning Beta版本有93分,高於DeepSeek-R1。前特斯拉人工智能總監、OpenAI創始團隊成員Andrej Karpathy通過提前體驗指出,Grok 3模型確實可以做到DeepSeek-R1做不到的事。而單純從測試數據看,Grok 3確實做到了比DeepSeek-R1略好。
儘管Grok 3在測試中成績優秀,但是仍有分析表現,在 「推理+測試時間計算」 這一測試中,相比於o3-mini(high)或DeepSeek-R1,Grok 3的數學性能並沒有顯著優勢。馬斯克表示,Grok 3仍處於早期訓練階段,未來將持續優化。


據瞭解,自今日起,X平台Premium Plus訂閱用戶將率先獲得Grok 3訪問權限。此外,xAI還推出了名為Super Grok的獨立訂閱服務,但尚未公開定價。馬斯克還表示,目前xAI的工程師團隊正在訓練Grok 3的迷你版本,並指出「迷你版的訓練時間更長,有時表現略好於Grok 3推理模型。」
自Grok 3開始,馬斯克「再無AI比Grok更優秀」的預言能否成真?以目前AI的更新速度而言,當真難以定論。但就該模型的表現來看,在人工智能的牌局上,馬斯克確實甩出了有份量的「大牌」。