馬斯克的Grok-3,擔得起“地表最強AI”之名? | 智客星球

文 丨 新浪科技 周文猛
北京時間2月18日12點30分左右,馬斯克與xAI團隊的另外三位技術負責人,一同發佈了公司最新推出的Grok-3基座大模型。
短短30分鍾的發佈過程中,馬斯克及其團隊向大家介紹了Grok-3比DeepSeek-V3、OpenAI-4o等更為突出的數學、科學推理性能,演示了大模型代碼創作能力,同時也公佈了後續的開源計劃。
在此之前,馬斯克曾稱將發佈的Grok-3是“地球上最聰明的人工智能”,從發佈公示的模型性能來看,Grok-3確實在一定程度上取得了比DeepSeek、OpenAI更強的性能,但這一切的效果,是通過“20萬塊英偉達GPU”算力堆疊而出的。
在全球人工智能行業發展開源之風漸濃,同時也越來越注重性價比的當下,馬斯克的Grok–3真的擔得起“地表最強AI”之名?同時將為市場帶來怎樣的變化?
Grok–3,數學、科學推理超DeepSeek、OpenAI
據馬斯克發佈Grok–3時介紹,在數學推理、科學邏輯推理和代碼寫作等能力表現方面,xAI此次發佈的Grok-3和Grok-3 mini兩款模型,在 Math(AIME 24)、Science(GPQA)和 Coding(LCB Oct-Feb)三項Benchmarks測試中,均取得了比Gemini-2 pro、DeepSeek-v3、GPT-4o更優的性能表現。

在大模型競技場 Chatbot Arena(LMSYS)中,Grok-3版本的得分達到1402分,超過了包括ChatGPT-4o、DeepSeek-R1等在內的所有其他模型。

據馬斯克介紹,Grok–3比上一代的Grok–2能力提升了一個數量級。在後續AI用例演示過程中,馬斯克及其團隊成員讓Grok–3 尋找去火星的時間窗口,演示了其信息收集和推理能力,同時還創作一款融合《寶石迷陣》和《俄羅斯方塊》的遊戲,展示了Grok–3的創意能力。

據悉,目前Grok–3已經在xAI內部運行了2周。首批用戶通過X平台已可以預訂體驗Grok-3,目前xAI也在積極與AppStore對接,但因為上線這一平台需要滿足相關合規要求,因此最新的Grok-3模型還只能是在網頁上。
“我自己早上剛試了一遍Grok-3,我覺得它已經展示了非常強大的數學推理性能,一週後我們會上線所有全新的性能。”馬斯克還進一步透露稱,“我們通常會在新模型發佈的時候,開源上一代模型,幾個月後,我們也會對該系列模型進行開源”。
分析稱成本為DeepSeek-V3 263倍
強大的模型性能背後,Grok-3的訓練成本也成了備受關注的一個焦點。
據馬斯克在直播中披露,Grok 3在訓練過程累計消耗了20萬塊英偉達GPU,訓練在xAI公司的數據中心完成。有馬斯克團隊人員介紹稱,“我們花了122天才完成了第一個10萬卡訓練,但我們並沒有就此止步,如果我們想要構建巨型人工智能,需要立即將集群的大小增加一倍。”
相較於DeepSeek以遠低於同行“1/20的成本”訓練出比肩OpenAI-01模型能力的R1模型,Grok-3的這一算力消耗,屬實不小。就在馬斯克公佈Grok-3訓練成本後,很快便有人員分析指出,“Grok-3的算力消耗是DeepSeek-v3的263倍,中國的模型團隊只得望洋興歎。”
此前,在xAI發佈Grok-2模型後,便有國內AI企業創始人對新浪科技表示,“Grok-2模型參數量太大了,使用成本太高,這遠遠不是國內絕大多數企業用得起的,這也導致了他們的產品雷聲大雨點小。”
這一次,Grok-3又一次通過堆算力的方式,帶來了令人眼前一亮的模型效果。但過於龐大的訓練成本,註定也會全隊絕大多數用戶,尤其渴望私有化部署相關模型的企業用戶。
當前,伴隨DeepSeek開源相關模型帶來的模型使用成本下降和性能提升,在全球範圍內已經颳起了一陣大模型產品開源免費的“熱潮”。
就在Grok-3發佈數小時前,OpenAI 首席執行官薩姆・奧爾特曼便在X社交平台上發文,就公司下一個開源項目的方向徵詢公眾意見。他提出了兩種可能的開源模型方向:一種是“相當小但仍需在 GPU 上運行的 o3-mini 級模型”,另一種則是“儘可能優化的手機大小模型”。
這或許意味著 OpenAI 即將開源新的大模型,這也將是2019年OpenAI開源GPT-2後再次開源大模型。而在月初的時候,奧爾特曼還曾反思稱,OpenAI閉源“站在了曆史錯誤的一邊”。
國內方面,此前篤定閉源模型更先進的百度公司,也於近日宣佈了旗下文心一言會員產品免費。
當全球範圍內越來越多的企業都開始選擇使用更加低成本的AI大模型時,昔日的AI大模型機構們,也不得不放低姿態,開始擁抱市場。對於Grok-3而言,高昂的訓練成本及不開源的策略,或許將成為阻礙其普及的一大關鍵。
在Grok-3發佈後,此前傳言主要產品已為xAI數據中心供貨的三變科技,股價迅速由漲停迅速回落,不複此前兩日連續漲停的熱鬧景象。在一部分股友看來,回落最主要的原因,正是因為“馬斯克發佈會不及預期”。

結語:馬斯克硬鋼OpenAI,誰能笑到最後?
就在Grok-3發佈數天前,曾有消息曝出馬斯克正牽頭財團提出以974億美元(約7118億元人民幣)收購OpenAI的控股權,不過該提議很快遭到了OpenAI首席執行官薩姆·阿爾特曼(Sam Altman)的拒絕。阿爾特曼在X上回應稱:“不用了,謝謝,但如果你願意,我們可以以97.4億美元收購推特。”
隨後,馬斯克回擊稱其為“騙子”,雙方矛盾再次公開化。據悉,馬斯克律師團隊曾於2月10日向OpenAI董事會提交收購要約,計劃通過旗下AI公司xAI支持該交易,並可能在完成後與OpenAI合併。馬斯克在聲明中強調,此舉旨在讓OpenAI回歸其“開源、安全優先”的初心。
馬斯克作為2015年與阿爾特曼共同創立OpenAI的聯合創始人,同時也是OpenAI最早的投資人。但2018年馬斯克因爭奪公司控製權未果而退出,此後,2019年OpenAI成立營利性子公司,並接受微軟10億美元投資,逐步轉向商業化。伴隨2022年ChatGPT橫空出世並將OpenAI推上生成式AI巔峰,其估值飆升至千億美元級。
在外界看來,馬斯克於2023年成立xAI並推出大模型Grok,直接硬鋼OpenAI,多少摻雜著一些個人情緒。在業內人士看來,相較於OpenAI目前主要依靠融資存活,馬斯克旗下的Grok-3有著特斯拉、x社交平台等更為龐大的現金流和數據資源支撐,未來在空間智能等領域或許會有著更大的發展潛力。
但眼下看來,如果Grok-3模型的訓練成本,讓更多的企業和消費者用戶用上這款產品,才是下一步發展的關鍵。