還沒發佈,xAI工程師公開承認Grok 3不如OpenAI,遭馬斯克怒火解僱,馬斯克:Grok 3打遍天下無敵手
馬斯克確認將發佈 Grok 3, 已進入最後階段
最近幾個月,全球的聚光燈都在追著 DeepSeek 走,該模型被認為有可能使先進人工智能技術的使用更加民主化。
但與此同時,其他 AI 玩家也沒有閑著。OpenAI 緊急推出了 o3-mini、Google 向全球開放了當家模型 Gemini 全家桶、Anthropic 也在醞釀著發佈新一代模型,並將即將發佈的模型描述為一種可以在「深度推理」和快速響應之間切換的「混合模型」。
面對這些強勁對手,馬斯克坐不住了。他急需通過一款新的、強大的模型重新奪回在人工智能領域的話語權。
在 2025 年 2 月 13 日杜拜世界政府峰會上,埃隆·馬斯克與阿聯酋國務部長 Omar Sultan Al Olama 進行了一場關於 AI 未來的對話。在這次對話中,埃隆·馬斯克通過影片會議透露,其旗下人工智能公司 xAI 即將在幾週內推出聊天機器人 Grok 3,並稱該模型「聰明得可怕」,其推理能力將超越包括 ChatGPT 和 DeepSeek 在內的其他領先 AI 模型。
但是什麼讓 Grok 的最新模型如此智能呢?
馬斯克表示,Grok 3 的成功關鍵在於其合成訓練數據方法。與主要依賴真實世界數據進行訓練的 Gemini 和 ChatGPT 不同,Grok 3 通過合成數據進行訓練,能夠通過梳理數據反思錯誤,從而實現邏輯一致性。馬斯克認為,這種訓練方法將使 Grok 3 在推理能力上具有顯著優勢。
相比之下,美國領先的聊天機器人(如 Gemini 和 ChatGPT)主要使用真實世界數據進行訓練。這種訓練方法被認為可以幫助聊天機器人更好地掌握人類的細微差別和複雜性,但可能會讓聊天機器人開發人員面臨數據盜竊的指控,並且還可能通過限制公司可以訪問的數據量來損害聊天機器人的性能。
儘管 Grok 3 的技術前景令人期待,但其使用目前仍僅限於 X 用戶,因此尚不確定其增強的功能是否會對市場份額產生實際影響。
近幾個月來,DeepSeek 一直佔據著新聞頭條,該模型被認為有可能使先進人工智能技術的使用更加民主化。美國總統唐納德·特朗普對此表示,DeepSeek 的崛起為美國科技業敲響了「警鍾」,引發了行業內外的廣泛討論。
儘管面臨來自 DeepSeek 等競爭對手的挑戰,馬斯克對 Grok 3 的前景充滿信心。
馬斯克在峰會上不僅透露了 Grok 3 的技術細節,還批評了他的前同事、OpenAI 創始人 Sam Altman。他認為,OpenAI 在人工智能開發中過於依賴真實世界數據,可能導致數據隱私和倫理問題。相比之下,Grok 3 的合成數據訓練方法更加透明和安全。
自家工程師將 Grok3 評為,低於 OpenAI 模型,被解僱
事實上,關於 Grok 3 的發佈已經傳了很長一段時間。早在 2024 夏天,馬斯克就表示 xAI 的下一代 AI 模型 Grok 3 將於 2024 年底推出。但左等右等 Grok 3 遲遲未見,這引發了網民對該模型能力的種種猜測。
然而,讓人意外的是,在大家都對 Grok 3 進行各種猜測之時,xAI 一位工程師跳出來,自己將尚未發佈的 Grok 3 和其他模型排了個名。
在一則發佈於 2 月 8 日的 X 帖子中,Grok 開發人類數據團隊的 Benjamin De Kraker 討論了他從代碼角度看誰是頂級 AI 模型的看法。
在 De Kraker 看來,OpenAI 的 o1-pro、o1 和 o3-mini 均並列第一。他將尚未發佈的 Grok 3 排在第四位,其次是 DeepSeek R1 和 GPT-4o。

「刪除帖子否則將被解僱」
隨後,2 月 12 日星期四,De Kraker 發佈了後續帖子他聲稱,「xAI 告訴我,要麼刪除該帖子,要麼被解僱。」
面對這樣的最後通牒,De Kraker 表示,他決定保留自己的「言論自由和尊嚴」並辭職。
他補充道:「一家據稱擁護言論自由和開放的公司及其領導者,卻試圖解僱一名低級別員工,只因他表達的觀點明確,且毫無爭議,這讓我非常失望。」
De Kraker 在 X 上發帖稱:
今晚我剛剛從 xAI 離職了。
這件事讓我非常難過,但我知道我做出了正確的決定——原因如下。
xAI 告訴我,要麼刪除我之前發的帖子,要麼將解僱我。
經過仔細思考和權衡,我決定不刪除這個帖子——因為它顯然是一個無害的個人觀點。
他們為什麼要我刪除這個觀點?嗯,根據他們的說法,原因是我提到了 Grok 3……的存在。
這些話說起來真像是開玩笑,但這不是玩笑。因為這就是他們要解僱我的理由——僅僅因為我寫了「Grok 3(待定)」。
僅僅因為透露了 Grok 3 確實存在這件事就讓他被掃地出門?這個理由也讓 De Kraker 感到十分離譜,因為 xAI 早已在自家官網上承認了 Grok 3 存在的事實。
但等等,Grok 3 不是已經被 xAI 官方承認了嗎?是的,確實如此。
我會在下面附上 xAI 官方博客中關於 Grok 3 的討論,以及埃隆·馬斯克多次公開提及 Grok 3 的帖子和影片。
於是,De Kraker 的確在接下來的帖子中放出了 Grok 3 出現在 xAI 官網以及馬斯克在其他公開場合提到 Grok 3 即將發佈的截圖。


看看,xAI 官網和創始人都在多個場合中反復提及 Grok 3 的存在和即將發佈,這一則公開了一年多的消息怎麼自家員工提一嘴就要被解僱?解僱他的真實原因真的是因為透露了 Grok 3 的存在???
De Kraker 又進一步解釋,他發的那篇帖子 100% 是個人觀點,不涉及公司機密。
需要明確的是,他們要求我刪除的帖子 100% 只是我的個人觀點。我並不知道 Grok 3 與其他最先進的模型相比會處於什麼水平。希望它表現不錯,但我不知道。這就是為什麼我寫了「觀點」和「待定」。
它可能在某些方面表現很好,而在其他方面可能並不完美。我並不認為這是一個特別離譜的觀點。
再次強調,根據 xAI 公司的要求,甚至僅僅寫下「Grok 3 – 待定」就屬於「機密信息」。這絕對是荒謬的,因為公司和其著名的 CEO 已經多次公開承認了 Grok 3 的存在。
即使 De Kraker 貼出了很多截圖認為公司解僱他的行為不合理,但他離開 xAI 已成定局。因為這期間發生的種種已經讓 De Kraker 對 xAI 失望至極。
他們是不是因為我沒有在明確標註為個人觀點的帖子中猜測尚未發佈的 Grok 3 會表現得更出色而生氣?也許吧。很可能。再說一次,也許它確實會是最強的,我真的不知道。這就是為什麼我寫了「待定」。
我在 xAI 大部分時間與一個非常努力的團隊一起開發的 Grok 的某個特定功能非常酷,我希望它能對所有人都有很好的效果。我不會具體說明是什麼功能,因為那才是真正的機密信息。(也許等它發佈後我會說。)
我仍然希望埃隆和 xAI 能成功。然而……
讓我感到非常失望的是,一個標榜支持言論自由和開放的公司及其領導層,竟然會因為一個明確標註為個人觀點、且毫無爭議的帖子而試圖解僱一名底層員工。但事實就是如此。
整個情況非常奇怪。我曾想過乾脆刪掉那個該死的帖子……但你知道,一旦你開始屈服並放棄表達中庸一些的個人觀點,事情只會越來越變本加厲。
我會保留我的言論和尊嚴,然後找另一份工作,或者自己創業。江湖再見。
De Kraker 的困境並沒有被 xAI 的高層忽視。首席執行官馬斯克在評論最近的帖子時表示,「這很奇怪。」不過,他並未表明是否計劃進行干預。

Grok 系列模型的起源與背景
Grok 系列模型是埃隆·馬斯克旗下人工智能公司 xAI 的核心產品之一。xAI 成立於 2022 年,旨在開發具有更高推理能力和邏輯一致性的人工智能系統。馬斯克一直對人工智能的發展持謹慎態度,多次公開表達對人工智能潛在風險的擔憂。然而,他也認為,人工智能技術的進步是不可避免的,因此他希望通過 xAI 開發出更安全、更透明且對人類友好的 AI 系統。
Grok 的名字來源於科幻作家羅伯特·卡爾希恩萊因的小說《異鄉異客》,意為「深刻理解」或「完全掌握」。這一命名體現了馬斯克對人工智能的期望:不僅要能夠處理複雜的任務,還要具備對人類思維和邏輯的深刻理解。
Grok 1 於 2023 年初發佈,是 xAI 推出的首款人工智能聊天機器人。作為初代模型,Grok 1 的主要目標是驗證合成數據訓練方法的可行性。與當時主流的 ChatGPT 等模型不同,Grok 1 並未完全依賴真實世界數據進行訓練,而是採用了大量合成數據。合成數據是通過算法生成的模擬數據,能夠覆蓋更廣泛的情景和邏輯結構。
Grok 1 的推出引起了廣泛關注,它能夠處理複雜的邏輯問題,並在某些特定任務上超越了當時的 ChatGPT 3.5。然而,Grok 1 也存在一些明顯的局限性。例如,由於合成數據的局限性,它在處理真實世界中的細微差別和複雜性時表現不佳。此外,Grok 1 的訓練成本極高,且模型規模較小,限制了其在實際應用中的推廣。
2023 年年中,在 Grok 1 的基礎上,xAI 推出了 Grok 2。這一代模型在多個方面進行了重大改進。依然採用了更大規模的合成數據集,同時結合了少量高質量的真實世界數據,以彌補初代模型在處理真實場景中的不足。Grok 2 還引入了更先進的訓練算法,尤其是在數學推理、代碼生成和複雜問題解決方面超越了當時的 ChatGPT 4。它還首次嘗試了多模態能力,能夠處理文本、圖像和簡單影片數據。
然而,在眾多優秀大模型層出不窮的 2023 年,Grok 2 的問世並沒有掀起太大浪花。Grok 2 依然有著很多弊端,儘管其技術能力備受認可,但由於其使用權限僅限於 X 平台(原 Twitter)的高級用戶,普通用戶無法直接體驗。這一限制導致 Grok 2 的市場覆蓋率較低,未能對 ChatGPT 等競爭對手形成實質性威脅。
Grok 3 能擠進全球模型 Top 10 嗎?
那麼,Grok 3 能擠進全球頂級模型之列嗎?在馬斯克看來,是能的。
從他最近的發言中可見,他對 Grok 3 充滿信心,並認為該模型能擊敗一眾先進模型登頂最強模型寶座。
但事實真的如此嗎?
目前,Grok AI 在人工智能領域仍是一個小角色。它的受歡迎程度遠不及 ChatGPT 等競爭對手,截至 2024 年 11 月,ChatGPT 佔據了人工智能工具市場份額的 62.5% 。
不過,Grok 確實擁有一些與競爭對手不同的特點。它最大的優勢是能原生集成社交媒體 X,使該聊天機器人能夠訪問社交媒體平台的實時信息,其獨特的編程方式使其能夠以叛逆和俏皮的語氣回答挑釁性的提示。由於這些獨特賣點,馬斯克的 AI 聊天機器人在 X 用戶中很受歡迎。
然而,該聊天機器人經常捲入爭議,從回應政治虛假信息到因其可訪問 X 數據而宣傳有偏見的內容。ChatGPT 和 Gemini 等競爭對手也擁有更多參數,因此它們的響應通常更準確。
基於以上種種,有外界聲音認為,即使使用合成訓練數據,即將發佈的 Grok 3 也不太可能與更大的競爭對手相提並論。
參考鏈接:
https://www.ccn.com/news/technology/elon-musk-grok-3-outperforms-chatbots/
https://www.thestandard.com.hk/breaking-news/section/6/227525/Elon-Musk-says-Grok-3-is-in-its-final-stages
本文來自微信公眾號「AI前線」,整理:冬梅 ,,36氪經授權發佈。