Meta LLaMA 4:對抗 GPT-4o 與 Claude 的開源王牌

2025 年 4 月,Meta 正式發佈了 LLaMA 4 系列的首批兩款模型。
這兩款模型模型分別是:LLaMA 4 Scout 與 LLaMA 4 Maverick,均採用了 專家混合架構(Mixture-of-Experts, MoE)。
據 Meta 表示,這是首次有 LLaMA 模型實現 文字與圖像的統一處理能力,具備真正意義上的多模態理解。
據悉,在訓練過程中,系統最多可同時處理 48 張圖像;而在後續評估中,模型在處理多達 8 張圖像的輸入時,亦展現出穩定而強勁的視覺理解性能。

LLaMA 4 系列:有哪些新突破?
Meta 於本次 LLaMA 4 發佈中亮相了兩款全新模型:
1. LLaMA 4 Scout
這是一款輕量卻不失強勁性能的模型,專為在單張 NVIDIA H100 GPU 上高效運行而優化,尤為適合科研人員與中小型企業應用。
擁有 1000 萬詞元(token)的超長上下文窗口,遠遠領先於多數現有開源大語言模型。
在推理、摘要生成與指令遵循等標準評測中,全面超越 Google 的 Gemma 3 與 Mistral 3.1。
2.LLaMA 4 Maverick
這款大型模型則劍指當前語言模型的重量級選手,如 GPT-4o、Claude 3.5 與 DeepSeek-V3。
精於代碼生成、多跳推理與高級搜索任務。
採用 專家混合機制(Mixture-of-Experts, MoE),僅激活部分參數進行計算,在保持卓越表現的同時顯著提升效率。
架構與創新亮點
兩款模型皆構建於全新的 Transformer 2.0 架構之上,並在多個關鍵維度進行了深度優化:
- 專家混合機制(MoE):每次前向傳播僅激活部分模型參數,有效降低計算開銷,同時不犧牲性能。
- 詞元流式處理與預測解碼(Speculative Decoding):顯著提升推理速度。
- 超長上下文窗口(Scout 模型支持高達 1000 萬詞元):可處理超大文檔或多輪對話,效率倍增。
- 多語言支持全面升級:在阿拉伯語、烏爾都語、西班牙語與中文等語言上的表現有了飛躍性提升。

Scout 在輕量級模型領域中一騎絕塵,而 Maverick 則在與 GPT-4o 和 Claude 等頂尖模型的競爭中依然鋒芒不減。
走向現實:LLaMA 4 的真實應用場景
Meta 推出的 LLaMA 4 不僅是科研成果的展示,更已廣泛融入旗下多個核心產品:
WhatsApp:用於客戶支持和智能回覆
Messenger:實現 AI 內容摘要和上下文感知的消息交互
Instagram:應用於標題推薦、評論過濾與智能搜索
Meta.ai(網頁版):面向公眾開放的 AI 聊天助手,功能類似 ChatGPT 或 Claude.ai
開源」的邊界:開放,還是有限開放?
儘管 Meta 將 LLaMA 4 宣傳為「開源模型」,其使用許可仍存在一定限制:
月活躍用戶超過 7 億的企業 無權使用該模型
開源倡議組織(OSI) 批評其為「半開源」,因其限制了商業化的自由擴展
不過,學術界和獨立研究者 仍可訪問,意味著 AI 發展的透明度正朝積極方向邁進
下一站:LLaMA 4 Behemoth 即將登場
Meta 的發展藍圖中,還包括一款更具突破 性的全新模型 —— LLaMA 4 Behemoth(巨獸) 。
亮點一覽:
採用 專家混合架構(Mixture-of-Experts),在每次推理中僅啟用部分模型參數
總參數規模高達 2 萬億,每次推理激活參數約 2880 億
聚焦科學、數學、多語言推理與代碼生成等高複雜度任務
有望在 STEM 領域的基準測試中超越 GPT-4.5 與 Claude Sonnet 3.7
預計將在 2025 年 4 月 29 日的 LLaMACon(Meta 首屆開源 AI 大會)上正式發佈
背後的雄心:打造 AI 基礎設施層
Meta 對人工智能的投入愈發激進,未來兩年預計投資將高達 650 億美元。
這不僅是對市場的回應,更體現出其打造「互聯網 AI 基礎設施層」的宏偉願景。
LLaMA 4 的推出,標誌著 Meta 不只是要與 OpenAI 和 Google 分庭抗禮,更要在開源領域取得主導地位。
LLaMA 4 系列的發佈,堪稱開源 AI 生態的一次重大飛躍。
憑藉其在效率、規模與可用性上的平衡,Meta 正在賦能全球開發者、初創企業與研究人員。
儘管許可政策仍有爭議,但 Scout 與 Maverick 的技術實力已贏得廣泛認可。
隨著 LLaMA 4 Behemoth 的臨近發佈,以及 4 月 29 日 LLaMACon 的召開,
2025 正逐步成為「超級開源模型元年」,而 Meta,顯然已成為這場變革的領跑者。
via https://ai.plainenglish.io/metas-llama-4-series-10-million-context-length-is-here-pushing-the-frontier-of-open-source-ai-744c637084ae
本文來自微信公眾號「大數據文摘」,36氪經授權發佈。