OpenAI服軟!DeepSeek掀開源狂潮:四模型同日開源

來源:雷科技AI硬件組 | 編輯:冬日果醬

不只是百度大模型在調整到「開源與免費」的姿態。

2 月初,OpenAI CEO Sam Altman 罕見承認 OpenAI 的閉源策略站在了‘錯誤的一邊’,同時小心翼翼地放出了有限度‘免費+開源’的消息。

現在更進一步了,2 月 18 日,OpenAI CEO Sam Altman 在 X 平台(原 Twitter)上詢問網民:

‘對於我們的下一個開源項目,是做一個相當小巧但仍然需要在 GPU 上運行的 o3-mini 級別模型更有用,還是做我們能做的最好的手機尺寸模型?’

也可能全都要,在手機上運行 o3 mini 水平模型,圖/ X也可能全都要,在手機上運行 o3 mini 水平模型,圖/ X

毫無疑問,結合之前 OpenAI 在 DeepSeek 衝擊下放出的一系列消息,Sam Altman 不僅官宣了‘開源項目’,也是在暗示 OpenAI 開源計劃的兩個方向。而在過去六年,OpenAI 一直堅守封閉策略(甚至因此被網民稱為CloseAI),自 GPT-2 之後再未開源任何大模型。

背後 DeepSeek 帶來的壓力顯而易見。

ChatGPT 問世後,OpenAI 在閉源模型的基礎上通過‘API+訂閱製’構建起強大的商業護城河,但 DeepSeek V3 和 R1 證明了開源大模型同樣可以媲美 GPT-4o 級別的能力,並且成本更低、可本地部署。

面對這一挑戰,OpenAI 再也無法對開源陣營置之不理。過去,企業幾乎只能依賴 OpenAI 或 Google 等大模型廠商提供的封閉 API,而現在,越來越多公司開始直接從雲計算平台或者部署 DeepSeek 等開源大模型,大幅降低 AI 計算成本。

也不僅僅是 OpenAI,整個 AI 生態都在擁抱開源,甚至一向推崇閉源的百度也宣佈下一代文心大模型 4.5 系列將在 6 月底開源。而僅在 2 月 18 日一天,就有多個模型宣告開源:

– 崑崙萬維宣佈,開源中國首個面向 AI 短劇創作的影片生成模型 SkyReels-V1,以及基於影片基座模型的表情動作可控算法 SkyReels-A1。

– 階躍星辰和吉利汽車聯合宣佈,將開源雙方合作的影片生成模型階躍 Step-Video-T2V 和語音交互大模型階躍 Step-Audio。

– 逐際動力宣佈,開源基於影片生成大模型的具身操作算法(VideoGenMotion,簡稱 LimX VGM)。

– 在剛剛發佈 Grok 3 系列模型,馬斯克旗下 xAI 宣佈,上一代大模型 Grok 2 將照例在幾個月後開源。

Grok 3 發佈直播,圖/ xAIGrok 3 發佈直播,圖/ xAI

在DeepSeek這隻「鯰魚」的影響下,開源正在撬動整個 AI 生態,而一場 AI 產業的‘開源革命’也已然開始。

開源 AI ,星火燎原

就在短短幾個月前,關於 AI 的討論還集中在 GPT(OpenAI)、Claude(Anthropic)和 Gemini(Google)這樣的閉源模型上,而現在,DeepSeek 幾乎以一舉之力扭轉了市場的注意力,將其迅速轉向開源陣營。

除了之前就採用不同開源策略的 Llama(Meta)、通義千問 Qwen(阿里巴巴)以及 Grok(xAI),開源陣營也迎來了不同方向的大模型,騰訊和字節就在早些時候開源了各自的影片生成模型,也包括崑崙萬維剛剛開源的 SkyReels-V1 影片模型。

不同於其他影片模型追求的通用性,SkyReels-V1 影片可能是首個面向 AI 短劇生成的開源模型,性能上號稱是最強的圖生影片開源模型。

圖/崑崙萬維圖/崑崙萬維

與此同時,階躍星辰和吉利汽車開源了面向座艙場景的階躍 Step-Video-T2V 影片生成模型,以及階躍 Step-Audio 語音交互大模型。另一邊是逐際動力在影片生成大模型打造了一套從文本到影片,再到機器人運動和操作的算法 LimX VGM,並將之開源給所有機器人開發者。

這場 AI 競賽,已經遠遠超出了最初的語言模型之爭,開源正以燎原之勢,席捲整個 AI 生態,也在一定程度上意味著大模型迭代的範式轉變。

最早,OpenAI 以‘開源’起家,GPT-2 甚至還曾完全開放權重。但隨後 OpenAI 就徹底轉向閉源,並在基於 GPT- 3.5 打造 ChatGPT 後迅速以 API 和訂閱製建立起商業模式。

OpenAI 轉變的核心邏輯在於,訓練大模型需要極高的算力成本,閉源可以確保盈利,避免開源導致的‘免費競爭’。而通過 API 形式提供 AI 服務,而不開放底層權重,防止競品複製其技術。

圖/ OpenAI圖/ OpenAI

更重要的是,通過掌控用戶交互數據,持續迭代 GPT 模型和 ChatGPT,並維持市場領先地位。但 OpenAI,終究還是忽略了開源的魔力以及最核心的技術創新。

如果回顧計算機技術史,實際上我們不難發現,開源未必會在早期佔據最有利的位置,但往往就像滾雪球一般:越滾越大,最終勢不可擋。

2008 年,Google 決定對 Android 採取開源+商業化的策略,這一決定徹底改變了移動操作系統格局。當時的 iOS 是封閉的,而 Android 通過開源吸引了三星、華為以及小米等全球硬件廠商的支持,迅速超越 iOS,成為全球市場佔有率最高的移動系統。

Chromium 也是如此,儘管它最初只是一個開源瀏覽器引擎,但最終幾乎吞噬了整個瀏覽器市場,就連微軟的 Edge 都不得不基於 Chromium 內核重建。

今天 AI 領域在經歷同樣的變革。閉源 AI 依然能賺到錢,但隨著 DeepSeek 帶來的衝擊,市場已經開始傾向於開源大模型的路線。一個核心在於,開源不僅降低了 AI 技術門檻,也給所有開發者和企業帶來了更多自由度——API 接入、雲端調用、本地部署,甚至是基於不同需求和數據進行重新訓練。

而這種自由,正是 OpenAI 體系下難以提供的。

DeepSeek R1,

打出一個開源盛世

還是 2 月 18 日,DeepSeek 在 X 平台上發佈了一篇技術論文,主要內容是提出一種名為 NSA(Natively Sparse Attention,原生稀疏注意力)的新型注意力機制。核心是通過對硬件的友好與端到端訓練,取得推理、訓練速度和任務表現的綜合平衡:

讓大模型在長上下文中兼具高效與高保真度。

DeepSeek 團隊新論文,圖/ XDeepSeek 團隊新論文,圖/ X

這不是 DeepSeek 第一次發佈技術論文,第一次為業界提供一種難題的解決思路。但更重要的其實是不同於 o1 模型,DeepSeek 此前用 R1 徹底揭開了 OpenAI 無論如何都想藏起來的——推理類模型‘算法的秘密’,給更多人、更多廠商複製和超越 o1 的可能。

過去,大模型行業預設接受了封閉模式——從 GPT-3 之後,AI 技術的進步被歸結為‘資源遊戲’,更大的算力、更貴的數據、更封閉的 API,塑造了 AI 的商業邏輯。

這種邏輯一度被認為是不可逆的,畢竟 AI 訓練的成本極高,封閉系統能確保收益最大化,同時維持技術優勢。但 DeepSeek R1 徹底改變了這種假設。

圖/ DeepSeek圖/ DeepSeek

相比更早之前發佈的 OpenAI o1、Kimi k1,DeepSeek R1 不僅是作為開源模型,而是一種全新的思維方式——它讓 AI 的‘思考過程’成為透明的,讓所有開發者都能看到推理是如何發生的。

更重要的是,它證明了 AI 進步不必依賴‘算力堆疊’,DeepSeek 另闢蹊徑,通過推理優化,而不是純粹地算力擴展,重新定義 AI 進步的路徑。

這種開源路徑帶來的變化,不只是技術上的,也是生態上的。在封閉體系下,企業只能被動接受 OpenAI、Anthropic 這樣的巨頭定價,而 DeepSeek R1 讓企業有了更低的成本、更靈活的選擇,所有過去被封閉 AI 掌控的能力,如今都可以在開源環境中自由演進。

這不僅提高了 AI 的普及度,也讓整個行業面臨的壁壘大幅削減,這也是為什麼我們會看到,所有廠商似乎都在接入 DeepSeek。當然,出於營銷目的的接入以及簡單粗暴的接入方式,也是這種變化中不可避免的一個過程。

寫在最後

就在 Sam Altman 詢問開源模型方向的推文下,有人依舊不滿於 OpenAI 的‘開源策略’,並提出至少應該開源 GPT-4——儘管由於成本和延遲早已不是主力,但依然是非推理類模型的一流性能水平。

R1 已經證明,不同於閉源的 AI 研究,開源的方式可以通過全球協作、技術共享,讓整個生態的進步速度加快。未來的 AI 可能也不會是少數巨頭的壟斷,而是由大量參與者共同推進的技術體系。

而 DeepSeek R1,正是這場‘開源盛世’的開端。

從這個角度來看,DeepSeek 和 R1 之所以重要,並不僅僅是它的性能,而是它所開啟的 AI 未來。開源不是封閉 AI 的備選方案,而是一條全新的康莊大道。