DeepSeek真的衝擊英偉達了嗎?摩根士丹利最新報告:英偉達仍將保持主導地位

DeepSeek「四兩撥千斤」的模型訓練方法,讓不少業內人士開始懷疑依靠英偉達 GPU 進行「大力出奇蹟」式的訓練是否還有必要。然而,最近摩根士丹利的一份報告指出,通過研究大約 25 個英偉達 GPU 的替代品,該報告發現大多數替代品都沒有得到認可。這些替代品的價格只有英偉達同類產品的零頭,也被宣稱具備較好的潛在性能,這讓它們能夠收穫最初的熱情和最初的部署。然而,幾乎總是有人中途棄用這些替代品,轉而繼續擁抱具備最成熟生態系統的英偉達 GPU。

這裏的替代品主要指的是專用集成電路(ASIC,Application-Specific Integrated Circuit)。在過去六個月裡,由於英偉達的漲勢已經開始疲軟,而 AMD 的表現相對落後,這讓 AI 行業的投資形勢明顯轉向 ASIC。英偉達 3 萬億美元的市值是由每季度超過 320 億美元的 AI 營收所支撐的,而博通 1.1 萬億美元的市值則來自每季度 32 億美元的營收。顯然,市場認為 ASIC 的增長潛力將是 GPU 的數倍之多。那麼,從長期來看,ASIC 會勝過通用芯片嗎?這份報告的觀點是:除非發生新的變化,否則應該假定仍將由目前的行業領導者英偉達保持主導份額。

(來源:Morgan Stanley Research)(來源:Morgan Stanley Research)

Google TPU:ASIC 的最成功案例

ASIC 是否會因為更適合較窄的應用範圍而優於通用解決方案呢?有時,這一問題的答案是肯定的。當出現這種情況時,這便是定製化芯片最有說服力的應用場景之一。最明顯的例子便是Google TPU 的成功,它之所以能取得這樣的成功,是因為Google發明了針對大模型的 Transformer 技術,並指導博通開發出一種針對該技術進行優化的芯片。而在當時英偉達正圍繞使用卷積神經網絡的視覺模型來優化其 GPU。

截至目前,Google TPU 是最能體現雲客戶因定製化解決方案而明顯受益的例子,這也為博通帶來了 80 多億美元的 TPU 營收。但是,同樣重要的是Google在 2025 年的一部分支出也將流向英偉達,其中一部分是對雲的投資。在雲計算領域,通用芯片的表現往往優於 ASIC。

與此同時,英偉達也在圍繞 Transformer 模型進行優化,並專注於訓練多模態通用 AI 模型。對於一些上一代應用程序來說,英偉達的這種投入可能顯得大材小用。不過,在提供高端訓練能力方面,很難有比英偉達更出色的玩家。具體到Google來說,本次報告預計 2025 年Google對於英偉達產品的採購量將翻一番左右。其中一些是Google出於投資企業雲的角度開展的採購,但是本次報告顯示其中Google的一些採購是因為英偉達產品在大模型 Transformer 方面有著非常強大的性能。

(來源:Morgan Stanley Research)(來源:Morgan Stanley Research)

英偉達:似乎有一種引力把所有人都引向最昂貴的顯卡

的確,某一款 ASIC 芯片的性能可能低於英偉達的 H100,但是這款 ASIC 芯片的售價為 3000 美元,而 H100 售價 20000 美元,所以這款 ASIC 芯片的總擁有成本更低。但是,僅僅通過製造售價 3000 美元的 AI 芯片就能與英偉達競爭,真的這麼容易嗎?報告援引一個例子稱:英特爾在這方面已經苦苦掙扎十年左右,它曾多次收購那些已經開始出貨且產品定價較低的公司,然而卻並未在這一領域取得顯著成績。

再以 AMD 為例,它的前幾代產品都沒有取得太大成果,直到 2024 年才憑藉 MI300 取得突破。如果真的有必要,那麼英偉達的競爭對手可能都會改為只生產 3000 美元的芯片。其實,就連英偉達自己也推出過幾款針對傳統推理應用的低價芯片。但是,英偉達發現似乎有一種引力在把所有人都引向最昂貴的顯卡。

為什麼會這樣?處理器本身的成本或許可以做得很低,但是系統的整體成本可能會更高。通過 ASIC 芯片構建集群的成本,可能遠高於使用英偉達的產品。原因在於:英偉達利用銅纜打造了包含 72 個 GPU 的光線互連域,而 ASIC 則通常要使用成本更高的光通信技術。除此之外,ASIC 和英偉達芯片的其他主要成本構成部分較為相似,比如兩者在高帶寬內存上的成本是一樣的。即便如此這對於英偉達也更加有利,因為英偉達在新型高帶寬內存芯片(HBM,High Bandwidth Memory)的採購上擁有買方壟斷的議價能力。

就芯片的軟件適配來說,對於芯片客戶來說這是一項又難又耗時的工作。在處理軟件變更以及運行不同工作負載時,易用性非常重要。而在總體擁有成本計算中,「軟件開發工時」這一因素常常被忽視。該報告舉例稱,美國大數據公司 Databricks 購買了亞馬遜雲科技(AWS,Amazon Web Services)的芯片 Trainium,買到芯片之久 Databricks 預計需要「數週或數月的時間來啟動和運行」。延遲部署可能會讓部分芯片客戶遠遠落後於使用英偉達芯片的客戶,原因在於英偉達配備了目前已被廣泛使用的 CUDA 軟件開發工具包。

儘管Google的 TPU 和 AMD MI300 取得了一定程度上的成功。但是,即便如此本次報告依然發現,客戶對於英偉達生態系統仍舊保持強勁熱情,這讓英偉達在 2025 年的市場份額有所增加。這並不是說價格較低的處理器沒有存在價值,只是它們並沒有像預期那樣獲得廣泛應用。

(來源:Morgan Stanley Research)(來源:Morgan Stanley Research)

DeepSeek 真的衝擊英偉達了嗎?

ASIC 作為一個芯片類別,並不優於或劣於商用 GPU,兩者都是實現相同結果的不同方法。ASIC 的開發預算通常低於 10 億美元,在某些情況下甚至更低。相比之下,僅 2025 年這一年英偉達就將投資約 160 億美元用於研發。憑藉這筆資金,英偉達能夠維持一個為期 4 年-5 年的開發週期。英偉達還將投資數十億美元用於連接技術,以提高機架規模和集群規模的性能。英偉達確實有能力在軟件生態系統方面進行大規模投資,而且由於其產品存在於世界各個地區的每一個雲平台(前提是美國商務部允許),因此對英偉達生態系統的任何改進性投資,都會在全球生態系統中傳播開來。

儘管 DeepSeek 在推理與訓練做法開始讓人們反思「堆硬件」這一做法的意義。但是,本次報告並不認為從訓練到推理會發生巨大轉變,也不認同 ASIC 是「推理贏家」的說法。實際上,在 Deepseek「出圈」之後,科技巨頭和 OpenAI、xAI 等公司的 CEO 們,都對大型集群規模的回報持積極態度。因此,這份報告並不認為 ASIC 在推理方面更具優勢,而是堅信那些性能最佳的解決方案將會脫穎而出。因為,推理工作負載正呈現出日益趨同的態勢,而且大部分訓練和推理涉及的是大模型 Transformer 工作負載。

報告還指出,博通的 750 億美元服務可獲得市場(SAM,Service addressable market)絕大多數來自於大模型訓練。預計在沒有大規模集群規模的情況下,GPU 會被重新用於推理工作。基於此,該報告指出 ASIC 不會成為事實上的贏家。英偉達在每瓦的原始處理能力方面具有優勢,雖然 ASIC 芯片更便宜,但是構建機架/集群的成本可能更昂貴。

一位雲計算高管公開表示,每隔兩年他的 ASIC 團隊都會提供比英偉達落後 2 年-3 年的技術,但這並沒有帶來太多收益。這並不是一種罕見的抱怨,這些抱怨有時甚至來自於已經大規模部署 ASIC 的雲供應商。他們原本將此視為對於未來的投資,然而大多數並未完全實現這一目標。

AMD 曾預測其產品 MI400 將帶來「每年數百億美元收入潛力」,儘管 AMD 的預測也是基於與潛在客戶溝通得出的,但是投資者的反饋是:「嗯,我們怎麼知道應該對 AMD 2026 年的產品(MI400)有信心,而不是對英偉達的未來新產品(Rubin)有信心?」

不過,本次報告也指出 AMD 的努力不可等閑視之。AMD 在更廣泛生態系統中的投資可能會遠遠超過 ASIC 供應商。2024 年,AMD 收購了服務器製造商 ZT Systems。AMD 通過這種迭代投資在服務器生態系統中取得了主導技術。在這份報告看來,AMD 與 ASIC 競爭對手擁有同樣大的市場機會。但是,兩者都不應該輕視與英偉達競爭時所面臨的挑戰。

2024 年,英偉達的處理器收入預計為 980 億美元,而 AMD 為 50 億美元,博通為 80 億美元,世芯電子和 Marvell 加起來約為 20 億美元。這使得商用矽的市場份額佔比約為 90%,ASIC 的市場份額佔比約為 10%。

與此同時,本次報告認為 2025 年商用矽的市場份額還會略有增長。預計在 2025 年,英偉達的增長幅度將比Google TPU 高出 50%-100%。報告認為,英偉達在 2025 年下半年的收入形勢將遠遠強於 ASIC 廠商或 AMD。

報告強調,其對於任何一家 AI 公司都沒有負面看法。然而,儘管 AMD 的估值越來越有吸引力,但是 AMD 的 MI350 似乎並沒有改變遊戲規則,同時 AMD 的 MI400 也存在一些未知因素。

目前來看,英偉達的產品仍然有著較大需求,而英偉達面臨的最大短期風險依然是美國的出口管製。總的來說,英偉達實力仍在,由此也就不難理解為何 DeepSeek 目前只能短時間挫敗英偉達股價。但是,AMD 等廠商的努力也能為人們提供更多的選擇,這也是一件好事。

排版:羅以