今年,還要搶GPU?
最近一段時間被國內一家AI大模型初創公司DeepSeek刷屏了。短短幾個月內,DeepSeek推出的兩款開源大語言模型——DeepSeek-V3和DeepSeek-R1,不僅在多個關鍵性能指標上與世界頂級大模型,如Meta的Llama 3.1、OpenAI的GPT-4、Anthropic的Claude Sonnet 3.5等不分伯仲。最令人震驚的是,DeepSeek的訓練成本遠遠低於這些傳統模型,且所使用的GPU芯片並非頂級配置,但卻交出了令人歎為觀止的成績單。
經濟學家Ed Yardeni在一份報告中指出:「DeepSeek在兩個月內僅花費560萬美元來開發其DeepSeek-v3模型。」相比之下,Anthropic的首席執行官Dario Amodei去年提到,建立一個模型的成本為1億至10億美元。而且由於這些模型是開源的,在成本和定價上都具有很大的優勢。
然而,不容忽視的是,儘管DeepSeek的成本大大低於傳統大廠,但其能夠取得如此突破的背後,依然離不開GPU這一關鍵硬件的強力支持。隨著AI競爭日益激烈,尤其是訓練和推理市場的不斷擴展,算力仍將是決定勝負的關鍵,GPU的作用依然無法被忽視。
美國科技巨頭不受影響,繼續瘋搶GPU
無論是DeepSeek還是對AI的泡沫擔憂,都沒有減緩企業的投資熱情。2025年,各家雲廠商仍然有著大幅資本支出。科技公司們為了在AI這場戰鬥中贏得勝利,近些年來大肆建設數據中心,搶GPU卡,搶電力,新一輪激烈角逐正在拉開:
-
1月21日,OpenAI宣佈了一個新項目:星際之門(Stargate Project),計劃在未來四年內投資5000億美元,在美國為OpenAI建設新的人工智能基礎設施,在今年投入首筆1000億美元。
-
亞馬遜今年計劃在基礎設施方面投資1000億美元,高於2024年的770億美元,是前一年480億美元的兩倍多,絕大部分資金將用於亞馬遜網絡服務的數據中心和服務器;
-
微軟在2025年1月初宣佈,計劃在2025財年(截至今年6月份)投資800億美元建設能夠處理人工智能工作負載的數據中心;
-
Google計劃在2025年投資750億美元(較去年的530億美元增長42%),Google首席執行官桑達爾·皮查伊稱人工智能的機遇「前所未見,這就是我們加大投入以抓住這一機遇的原因。
-
Meta將在今年投資600億至650億美元用於AI相關的資本支出。Meta首席執行官馬克·朱克伯格表示:「我仍然認為,從長遠來看,大力投資資本支出和基礎設施將是一種戰略優勢,我們可能在某個時候會發現其他情況,但我認為現在下結論還為時過早,就目前而言,我敢打賭,建設這種基礎設施的能力將是一個重大優勢。」
-
就連過去幾年在AI領域很謹慎的甲骨文,2025年也加大了資本支出。
甲骨文將在2025年將資本支出比2024年增加一倍,達到約136億美元。而2021財年,甲骨文的資本支出僅為20億美元左右。甲骨文首席財務官薩弗拉·卡茲(Safra Katz)在2025財年財報會上表示,AI需求推動甲骨文雲基礎設施收入增長52%,雲計算收入本財年有望達到250億美元。
在七大科技公司中,甲骨文是標準普爾500指數中唯一市值未突破1萬億美元的大型科技公司。與亞馬遜和微軟不同,甲骨文主要通過租賃大量數據中心而非購買。不過分析師表示,甲骨文這種獨特的數據中心策略使其能夠有效與資金雄厚的競爭對手競爭,因為這可以使得其資本支出中更大的一部分被投入到購買GPU,而非像微軟這樣的大規模支出。作為星際之門的一部分,甲骨文此次也擔任重要角色之一,與英偉達和OpenAI共同構建和運營該計算系統。
據估計,微軟、亞馬遜、Google和Meta 2024年的總資本支出將達到2460億美元,高於2023年的1510億美元。而2025年的支出可能超過3200億美元。在科技巨頭們如此高額的資本支出中,GPU的採買將佔據很大一部分,10萬卡級別的集群正逐步成為AI計算的標配。
英偉達無疑是這一浪潮的最大受益者:其三大客戶之一Meta正加速建設一座超2GW的數據中心,計劃在2025年底前部署超過130萬塊GPU;甲骨文則在打造Zettascale級別的雲基礎設施超級集群,支持多達131,072個Blackwell GPU,預計於2025年上半年推出;而微軟去年成為全球最大GPU買家,據Omdia分析,微軟在2024年採購了多達485,000塊Hopper芯片,是其他廠商的兩倍,今年800億美元的預算預計也將大幅投入GPU採購。
2025年,英偉達的Blackwell GPU無疑將成為市場最受關注的芯片。儘管該系列面臨一些技術挑戰,英偉達仍計劃提前推出。據Business Insider報導,Nvidia正積極推動SK Hynix儘早準備其下一代內存,以加速Blackwell GPU的量產。
AMD也在積極加速GPU導入廠商,本次大火的DeepSeek-V3模型的開發,就使用了AMD Instinct GPU和ROCM軟件。MI300系列GPU已成為AMD有史以來增長最快的產品,微軟已採購Instinct MI300X。據Nextplatform報導,預計2024年,AMD向數據中心的GPU芯片銷售額將突破50億美元,幾乎是2023年的10倍。此前,AMD首席執行官Lisa Su曾透露,已有超過100家企業和AI客戶積極部署MI300X。
為了快速攻佔AI市場,AMD打算提前推出下一代GPU芯片MI350系列。MI350將在本季度開始向主要客戶送樣,並將生產出貨時間加速到年中。
在這一趨勢下,GPU市場或將再度迎來供不應求的局面,只有少數頭部廠商能夠優先獲得供應。
擴產,能否解決GPU缺貨之痛?
GPU缺貨最大的問題在於產能端。CowoS封裝和HBM存儲作為GPU的兩大支柱,也製約了GPU的產能。據DIGITIMES Research稱,受雲端AI加速器需求旺盛推動,2025年全球對CoWoS及類似封裝產能的需求或將增113%。為此,GPU產業鏈中關鍵的兩大廠商台積電、SK海力士等行業巨頭紛紛加大擴產力度,試圖解決供應不足的困境。
由於日益加劇的地緣政治和經濟不確定性,台積電的先進封裝路線圖在2024年經歷了多次調整。根據台積電的最新規劃,2024年CoWoS的月產能預計為35000片,到2025年將增加一倍,達到75000片,預計2026年將進一步增至135000片。

台積電2024年的CoWoS封裝就進行了擴產,比2023年增加了2倍,但是仍然供不應求。根據SEMI Vision的數據,台積電在竹南、嘉義、台中和台南四地的先進封裝擴建項目正全力推進。
其中竹南先進封裝AP6B廠於12月3日獲使用證,嘉義廠於今年5月動工。台中AP5B廠預計明年上半年投產,群創台南廠區台南AP8廠(內部代號AP8)則計劃於2025年底小規模投產。而經濟日報1月20日的最新消息,台積電再投2000億新台幣計劃在南科三期新建兩座CoWoS封裝廠。
如果消息屬實,加上目前正在建設的嘉科廠,台積電短期內CoWoS廠總數將達到八座,具體包括嘉科一期兩座、群創四廠改建兩座、南科三期兩座,以及嘉科二期規劃的兩座。CoWoS封裝的火熱需求可見一斑。

另一邊,SK海力士也是忙得飛起。作為HBM的主要供應商,SK海力士2025年的HBM產能均已經售罄,因而一邊不斷加大擴產HBM產能,目標是到明年實現每月14萬片晶圓的HBM產能;一邊加快產品迭代步伐,正與台積電就16層HBM4進行密切合作,預計2026年下半年開始量產出貨。
2024年全年SK海力士營收創歷史新高,超過2022年創下的21萬億韓元以上的紀錄,營業利潤也超過了2018年半導體超級繁榮時期的紀錄。反觀三星,已經將HBM3E市場拱手讓給了SK海力士,目前的希望是HBM4,三星打算採用混合鍵合新技術來實現16層的HBM4。但從目前的進展來看,似乎沒那麼順利。
不過,三星也在擴產HBM產能,計劃在今年年底前將其HBM產能提高至每月14萬至15萬片晶圓,並在明年年底前進一步提高至每月17萬至20萬片晶圓。
美光的HBM產品進展還不錯,其首席執行官預計2024財年HBM的收入大概在數億美元,2025財年將達到數十億美元。美光的目標是明年拿下20%的HBM市場份額。在台灣,美光正在大幅擴產HBM產能,包括台中A3工廠和桃園第11工廠,此外美光還在台灣開設了一個新的辦公室,收購了友達光電的台中工廠,將其改建為DRAM生產基地。該公司計劃到明年年底將目前每月20000片晶圓的產量增加兩倍至60000片。
從短期來看,儘管擴產計劃已在推進,供需矛盾仍將長期存在。尤其是隨著AI和數據中心應用的進一步發展,GPU的需求將持續攀升,單靠現有產能擴充恐難以迅速彌補市場缺口。
GPU不夠,ASIC來湊?
GPU芯片短缺已經不是一兩年的事,雲廠商們受製於Nvidia好多年了。因而云端巨頭皆投入ASIC芯片開發,Google推出的TPU(張量處理器)已經成為行業標杆;亞馬遜AWS也推出了Trainium和Inferentia兩款自研芯片;微軟緊隨其後,開發了Maia和Cobalt系列;Meta則以MTIA芯片搶佔市場;而OpenAI,據傳正與博通合作開發自有的ASIC芯片,以支撐其大規模AI模型的訓練需求。
顯然這些ASIC已經小有氣候。蘋果2024年7月發表iPhone AI的首個預覽版,其AI模型就是使用Google的TPU(張量處理器)上訓練。在亞馬遜的AWS Reinvent大會上,其宣佈將使用亞馬遜自家的自研AI芯片進行模型訓練,除夕之外,蘋果正評估亞馬遜最新的Trainium2芯片,種種跡象表明,ASIC已經能補充一部分GPU的空缺。
ASIC必然有其獨特的存在價值。英偉達的B200等GPU芯片,主要通過擴大面積來提升性能,所以會越做越大,而聚焦於提升算力的ASIC芯片,拋棄了GPU中的部分通用功能,成為一種提升效能、降低功耗的選擇,換句話說,ASIC具有高性能、低功耗、成本低、保密性和安全性高以及減少電路板大小的優勢。
即使是「GPU之王」英偉達,也沒有忽視ASIC的潛力。據報導,英偉達已經開始規劃ASIC產品線,在台灣招募上千名芯片設計、軟件開發及AI研發等領域之人才。黃仁勳直言,NVIDIA借此可進一步擴大客群,或許CSP業者客戶會成為NVIDIA的競爭對手,但同時所有的CSP也都還會是NVIDIA的客戶,雲端客戶將離不開NVIDIA。
ASIC盛行的時代,也帶火了博通和Marvell。博通已經邁向萬億美元市值,Marvell的市值也突破千億美元大關。這些公司在ASIC領域的快速崛起,不僅得益於自身技術研發能力,還反映了市場對定製化計算解決方案的巨大需求。
隨著AI模型複雜度的提升和大規模應用的普及,ASIC市場的規模呈現爆炸式增長。據摩根士丹利預計,AI ASIC市場規模將從2024年的120億美元增長至2027年的300億美元,年均復合增長率達34%。博通更樂觀地預測,2027年ASIC的市場需求規模將在600億至900億美元之間,而Marvell則預計2028年數據中心ASIC市場規模將攀升至429億美元。
GPU的短缺問題雖難短期內完全解決,但ASIC芯片的崛起無疑為填補這一空缺提供了可行的路徑。特別是在雲計算和AI領域,ASIC通過定製化設計,在特定應用中提供更高效、更低功耗的解決方案,逐步成為GPU的有力補充。
隨著越來越多的雲服務商投入到ASIC研發中,未來的計算生態可能會更加多元化。GPU和ASIC將兩者互補,共同推動著整個AI和雲計算產業的前進。
寫在最後
DeepSeek的出現,使得很多人認為對算力以及英偉達不利。但是」信息平權「的一篇分析中的觀點是前沿探索(如新模型的開發)和後發追趕(即基於已有成果的改進)所需要的算力需求是不同的。
文章引用了《The Bitter Lesson》中的觀點,強調算力才是AI研究的根本驅動力。歷史經驗告訴我們,AI的突破往往來源於算力的擴展,而非單純的算法創新。隨著算力的不斷提升,AI的能力將得到質的飛躍。
因此,GPU在未來AI戰場上的重要地位,依舊牢不可破。AI行業的未來,依然是算力的較量,無論是DeepSeek這樣的新興公司,還是OpenAI、Google、Meta等傳統巨頭,GPU仍將是支撐他們技術創新與產品突破的基石。2025年,GPU的搶奪戰依舊很精彩!
本文來自微信公眾號:半導體行業觀察 (ID:icbank),作者:杜芹DQ