花幾個億建智算中心,八成的GPU租不出去丨焦點分析

歡迎關注《智能湧現》

作者丨邱曉芬

編輯丨蘇建勳

在過去兩年的中國AI行業,有一項奇觀:

許多沒有任何GPU背景、算力行業經驗的上市公司,將智算中心當做他們發展第二曲線的抓手,籌謀向AI領域轉型——比如,生產味精的公司(蓮花控股)、造染料的公司(錦雞股份)、甚至還有博彩行業的玩家(鴻博股份)等等。

但到2024年年底,情況出現了逆轉。

11月29日,蓮花控股公告稱,他們近7個億的GPU服務器採購合約,只交付了12台,賸餘的318台因為「存在不確定性」,決定終止合約——按照一台英偉達H800服務器210萬元的價格來算,佈局智算中心轉型近兩年,這家公司只營收了2500萬。

不僅僅是蓮花控股,近期還有不少上市公司公告稱,決定暫停、或者取消原定的智算中心建設項目,不惜頂著合約違約的風險。

圖源IC Photo圖源IC Photo

在行業對AI預期高漲的兩年來,國內的智算中心建設可謂瘋狂——截至今年上半年,國內算力規模達到246 EFLOPS,智能算力同比增速超過65%,工業、教育、醫療、能源等多個領域算力應用項目超過1.3萬個。

這些上市公司在一波智算中心建設熱潮中,扮演的角色不盡相同,有的選擇簡單粗暴的出錢參與投建,有的選擇出設備(比如GPU/軟件解決方案/算法模型),也有的從更輕巧的方式介入,幫助算力中心提供運營服務。

從兩年前的趨之若鶩,到如今由熱轉冷,國內的智算中心發生了什麼?

一筆艱難的賬

有多位智算中心人士近期走訪國內各大智算中心時,驚歎於當前行業現狀。他們不約而同向《智能湧現》表示,目前國內的算力中心市場陷入沉寂。

「目前看下來,機房的出租率普遍在20%-30%之間,有些企業級智算中心甚至只有10%左右」,一位行業人士表示。

從純商業的角度,這並不是一個健康的狀態。一位行業人士向《智能湧現》拆解了一個智算中心的成本構成——

以一個英偉達H100構成的千卡集群智算中心為例,前期投入成本為:

購買算力設備約3億;

網絡設備成本約2.5千萬;

存儲和安全設備成本約1千萬;

平台軟件和液冷改造成本約1千萬;

共計約3.5億元的總成本。

而智算中心不僅僅在前期需要投入重資產,後續運轉過程中,還要投入日常的電力、維護、人員費用等等,經測算,每年的支出大概在五千萬元左右。

也就是說,在國內搭一個千卡集群規模的小智算中心,前期要支付3.5億硬成本,每年還要掏五千萬元去支撐運轉。

圖片來自 IC Photo圖片來自 IC Photo

而這些智算中心建成之後,算力輸送給誰?怎麼賺錢?

目前,國內廠商解決AI算力的方式是:大互聯網公司、彈藥充足的AI公司、以及細分賽道的龍頭企業,一般基於安全考慮,搭建自己的智算中心。而其他大部分需要AI算力的公司,基本選擇向第三方智算中心租賃算力的模式。

另外,這些智算中心也會為在前三類玩家需要的情況下,為其補充部分算力,應對不時之需。

近兩年來,智算中心建設熱情,一部分源於,雖然成本高昂,但好在有政府補貼緩解。最近兩年,各地出台了多種多樣的政策支持智算中心的建設,資金補貼、稅收優惠、土地供應等等。

比如,有地方政策提示,當項目總投入在1億以上時,將以實際投資額5%-15%不等的比例進行補貼。在有些風/光資源豐富的省份,還會對於投建智算中心的企業,贈與多餘的光伏指標。

一位行業人士概括,各地對於智算中心建設的支持政策,是需要「一地一議」的程度。

不過,補貼畢竟不在商業範疇,白花花的銀子建起智算中心後,錢後續能不能回籠,主要與實際運作之後能租出去多少卡(也就是機房利用率)、以及租賃價格掛鉤。

而在目前,這兩項數據並不樂觀。《智能湧現》在不久前的文章指出,一台英偉達H100服務器(8卡)的租賃價格,從年初的12-18萬元/月,降到目前的7.5萬元/月,降幅在50%左右。

如果以當前機房利用率20%來計算,一個英偉達H100千卡集群智算中心每年的營收僅有2300萬元( 即7.5 萬元/月✖️12 個月✖️128 台服務器✖️20%)——也就是說,一個算力中心就算勉強維持經營,結果基本只能覆蓋正常運營成本的一半,更談不上把前面的重資產收回本。

投建智算中心,當下是一筆艱難的賬。

1.3萬個算力中心,苦等回血

多位行業人士向《智能湧現》表示,智算中心當前出現嚴重閑置的情況,核心原因在於,算力中心投入應用之後,大家發現AI需求並未如預期般快速增長,算力難以消納。

此前大家預計,國內的算力租賃市場每年至少有10%增長,結果目前看來,只有5%左右」。

因此,目前各個智算中心的目標都是覆蓋運營成本,「回本甚至是最高標準、長遠的理想」。一家智算中心產業鏈公司「智伯樂科技」CEO嶽遠航告訴《智能湧現》,經他們測算之後發現,一個智算中心縱使設備出租率漲到60%,至少還要花上7年以上才能回本。

圖片來自 IC Photo圖片來自 IC Photo

除了AI需求沒有如預期般出現之外,智算中心閑置,本質上與其存在一定滯後性有關。

比如,一些智算中心在設計研究的時候,一般是根據當下的市場需求、以及硬件情況去設計。而等到真正落地時,一般已經過去了幾個月甚至數年——而此時,硬件產品可能已經迭代好幾輪了,甚至市場需求也已經出現了劇變。

為了儘可能降低日常運營成本,目前一些智算中心各自採取了措施。

有的智算中心直接關停租不出去的設備,「走進去機房裡,發現燈都關了,也沒有了嗡嗡的風扇散熱聲音」,嶽遠航表示。另外,也有的智算中心選擇直接變賣英特爾、英偉達的舊設備,儘量緩解資金壓力。

對於一些還沒建設完畢的智算中心,有的企業選擇暫停了建設中的項目,或者直接取消了規劃里的二期項目。一位行業人士甚至《智能湧現》表示,因為智算中心項目中途暫停,導致其此前斥資千萬高價購買的英偉達卡「砸手裡」了。

顯然,算力市場正在悄然轉變為買方市場。在過去兩年,如果說行業里是「一芯難求」、「算力難求」的情況,到如今則完全反過來。

目前大部分AI公司更加傾向於節約算力,避免不必要的成本支出,一般都會根據需求和預算選擇合適的算力資源,比如要求更低的優惠價格、以及更優質的服務。

一些智算中心為了維持算力銷售,爭取市場份額,也不惜採用降價、或者提高服務(比如提高運營能力,幫下遊優化模型等等)等方式來吸引下遊用戶。

算力作為水電煤一般的存在,牢牢掌握住了AI行業的命脈,尤其是在國際形勢並不明朗的當下。儘管算力中心在當前階段是一筆艱難的帳,但我們也很難粗暴得出不應再建設的結論。

對於長遠,有行業人士拋出了一個問題——

「 AI算力消納不了或許只是短期現象,你是現在暫時讓算力中心閑置著好?還是等到未來AI應用爆發了,你再匆忙上馬建設算力中心好?」

延伸閱讀: