奧特曼曬「星際之門」首期工廠,全美狂建20座超算!70萬塊GPU老黃爆賺375億

新智元報導  

編輯:桃子 好睏

【新智元導讀】「星際之門」更多內幕被曝光了!據稱,首期投入1000億美金,將在德州阿比林建設10座數據中心,未來要在全美打造20個超算。與此同時,奧特曼秀出了首期工廠的全景,無比震撼。

一大早,奧特曼直播剛下線,就炫出了「星際之門」首期工廠。

而我們以上看到的,還僅僅是「星際之門」的1號基地

據稱,德州阿比林(Abilene)已經獲批875英畝地(約354萬㎡),面積堪比紐約中央公園,計劃打造10個數據中心。未來,4年耗資共5000億美金,在全美建設共20座超算中心。

奧特曼最新的帖子,是對馬斯克昨日嘲諷做出的有力回覆。

奧特曼與馬斯克正面開懟,手撕對方
奧特曼與馬斯克正面開懟,手撕對方奧特曼與馬斯克正面開懟,手撕對方

難道馬斯克所說的一切,真的只是噱頭嗎?

「星際之門」自週二官宣以來,備受各界關注,尤其是5000美金投資直接引爆了全科技圈的熱議。據稱,這一金額相當於達到了「曼哈頓計劃+阿波羅計劃」總額。

這一令人瞠目結舌的數字,不得不引發各界的猜想。

正如馬斯克昨日battle的所言,軟硬實際上獲得的融資遠不到100億美金。

那麼,真實情況到底是怎樣的?

SemiAnalysis獨家透露,事實上,「星際之門」的第一階段已經確定,並在德克薩斯州阿比林數據中心基地展開。

不過,他們確認了馬斯克的話——軟銀的確沒有足夠資金來建設如此規模的算力集群。

下文中,他們將詳細剖析「星際之門」的實際情況、微軟當前面臨的危機、項目架構和成本,以及這個算力集群的真實情況。

千億美元集群已鎖定

除了奧特曼放出的實景,SemiAnalysis也製作了一張德州集群建設的宏觀圖。

確定的第一階段,也僅僅是已承諾的1000億美元投資中的一部分。至少可以說,這個數字最終數字(5000億美元)的計算方式著實令人玩味。

4個月前,著名分析師便在「Multi-Datacenter Training」報告中,已經公開討論了位於德州阿比林數據中心基地第一階段規劃。

「星際之門」背後真實數據

他們認為,這個項目是按總擁有成本(TCO, Total Cost of Ownership),而非資本支出來計量的。

換言之,1000億美元和5000億美元指的是TCO,其中包括數據中心、服務器、網絡設施、電力供應的資本支出,以及債務融資在內的諸多運營成本。

此外,目前只有首期1000億美元項目,已經確定了數據中心選址和電力供應。「星際之門」項目整體資金仍未完全到位。

還有一個容易產生誤解的細節是,這個大型項目的第一個算力集群,其實就是去年宣佈的Oracle和OpenAI合作項目。

該項目完全由Lancium、Crusoe和Oracle負責建設。據分析師瞭解,軟銀和MGX等其他方並未參與其中。

全美20座超算,10個已開工

實際上,OpenAI週二官宣博文中,已經明確了「星際之門」是一家新成立的合資企業公司。

在這個項目中,他們計劃在未來4年內斥資5000億美元,用於AI基礎設施建設,其中1000億美元將立即投入使用。

這是第二屆特朗普政府宣佈的首個重大AI計劃,由於監管政策顯著放寬,未來可能會推出更多類似計劃。

星際之門計劃的股權創始方包括軟銀、甲骨文、MGX和OpenAI,其中前三家公司負責前期注資。

軟銀和OpenAI是核心合作夥伴,軟銀負責財務管理,而OpenAI主導運營工作,包括幾乎所有的算力集群管理軟件。

如前所述,該項目計劃共建設20個數據中心,其中10個已在德克薩斯州阿比林開工,每個佔地面積約46,500平方米(50萬平方英呎)。

首期1000億美元支出明細

最初的Oracle/Crusoe項目作為其中一個數據中心,將與其他超級園區互聯,實現規模比現有任何訓練運行,都大數個量級的分佈式訓練。

此前,奧特曼提到的「已經在建設中」的星際之門計劃園區,即為Oracle/Crusoe阿比林園區。

該園區將容納供OpenAI使用的10萬台GB200算力集群。這個開發項目以及計劃在第二季度和第三季度交付的GB200服務器,將部署在Oracle/Crusoe的數據中心內。

下面是2024年12月29日,拍攝的園區高清照片。

4個約11,150平方米的「模塊」組成了一棟44,600平方米的建築,目前僅有兩棟建築在建,關鍵IT負載容量約為180兆瓦。

為了讓大家理解這一規模,整個由20棟建築組成的園區將包含80個這樣的「模塊」!

根據「加速器模型和數據中心模型」中,分析師為OpenAI/微軟/甲骨文規劃的建設計劃,OpenAI無需建設新園區就能部署全部1000億美元的總擁有成本(TCO)。

因此,他們認為「星際之門」計劃合資企業的首期1000億美元將全部投入這個園區。

在Lancium的官網中,這個園區被稱為「Abilene Clean Campus」,並聲稱將在2025年實現1GW供電能力。

然而,通過多個行業消息源和文件,該園區已額外獲得1GW容量,總供電能力達到2.2GW。

據此可以估算,該園區的關鍵IT負載容量為1.8GW,能源使用效率(PUE)約為1.25。

雖然他們可能通過優化使PUE接近2GW IT容量,但考慮到GB300特別是VR200的功率密度提升,這個目標將很難實現。

70萬塊GPU,老黃首期爆賺375億刀

除了正在部署的10萬台GB200算力集群外,分析師估計,他們還將在整個園區部署另外20萬台GB300和約40萬台VR200(英偉達計劃在2026年推出的超算,分別對應Vera CPU和Rubin GPU)。

他們根據園區1,000億美元總擁有成本(TCO)投資,以及人工智能TCO模型中的單位成本,計算出了Vera Rubin處理器的隱含數量。

約70萬台GPU的總IT功率為1.8GW,這與Oracle/Crusoe阿比林園區1,800兆瓦的容量相符。

簡而言之,OpenAI預計為首個GB200集群支付的成本,約為每GPU每小時2.8美元,全規模集群的TCO為每小時2.38美元。

這些數字會隨著未來英偉達GPU的部署而相應調整。

OpenAI的支出將超過1,000億美元,但這並非前期資本投入。

分析師還估計英偉達從中獲得的收入和IT設備資本支出相對較為適中,分別約為375億美元和490億美元。這將佔用整個1.8GW Crusoe Lancium站點的容量。

隨著向GB300和VR200演進,每一代GPU的數量都將翻倍,單個GPU的功率需求也在增長。

雖然70萬塊GPU對於1,000億美元的投資而言規模似乎不大,但需要注意的是,這相當於數百萬台Hopper(英偉達高性能計算架構)GPU的算力。

刷存在感的軟銀

甲骨文和軟銀是知名的股權提供方。

MGX是一個新近成立的艾巴紮比科技投資平台,由Mubadala和G42共同創立。該基金由Sheikh Tahnoon bin Zayed al-Nahyan擔任主席,據報導他監管著超過1.5萬億美元的投資基金。

鑒於馬斯克聲稱軟銀籌資不到100億美元,需要特別指出的是,該合資企業還將通過項目融資籌集「債務資本」。

目前「股權融資」和「債務融資」的具體比例尚未確定,但甲骨文和MGX憑藉其雄厚的資產負債表,可以為項目提供大量資金支持。

也就是說,即便軟銀沒錢,還有甲骨文和MGX。

據悉,OpenAI和軟銀各自在賬面上,承諾投入190億美元。軟銀目前雖然沒有這麼多流動資金,但預計其可能會通過出售部分ARM股份來籌集所需的股權投資。

OpenAI同樣缺乏這筆資金,但他們可以在新產品o3發佈後進行融資,而且不必直接全額籌集,可以通過向聯合體其他成員發行「混合資本工具」來實現。

需要承認的是,馬斯克的判斷是正確的,他們目前確實還沒有籌集到這筆資金。

關鍵問題在於項目融資風險能否與母機構分離。這種風險隔離十分重要,因為OpenAI需要籌集資金來支付相關費用。

對OpenAI而言,一個有利因素是這筆資金不需要立即到位。

OpenAI現有資金足以支付今年10萬台GB200集群的租金,但他們需要確保能夠支付2026年及以後大幅上漲的租金。

雖然OpenAI可能無法直接籌集到所需資金,但高級分析師相信,他們的技術和產品發展將能夠支撐這一規模的支出。

誰是最大贏家?

我們看到,在「星際之門」合資項目的公告中,出現了許多科技巨頭的名字,比如英偉達、Arm、微軟、甲骨文以及前面提到的投資方。

這些都是令人印象深刻的知名企業,但現實情況是,既有輸家,又有贏家。

若說誰是最大的輸家,恐怕就是微軟了。

微軟,最大loser

當OpenAI選擇了另一個基礎設施合作夥伴時,微軟實際上被擠到了邊緣位置。

同時,納迪拉維杜華的態度已經非常明確:僅僅守住800億美金投資!

週二,微軟博客陳述了合作關係的事實,以及微軟擁有優先購買權。

但現實是,這對微軟的長期發展將產生逐步顯現的負面影響,因為他們不願承擔這項投資的風險。

此外,更令人咋舌的是,負責OpenAI合作關係的Chris Young也在公告發佈之後突然離職。

持樂觀態度的分析師會說,微軟正將其AI計劃的部分資本密集型業務轉移給甲骨文,但SemiAnalysis認為這種短期收益無法抵消失去OpenAI收入和控制權帶來的長期潛在損害。

雖然馬斯克和納迪拉維杜華提出了同樣的疑問——「實際的收益在哪裡」,但馬斯克已製定計劃,要讓他們的田納西州莫菲斯基地以不低於OpenAI的速度發展;

而納迪拉維杜華則沒有在內部建設前沿AI模型的計劃。

Arm:技術合作夥伴,還是虛假新聞

Arm股價因被列為技術合作夥伴而上漲約16%,但這僅僅是因為其Grace和Vera CPU與英偉達的Blackwell和Rubin GPU配套使用。

軟銀可能力推讓Arm加入公關陣營,表面上確實效果不錯。但實際上Arm並未發揮實質性作用。

對Arm股東而言,現實情況如上所述,軟銀可能不得不出售其在公司的部分股份,以為「星際之門」股權投資提供部分資金。

我們認為投資者大多忽視了這一點,錯誤地將這個公告視為實質性的利好消息。

甲骨文承擔了管理數據中心和供應鏈物流的重任;管理1.8GW集群並按照另一家公司的要求採購所有必要設備是一項極具挑戰性的任務。

英偉達顯然深度參與其中,因為主要依賴的是他們的硬件。

而OpenAI將保持運營控制權,並運行幾乎所有自己的集群管理軟件。

全部用於一次訓練

這個項目的規模令人印象深刻,但正如分析師最近在Fabricated Knowledge中所分析的那樣,這似乎是AI發展熱潮中的又一個重要里程碑。

我們知道,首批1,000億美元將投資於阿比林基地,而賸餘的4,000億美元將用於開發更多數據中心基地。

更值得注意的是,所有這些數據中心基地都將持續建設,旨在實現AI分佈式訓練的目標。

值得注意的是,僅僅複製4個相當於阿比林規模的基地,就能產生9GW的核心IT算力,而這些算力將全部用於一次AI訓練。

在SemiAnalysis分析中的,隨著數據中心互聯(DCI)建設的持續推進,Marvell和Ciena將成為最大贏家,Fabrinet將獲得可觀收益,而Coherent和Lumentum則會獲得相對較小的收益。

參考資料:

OpenAI Stargate Joint Venture Demystified | Microsoft Sore Loser, Does Softbank Have The Capital?, Texas GigaCampus, Winners & Losers