英偉達新「桌面超算」800GB大內存,滿血DeepSeek R1能裝1個半
夢晨 聞樂 發自 凹非寺
量子位 | 公眾號 QbitAI
英偉達官宣新辦公室落戶中國台灣省台北市,但居然是從太空飛下來的嗎?
當然,這隻是黃仁勳在Computex大會上展示的CG特效,但背後還有這樣一層意思:
如此逼真的畫面中,只有1/10的像素是顯卡渲染的,剩下全部內容為AI預測。
當初是GeForce顯卡讓AI成為現實,現在AI反過來給GeForce顯卡帶來顛覆性變革。
除了正式宣佈新辦公室地址,會上英偉達還宣佈多款重磅新品:
面向個人有DGX Station,在桌面跑1T參數大模型,這回刀法也不用了,足足給到800GB內存。

面向企業有RTX PRO Server,可加速從AI智能體、物理AI、科學計算到渲染、3D圖形和影片等各種用例。

同時老黃還表示英偉達正在經歷一次轉型,從一家芯片公司擴展到一家AI基礎設施公司。

過去幾十年,英偉達從造GPU芯片到造超算系統,現在造數據中心都已經不滿足了,接下來要交付的是「星際之門」、xAI Colossus超級計算集群這樣的大項目。
老黃表示,AI基礎設施市場將以數萬億美元衡量。

此外,這場演講中的其他亮點還有:
-
發佈半定製化NVLink Fusion(混搭,有IP就可用)
-
推出英偉達AI數據平台
-
宣佈與迪士尼合作機器人項目
……
下面一起來看。
「買的越多,創造的越多」
今年第三季度,英偉達主打產品將升級到Blackwell架構GB300超級芯片。
與GB200相比,GB300在算力和內存上約提升50%,網絡連接性能則提升1倍。

2個超級新品組成1個計算節點(node),老黃在現場還拆開實物,詳細展示了其內部構造。
2018年的Sierra超級計算機中包含18000塊英偉達Volten架構GPU,如今一個Blackwell計算節點就可提供同等的算力。
按黃式數學,這叫6年時間性能提升約4000倍。

將這些節點連接在一起就需要NVLink,這次老黃重點了系統的「脊柱」NVLink Spine,內含總長兩英里(3.218公里)的5000條銅纜,將每塊芯片之間全互聯,實現每秒14.4TB的全連接帶寬。

這次宣佈的新品則是NVLink Fusion,允許合作夥伴將NVLink技術應用於定製的機架。
也就是說,非英偉達的CPU和其他加速器也可以與英偉達產品結合使用,同時享有NVLink的高速連接。

數據中心產品之外,英偉達在桌面產品上再次發力。
老黃先透露,之前宣佈的個人AI計算機DGX Spark已全面投產,將於數週內上市。

DGX Spark採用英偉達GB10芯片,能夠提供每秒1000萬億次的AI運算,用於微調和推理最新AI模型。
升級款DGX Station,則首次搭載了與數據中心同款的GB300超級芯片。
英偉達表示DGX Station屬於全新設計的計算機類別,適用於在桌面上開發和運行大規模AI訓練和推理工作負載。
高達784GB的大容量統一內存,最高支持運行1T參數的大模型,也就是說671B的滿血DeepSeek R1能跑一個半。

面向企業的RTX Pro Server搭載了8塊RTX PRO 6000服務器版GPU,96GB GDDR7內存,1.6TB/s內存帶寬。
一台RTX Pro Server機架包括4台RTX PRO Server服務器,提供120PFlops的FP4峰值算力。
現場也特意用了DeepSeek R1模型的測試數據,每花費500萬美元,RTX PRO Server的性價比是H100的四倍。
花更少的錢,生成更多的token。

對於這一系列新品,老黃這次改變了促銷口號。
從「買的越多,省得越多」,變成了「買的越多,創造的越多」。
GPU之外一系列新發佈
老黃表示,人類要查詢像SQL這樣的結構化數據,而AI想要查詢的是非結構化數據,因此需要打造新型存儲平台,也就是NVIDIA AI數據平台。
這個新型的存儲平台不再是依靠CPU,而是配備計算GPU。
並且打造了一個新型查詢系統——Nvidia AIQ或IQ,就像SQL服務器、SQL軟件和文件存儲軟件一樣,類似一個複雜的軟件層。

他還提到,加速運算始於CUDA-X,這個集合幾乎包含了所有領域的加速運算。
比如,Aerial和Sionna能夠將AI帶到5G和6G;Monai可以用於醫學成像;Earth-2用於天氣預報;Coup quantum用於量子經典計算架構;以及Megatron、Dynamo、NIXL等包含了深度學習所有的訓練庫。

英偉達正在研究一類量子經典或量子GPU計算平台——CUDAQ,與全球優秀企業合作,將AI帶入5G和6G。
並且,老黃還提到未來的超級計算機就是具有QPU和GPU的QPU。

物理AI,是機器人革命的基石。
老黃舉了個例子,比如說滾動一球,根據球的速度,它可能到了汽車底下或者汽車的另一邊,但它沒有消失;又比如面前有張桌子,最好的選擇是繞過它或者鑽過去,而不是直接穿過它。
在人工智能時代,AI能夠推理類似的物理事件是極其重要的。
而如今要做的事情就是研究一種能夠根據提示自主生成影片,然後進行訓練的機器人。

在此構想之下,英偉達/GoogleDeepMind/迪士尼合作開發了專為機器人開發而構建的新一代開源物理引擎Newton,可讓機器人學習如何以更高的精度處理複雜任務。
One More Thing
除了演講現場火爆,在會場外的英偉達紀念品攤位這次也很受歡迎。

亮點是其中的文化衫,印滿了老黃的Q板頭像。

只能說,老黃現在是明星級待遇。
影片重播:
參考鏈接:
[1]https://www.nvidia.com/en-us/products/workstations/dgx-station/
[2]https://nvidianews.nvidia.com/news/nvidia-rtx-pro-servers-speed-trillion-dollar-enterprise-it-industry-transition-to-ai-factories
[3]https://x.com/JSolomonCNBC/status/1924245721311809845