全程回顧黃仁勳「全棧AI」演講:萬億美元新藍圖啟動
來源:財聯社
財聯社3月17日訊(編輯 史正丞、牛佔林)香港時間週二清晨,英偉達創始人兼首席執行官黃仁勳在超過兩個小時的「全棧AI」演講中,勾勒出算力巨頭未來一年的發展藍圖。
作為今天最重要的數字,黃仁勳給出了更為激進的算力芯片營收預測:到2027年可能達到1萬億美元。
硬件層面,英偉達展示了新一代Vera Rubin平台及Rubin Ultra架構,以及CPO共封裝光學交換機以及與Groq合作的LPU推理系統。新的架構將GPU用於模型預填充與主要計算,而LPU負責低延遲Token解碼,以顯著提升AI推理效率。英偉達還展示了一款用於太空數據中心的芯片模組。
在軟件與生態方面,英偉達推出DLSS 5和「一鍵養蝦」平台NemoClaw,並宣佈成立Nemotron聯盟,與全球AI實驗室合作開發開放基礎模型,同時發佈開源智能體工具鏈,推動企業構建自定義AI代理。公司認為,未來企業軟件形態將從傳統應用轉向「AI代理平台」。
應用生態方面,英偉達宣佈多家車企加入其robotaxi ready自動駕駛平台,並展示與迪士尼合作的機器人項目。
以下為直擊實錄:
02:00 在黃仁勳登台前,英偉達股價漲超2%,依然在去年8月至今的股價中樞上波動。黃仁勳似乎來晚了一些,演講並沒有準時開始。

02:19 黃仁勳登場!GTC主題演講正式開始

02:20 回顧起點——今年正值CUDA誕生20週年
黃仁勳表示,今天是一場科技大會,我們將探討諸多議題,包括人工智能、AI工廠、硬件設備以及更多精彩內容。
02:30 黃仁勳開場回憶了一番公司歷史,例如CUDA、RTX、GeForce等產品的發展史。
02:34 今天的第一個新品:DLSS 5
英偉達宣佈推出新一代AI圖形技術DLSS 5,通過實時神經渲染模型為遊戲畫面注入更真實的光照和材質效果,被公司稱為繼2018年實時光線追蹤後的最大圖形突破。該技術利用遊戲的顏色與運動向量數據生成接近電影級的畫面效果,並保持實時交互性能,預計今年秋季上線,支持4K遊戲,並獲得多家大型遊戲廠商支持。

演示中出現了《生化危機安魂曲》、《FC 26》等遊戲。英偉達宣佈,產業合作夥伴 / 支持廠商包括卡普空、網易、騰訊等遊戲大廠。
02:50 黃仁勳談應用加速(application acceleration)
黃仁勳表示,加速計算並不是一個系統層面的難題。「加速計算」這個說法其實少了一個詞,只是現在很少再提起——那就是應用加速(application acceleration)。
如果我能讓一台計算機把所有事情都運行得更快,那其實就是CPU的工作,但這種方式已經走到了盡頭。未來我們能夠繼續提升應用速度、實現巨大性能提升並大幅降低成本的唯一方法,就是通過針對應用或特定領域的加速。

黃仁勳指出,面向特定領域的專用軟件庫(domain-specific libraries)將成為解決各個垂直行業具體問題的關鍵——從自動駕駛汽車到金融交易,從機器人到電子遊戲等領域皆是如此。
03:06 黃仁勳:過去三年AI產業的3個裡程碑產品分別是ChatGPT、o1推理模型,以及Claude Code智能體,象徵著推理需求的激增。

03:09 最新營收預測登場!到2027年1萬億美元!!!!!!

黃仁勳說:「去年這個時候我說過,當時站在那個時間點上,我們看到了大約5000億美元的需求——而且是高度確定的需求,包括到2026年的Blackwell和Rubin採購訂單。那是我去年說的。」
他進一步表示:「不過我要告訴你們的是,現在在我所站的位置,我看到的是到2027年將達到至少1萬億美元的規模。」
03:11 黃仁勳:事實上,我們很可能仍然會供不應求。我確信計算需求將遠遠高於這個數字。
他進一步介紹稱,英偉達約60%的業務來自超大規模雲廠商(hyperscalers),也就是那些正在建設數據中心、需要大量AI GPU的公司。另外40%的業務來自其他領域,包括雲服務、企業客戶、機器人、遊戲以及超級計算等。
03:22 黃仁勳開始強調每瓦Token數(Tokens per watt)這個指標。他強調,英偉達的Token成本目前是世界級的,基本無人能及。之所以能夠做到這一點,是因為進行了極端程度的協同設計(co-design)。
黃仁勳還擺出了一個「Token之王」的姿勢。

03:28 Vera Rubin來了

03:33 股民們要的炒作概念噴湧而出。
黃仁勳表示,Vera Rubin系統已經實現100%液冷。過去需要兩天安裝的系統,現在只需要兩個小時就能完成安裝。這同樣是一台採用45℃熱水冷卻的超級計算機。這種方式減少了數據中心的壓力,顯著降低了冷卻成本,並釋放出更多可用電力。第六代NVLink系統也是完全液冷的。

備受關注的Groq LPU系統也登場。這個系統包含8顆LP30 Groq芯片,目前已經進入量產階段。整套LPX機架包括:256個LPU處理器、128GB片上SRAM,合計640TB/s擴展帶寬。
與Rubin GPU協同運行時,GPU和LPU會共同計算AI模型每一層,從而提高生成token的解碼速度。

此外還有全球首個採用 CPO(共封裝光學)的Spectrum-6 SPX交換機。該交換機已經進入全面生產階段。

所謂共封裝光學(CPO),就是把光模塊直接集成在芯片上,使光信號可以直接與矽芯片連接。電子信號在這裏轉換為光信號並直接進入芯片。英偉達與 台積電共同開發了這項製造工藝,目前只有英偉達實現量產。這項技術被稱為Co-Packaged Optics,是一項革命性的技術。
黃仁勳也展示了單獨出售的Vera CPU系統。在後續的新聞稿中,英偉達表示Vera CPU的產業合作夥伴包括Meta、甲骨文、阿里巴巴、字節跳動、Nebius等。

03:40 Rubin Ultra登場

與Rubin橫向滑入機架不同,Rubin Ultra在Kyber機架中是垂直插入的。在一個NVLink域中可連接144塊GPU。
03:45 黃仁勳進一步講解LPU的價值。
他表示,如果你的工作負載主要是高吞吐任務,那麼只使用Vera Rubin就很好。但如果你的工作負載包含大量編程任務或高價值工程任務(例如Token生成),應該在數據中心中加入Groq芯片。

該架構使用了大量SRAM,並且專門針對推理這一單一工作負載進行優化。而推理正是AI工廠最核心的工作負載。
英偉達正在重新設計推理流程,其中Vera Rubin負責 Prefill(預填充)與主要計算,Groq負責低延遲Token解碼生成。目前Groq LP30芯片由三星製造,已經進入生產階段,預計今年下半年發貨。

03:50 英偉達還披露了下一代費曼架構的更多信息。首先,費曼架構GPU將採用3D堆疊芯片。同時,費曼GPU使用的內存不是次世代HBM,而是定製HBM技術。

04:02 英偉達還發佈了一款用於太空數據中心的Vera Rubin模組,不過沒有給出更多信息

04:04 英偉達的「一鍵養龍蝦」平台NemoClaw亮相。這是能夠一鍵部署的完整技術棧。該系統整合Nemotron模型與OpenShell運行環境。


04:15 黃仁勳表示,英偉達與OpenClaw開發者Peter Steinberger,以及全球一些最頂尖的安全與計算專家合作,打造了一整套智能體AI工具鏈。系統內部包含策略引擎(Policy Engine)、網絡安全護欄(Network Guardrails)和隱私路由器(Privacy Router),確保 AI 代理在公司內部執行任務時是安全的。

英偉達還為智能體系統增加了許多能力。其中最重要的一點是:企業可以構建自己的自定義模型和自定義代理。黃仁勳強調,英偉達已經是全球開放模型的最大貢獻者,站在AI模型各個領域的最前沿。

04:20 英偉達宣佈成立「Nemotron聯盟」,聯合多家全球AI實驗室共同開發開放式前沿基礎模型,通過共享數據、算力與研究成果加速AI創新。首個項目將由英偉達與Mistral AI共同訓練基礎模型,並在DGX Cloud上構建,未來將作為Nemotron 4開源模型家族的核心基礎,使企業和開發者能夠針對行業和區域需求進行後訓練與定製。
英偉達同時發佈開源智能體軟件套件,為企業和開發者提供構建與運行AI智能體的軟件平台。該工具支持智能體自主完成複雜任務,並通過安全與策略機制保障部署。英偉達表示,企業未來將通過大量專業化AI代理提升知識工作效率,推動軟件行業向「代理平台化」轉型。

04:25 黃仁勳宣佈,比亞迪、日產、吉利和現代汽車加盟英偉達robotaxi ready平台,並稱「自動駕駛的ChatGPT時刻已至」。

04:30 英偉達與迪士尼的合作也在繼續推進——《冰雪奇緣》中的雪寶(Olaf)機器人登上舞台,與黃仁勳一同展示英偉達如何為這一機器人提供技術支持。

04:35 在一段由AI生成的MV中,黃仁勳的2026 GTC演講落幕。





















