黃仁勳自掏腰包50億,開源英偉達GPU管理工具

賈浩楠 發自 凹非寺

量子位 | 公眾號 QbitAI

離2025年只剩十幾個小時,黃仁勳拿出50億真金白銀給大家發紅包了!

他剛花7億美金(51億RMB)收購了一家初創公司,專門做GPU管理工具的。

並且立刻就宣佈:開源所有平台和技術,買了英偉達GPU就能免費用。

不愧老黃,花「小錢」辦大事。

英偉達新收購

英偉達剛剛完成收購的這家公司,名字叫Run:ai,2018年成立,投資人包括著名的老虎基金、Insight Partners、紅杉資本等等。

創業7年時間,Run:ai做的產品全部圍繞一件事——怎麼用GPU,當然不是個人PC,而是圍繞AI、工業領域的訓練計算任務,包括研發、管理、配置等等一系列工具。

簡單來說,Run:ai有一整套基於Kubernetes(Google的開源容器編排引擎)的開放平台,提供GPU管理工具。簡單來說,Run:ai有一整套基於Kubernetes(Google的開源容器編排引擎)的開放平台,提供GPU管理工具。

對於開發者來說,ai Dev提供從概唸到部署的過程開發工具。比如提供各種集成開發環境的工具、內置W&B、Comet.ml、MLflow等等工具追蹤訓練結果、提供訓練數據集的管理工具…

所有這些功能,全都以最直觀最「傻瓜」式的方式,清晰呈現在操作面板,所見即所得:

另外,ai Dev還支持自動化分佈式訓練,一個命令行就可以將訓練負載擴展到多個 GPU 節點…

其他的產品還包括ai Control Plane,也是可視化的面板,用來管理用戶本地的GPU設施、在不同任務間一鍵分配算力資源、記錄GPU的能耗成本等等功能:

當然,Run:ai還提供了AI 工作負載調度程序,用戶只用設置優先級和各項任務的配額,系統會自動優化資源分配。

目前Run:ai 的解決方案已經與NVIDIA DGX、NVIDIA DGX SuperPOD、NVIDIA Base Command、NGC containers和NVIDIA AI Enterprise軟件等等產品集成。

總的來看,英偉達花7億美金買的Run:ai,本質就是一個GPU的「數據產品經理」:提供業務看板、GPU權限分配、任務分配…等等直觀可視化操作工具。

在收購同時,英偉達還宣佈開源Run:ai的所有平台技術

Run:ai的用戶,包括全球打印機巨頭斑馬技術、用端到端技術一鳴驚人的自動駕駛公司Wayve、倫敦醫學影像與人工智能中心等等。

舉個簡單的例子,Wayve通過Run:ai提供的工具,將原先不足25%的GPU集群效率,提升到80%以上。

對於有雄厚研發實力和AI積累的大公司來說,這樣的內部工具自研不是問題,但對於中小規模、非AI行業的用戶來說,Run:ai這一套不高深的技術,卻很關鍵。

英偉達收購Run:ai,好處有什麼?

回想一下2018年時,深度學習技術才剛剛在落地應用方面嶄露頭角。那時的英偉達市值只有1000多億美元,主要產品還是20系列顯卡,AI計算硬件也是基於RTX遊戲顯卡改的。

但就是在2018年,老黃第一次公開提出傳統GPU已經到達極限,英偉達今後要戰略轉向:「重新發明圖形處理器用於AI」,適應飛速增長的AI訓練、研發需求。

現在看來,老黃在2018年做出了一項重塑AI、科技,甚至千行百業的重大決策。

帶著英偉達突破3萬億美元市值,也讓技術沒那麼高深,但眼光獨到的Run:ai水漲船高。

但問題是,老黃收購之後就立刻搞開源,有必要嗎?

直接和Run:ai合作,賺企業的錢不是更好?

所以說黃仁勳是花小錢辦大事呢~

現在的情況是,核心的GPU架構、性能本身,能威脅到英偉達的其實並不多。目前英偉達控制著高端芯片市場80%的份額,幾乎100%的AI計算份額。

但老黃一直在尋求構建產品+生態的立體優勢。

比如在 2019 年斥資 69 億美元收購了高性能計算公司 Mellanox,還收購了用於邊緣 AI 工作負載的 OmniML、用於數據存儲和管理的 SwiftStack 以及用於塊存儲的 Excelero。

另外英偉達還在硬件、軟件、數據中心管理平台、機器人技術、安全分析和移動能力等方面進行了大量投資。

最廣為人知的案例,應該就是當年試圖以 400 億美元收購英國芯片設計公司 Arm,但因為反壟斷原因終止。

老黃一直在做的,就是AI行業的垂直整合,從芯片到工具再到軟件應用,打造一個能滿足任何AI用戶的一站式商店。

買英偉達GPU,現在直接送「開箱工具」。

讓AI創業公司更集中資源在主要業務,同時也給千行百業亟需被AI重塑的玩家掃除門檻。

移動互聯網時代,蘋果用這套打法登頂封神。

AI時代,英偉達直接Control C+V。