英偉達吃透GPU紅利,GeForce 256是偉大的起點?

來源:雷科技AI硬件組 | 編輯:天星 | 排版:Czy

2024 年 8 月,國產遊戲《黑神話:悟空》正式開售。作為近期熱度最高的國產遊戲,《黑神話》憑藉出色的劇情發展、場景設計和配樂成功「出圈」,不僅遊戲愛好者們「人手一份」,不少已經「戒遊戲」的老玩家也選擇趁機升級電腦,換張新顯卡好好享受遊戲。

儘管這種為了遊戲而換顯卡的行為看起來有「衝動消費」的意思,但回顧近幾年的遊戲史,我們不難發現,每次現象級遊戲走火,同時也有大量玩家為此升級顯卡。比如用豐富遊戲性推動 GTX 1060 顯卡的《PUBG》和《鬥陣特攻》,用出色營銷和畫質推動 RTX 時代的《賽博朋克 2077》,成為 RTX 4060「帶貨王」的《Apex》。可以說每一款成功遊戲的背後,都有一張「現象級 N 卡」。

圖片來源:英偉達圖片來源:英偉達

那麼問題也隨之而來——英偉達第一張遊戲顯卡面世時,遊戲行業是怎樣的呢?

1999 年,英偉達發佈了其第一張遊戲顯卡——GeForce 256。但在 GeForce 256 發佈之前,市場上已經存在多個顯卡(GPU)品牌,如 3dfx 的 Voodoo(巫毒)系列、Matrox(邁創)、S3 Graphics、ATI 的 Rage 系列。

和現代的 GPU 一樣,這些 GPU 同樣基於 3D 加速技術,但可惜的是,這些 GPU 產品缺乏統一的 3D 加速製式。這意味著遊戲開發者必須針對不同顯卡優化遊戲,顯著增加了開發成本和難度。此外受產品性能的限制,這些 GPU 也無法支撐複雜的 3D 遊戲。

與此同時,《古墓麗影》、《雷神之錘2》、《星際爭霸》等遊戲的流行也推動了玩家對 3D 遊戲的期望。也就在這時,英偉達 GeForce 256 出現了。

GPU計算爆發,

都有哪些先行者?

GeForce 256 是全球首款被稱為 GPU 的產品,源於其首次將圖形處理的多個功能集成於單一芯片,這一行為定義了 GPU 這一概念,同時也將複雜的 3D 渲染任務從 CPU 中解放出來,賦予 GPU 專門的計算職責。從 GPU 的歷史進程來看,這也為後來 GPU 的廣泛應用奠定了基礎。

圖片來源:英偉達圖片來源:英偉達

此外,GeForce 256 也將 T&L(Transform & Lighting、變換與光照)硬件加速集成到 GPU 中,使 3D 場景的變換和光照計算由 GPU 專門負責。這是圖形處理史上的重大突破,以前這類計算任務通常由 CPU 執行,不僅效率低下,而且限制了遊戲畫面的表現力。借助 GeForce 256,遊戲畫面的複雜性和細節大幅提升,推動了 3D 遊戲時代的到來。

而且 GeForce 256 出色的性能也將 GPU 這一概念帶到遊戲行業之外。別著急,此時的英偉達還沒拿出 CUDA 這種改變 GPU 行業生態的大殺器。但 GeForce 256 出色的性能,確實為 GPU 在科學計算、金融分析等領域的應用奠定了基礎。

如果說 GeForce 256 開啟了 GPU 圖形運算的時代,那英偉達在 2008 年發佈的 GeForce 8800 GTX,則真正解放了 GPU 的性能。很顯然這張顯卡的性能放在現在早已不值一提,但這張顯卡上,英偉達提出了 CUDA(統一計算架構)這一概念。

CUDA 的出現讓 GPU 不僅可以用來處理圖形運算,還可以用來執行、加速基於 CUDA 的通用計算,讓電腦成為真正的通用工具。

圖片來源:英偉達圖片來源:英偉達

而在提出了 CUDA 後,英偉達也在 2018 年進一步對 GPU 的算力進行細化,引入了 RT Core、Tensor Core 的概念,讓光線追蹤和專門的 ML 計算成為可能——Tensor Core 通過高效執行大規模矩陣運算,顯著加快了 AI 模型的訓練和執行速度。

根據英偉達的介紹,現階段 RTX AI 已經對 10 種不同的 AI 場景實現覆蓋,包括遊戲、影視、自動駕駛和科學計算等領域。深受英偉達用戶喜愛、可以顯著提高遊戲 FPS 的 DLSS,就基於 Tensor Core 來實現,可以說是廣大遊戲玩家最早接觸到的真 AI 用例了。

圖片來源:英偉達圖片來源:英偉達

在影視製作領域,RTX AI 加速渲染速度,使複雜的光線和反射效果在短時間內完成,從而縮短了製作週期。在自動駕駛方面,RTX GPU 處理大量圖像和傳感器數據,支持實時決策,提高車輛的安全性與精準性。此外,AI 還用於醫療影像處理、金融預測和科學模擬,加速數據分析和預測模型的訓練。

不誇張的說,RTX AI 的出現不僅推動了高端視覺效果和 AI 計算的融合,還降低了企業使用 AI 的門檻。它正逐漸成為各行業提升效率、創新業務的關鍵引擎,引領未來技術的發展潮流。

GPU計算驅動AI,

但AI計算不全靠GPU

但話說回來,儘管 GPU 的算力提升讓 AI 能以驚人的速度普及,現階段英偉達確實是 AI 算力的代名詞,以及個人 AI 計算機的唯一選擇。但這是否意味著美歐強勁 GPU 的設備,就無緣 AI 時代呢?

答案是否定的。

在 2024 雲棲大會上,阿里集團 CEO、阿里智能雲董事長兼 CEO 吳泳銘表示:

生成式 AI 改變計算架構,從 CPU 主導的計算體系到 GPU 主導的 AI 計算遷移。AI 時代將是「GPU 算力為主,CPU 算力為輔」的計算模式。2024 年市場新增算力,超過 50% 的需求 AI 驅動產生,這一趨勢將持續擴大。

不可否認,即使是阿里雲提供的 AI 雲算力,背後也主要由 GPU 驅動。但從另一個方面想,將 GPU 算力集中在雲端,配合設備本地的 CPU、NPU 進行混合 AI 運算,其實也不失為一個好主意。

首先,這可以緩解算力瓶頸,提升計算靈活性。GPU 在 AI 計算中的核心地位毋庸置疑,但個人開發者和消費者通常難以承受購買和維護大量 GPU 的成本。將 GPU 算力集中在雲端,允許用戶按需租用雲 GPU 資源,可以避免一次性高額投入。這種模式也提供了極大的彈性,可根據任務需要隨時擴展或縮減算力。

其次,許多終端設備受限於尺寸和功耗,無法配備高性能 GPU。通過在雲端完成複雜的 AI 運算,並將結果傳輸至本地設備執行簡單任務,設備可以保持輕量化且功耗低。這種混合計算模式,特別適合邊緣設備和移動終端。

圖片來源:英偉達圖片來源:英偉達

而且在本地 CPU 和 NPU 的配合下,雲 GPU 的計算能力可以得到最大化利用:設備本地的 NPU 可以快速處理延遲敏感的任務,如語音識別和實時圖像分析;而複雜的模型訓練和推理則交由雲端 GPU 完成。這種模式有效縮短了計算響應時間,提升了用戶體驗。

短時間來看,英偉達在 AI 算力市場的優勢仍然巨大,但是長遠來看,群狼環伺之下的 AI 市場,英偉達雙拳難敵四手。諸如移動 PC、智能終端等英偉達的弱勢市場,很快就會被其他廠商瓜分乾淨,而關鍵的服務器市場也並非高枕無憂,AMD 的 MI300 系列 AI 顯卡份額增長迅速,已經足夠引起英偉達的警覺。

不過,競爭所帶來的創新與發展,才是科技進步的關鍵,隨著 AI 領域的競爭加劇,實際上也在推動 AI 成本的下降,讓 AI 技術得到更快、更廣泛的應用。就像吳泳銘說的那樣:

AI 驅動的數字世界連接著具備 AI 能力的物理世界,將會大幅提升整個世界的生產力,對物理世界的運行效率產生革命性的影響。

一個圍繞 AI 而生的新生態,此時此刻就在我們面前。