你能買到的5090D到底有什麼區別?

2025年,黃仁勳在CES展上的一個半小時演講帶來了很多東西,像什麼AI模型、自動駕駛、AI機器人等等。但大家最關注的,還得是50系列顯卡,其他的技術代表未來,而顯卡月底就能買到。

發佈會開始沒多久,黃仁勳就展示了基於Blackwell架構的新一代RTX 50系列顯卡。50系列顯卡目前一共公佈了4款,分別是5090、5080、5070ti和5070。

5090作為新一代卡皇,無論是在CUDA核心、Tensor Core等核心參數上都遠超其他產品。但同時5090的價格幾乎為5080的2倍,價格為1999美元,約合人民幣14642元。

50系列顯卡之間等級分明,50系列相較於40系列顯卡在架構、顯存等方面都有升級,以5090和4090為例。

首先是顯卡的架構上,50系列顯卡採用了Blackwell架構,相較於40系列的Ada Lovelace架構,雖同為台積電4nm工藝,Blackwell使用的4nm雙倍光刻極限尺寸(4NP)工藝,不僅提高了能效,還增加了晶體管的密度。

此外,在CUDA核心、張量核心(Tensor Core)和RT Core上,5090都有很大的提升。在標準顯存配置上,5090支持32GB GDDR7,顯存性能直接影響顯卡的整體表現,特別是在處理高解像度圖形時。舉個例子,把數據比作水流,顯存就是水管,水管越粗處理起來就越快。

此外,50系列引入了DLSS4技術更是為遊戲行業帶來了革命性改變。

根據英偉達的所述,RTX 50系列顯卡,可以執行多幀生成功能,通過AI,把一幀渲染成3幀來提高速率。與傳統渲染相比,如果用上了全套DLSS,幀數性能將提高8倍,並且可以實現4K 240幀全光線追蹤遊戲體驗。

DLSS4還引入了實時Transformer模型架構應用。改善穩定性、減少鬼影和在動態場景中提供更好的細節。

以《賽博朋克 2077》遊戲為例,DLSS4技術每秒幀數比DLSS3.5高出100幀,是DLSS2的3倍。首批有75款遊戲支持DLSS4技術,除了《賽博朋克 2077》外,《黑神話悟空》、《寂靜嶺2》等也在其中。

性能更強的50系列顯卡在功耗上對主機也有更高的要求,5090的總功耗達到了575W,比4090高出125W。

總結一下,RTX 5090的整體性能預計比RTX 4090提升70%左右,光線追蹤性能提高2.5倍,計算能力提升2倍,新一代卡皇無疑。

然而在國內我們沒法買到正兒八經的最強顯卡RTX 5090,只能買到特供版RTX 5090D。

2022年10月,美國商務部工業和安全局(BIS)首次對中國實施了高端計算芯片的出口限制,主要針對的是英偉達的A100和H100等高性能GPU。具體來說,如果芯片的I/O帶寬傳輸速率大於或等於600Gbyte/s,並且算力大於或等於4800TOPS受到限制。

這也直接導致了在國內只能買到閹割版的4090D。英偉達把4090D的CUDA核心從16384個減少到14592個,總功耗也從450W降至425W,才勉強通過了美國的限制。

然而,5090D相較於5090,從公佈的參數來看,除了AI算力外沒什麼區別,功耗沒降低,CUDA核心數也沒少。

根據官網數據,5090D的張量核心(Tensor Core (AI))算力為2375AI TOPS,而5090比前者高出40%,達到了3352AI TOPS,除此之外的其他的參數基本一樣。

Tensor Core是英偉達顯卡獨有的AI加速器,主要是為了加速深度學習和人工智能(AI)計算。

專業點來說,Tensor Core是針對深度學習和AI工作負載而設計的專用核心,可以實現混合精度計算並加速矩陣運算,尤其擅長處理半精度(FP16)和全精度(FP32)的矩陣乘法和累加操作。

同樣訓練一個大模型,你用5090D就會比5090慢不少,但相較於4090的1321 AI TOPS,5090D還是快不少。

但話說回來,真做人工智能的企業,大多會選擇專業卡,像B200、H100。50系列顯卡作為消費級顯卡,很多人買來是為了玩遊戲的。

在遊戲方面,5090D可能略微落後於5090。

在英偉達的通用GPU架構中,主要存在三種核心類型:CUDA Core、Tensor Core以及RT Core。其中CUDA Core和RT Core分別負責遊戲的核心圖形渲染和光線追蹤,這兩個參數上,5090D和5090沒有區別。

然而,英偉達顯卡在遊戲方面還有一個賣點:DLSS技術。英偉達使用深度學習算法在較低的解像度下渲染遊戲畫面,然後通過Tensor Core把圖像放大並提升質量。5090D的Tensor Core低於5090,那麼在DLSS方面會有所落後,但同樣的,5090D還是高於4090的。

關於5090D外網有人分析,在硬件上5090D一刀沒砍,僅僅是在軟件上限制了算力。

簡單總結一下,中國特供版5090D,在AI算力上落後於5090,Tensor Core少了約40%,其餘方面基本一致。

然而,中國特供版的5090D官網價格為16499元起,相較於售價1999美元(14642元)滿血版的5090,還貴了一些。。。

全文完。