AIGC生產力、3A遊戲統統不能錯過

 

大家好,我是昭華凋

618 大促相信對於眾多 DIY 玩家來說是個攢硬件的好日子,作為裝機大頭的顯卡應該有不少朋友都在關注。而作為老黃家的次旗艦 nvdida RTX 4080 SUPER ,想來也有不少小夥伴既想入手,又糾結於性能價格是否對等。

有鑒於此,我也利用手頭的索泰 RTX 4080 SUPER 顯卡做了幾項測試,順便分享下個人對 RTX 4080 SUPER 定位看法。

快問快答

NVIDIA Ada Lovelace 架構優勢何在

RTX 40 系列顯卡這次採用了全新的 NVIDIA Ada Lovelace 架構,以早期計算先驅Ada Lovelace 的名字命名。工藝採用定製 TSMC 4N NVIDIA工藝,核心面積從上一代的 628.4mm² 縮小到 608.5mm²,晶體管數量從上一代的 283 億個提升至 763 億個。最恐怖的是核心面積一直在縮小的同時晶體管數目保持誇張的增長速度,同時功耗也持平甚至更低於上代。

全景光線追蹤:Ada Lovelace 架構引入了新的全景光線追蹤技術,包括新的 RT 核心、更多的著色器以及新的 Tensor 核心,這些技術的結合使得光線追蹤的性能得到顯著提升。光流加速器:架構中增加了光流加速器的運算性能,從Ampere架構的 126 TFLOPS增加到 300 TFLOPS,這使得DLSS 3能夠預測場景中的運動,提高幀率同時保持圖像質量。DLSS 3技術:DLSS 3 包括幀生成技術、DLSS 2 超解像度技術和 NVIDIA Reflex 技術,為遊戲體驗的流暢度、延遲和畫質提供全方位的提升。編碼器升級:NVIDIA 編碼器 (NVENC) 升級到了第八代,開始支援 AV1 編碼,其效率比 H.264 高 40%,減少了數據量需求,同時提高畫面質量。第四代Tensor Core:Ada架構搭載了新的第四代Tensor Core,支援FP8數據類型,增加了INT4支援,同時去掉了 FP64 的支援,提供更高的AI計算性能。第三代RT Core:Ada 架構的第三代 RT Core 將光線與三角形求交性能提高了一倍,同時 RT-TFLOP 峰值性能也提高了一倍,引入了 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎,大幅提升了光線追蹤的速度和效率。著色器執行重排序(SER):SER 技術能夠動態調整工作負載的順序,最高可將光線追蹤操作的著色器性能提升2倍,或將遊戲幀率提升 25%。架構規模增大:Ada Lovelace 的GPC數量從Ampere的最大7個增加到12個,二級緩存規模是上一代的 16倍,顯著提升了性能。顯存帶寬和PCIe支援:支援 1TB/s 的 GDDR6X 顯存帶寬和 PCIe GEN4 ,提供更高的數據傳輸速率。NVIDIA RTX 6000 GPU:基於 Ada Lovelace 架構的 RTX 6000 GPU 為NVIDIA Omniverse™ Enterprise 平台提供了卓越的圖形、AI 和計算性能,促進了協作、內容創作和仿真的發展。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

RTX 4080 SUPER到底升級了什麼?

不同於上代 4080 殘血 AD103 – 300 核心,4080S 是真滿血版本 AD103 – 400 ,擁有完整的 80 組 SM 單元、流處理器多了 512 顆。此外顯存位寬不變的情況下,顯存頻率提升到了 23Gbps(22.4Gbps),帶寬上升到了 736GB/s(717GB/s)。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

從數據方面來看,RTX 4080 SUPER 領先 4080 大概 5% 左右,不過反映到實際遊戲場景,提升大概在 2% ~ 3% 左右。不過這都不是重點,重點是RTX 4080 SUPER的發售價比RTX 4080 還低了約 16.7%,增量降價沒跑了

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

哪些用戶是否需要 RTX 4080 SUPER

經常有朋友問我這個問題,所以單獨拿出來說 一 說

先說結論

2K 解像度,主流單機大作採用中高畫質,4060TI 級別的顯卡完全沒問題

4K解像度,主流單機大作採用高畫質,4070TI / SUPER 級別的顯卡都可以應對,遊戲性能大概比 4070Ti 強 11% 追求高刷就開 DLSS3 性能檔,或者關閉幾個影響畫質的選項

整個 SUPER 系列,我最推薦的就是 4080 SUPER

4070 SUPER 性能上提升最大,但顯存拉了後腿,適合預算有限的朋友

4070TI SUPER 要好很多,顯存來到了 16GB,玩遊戲不容易爆顯存;支援雙視頻編碼器協同工作,我之前做過與 30900TI 的達芬奇輸出測試,速度會提升一倍以上,但是性價比最低

4080 SUPER 的優勢在於滿血 AD103 – 400 核心,等效頻率 22.4GHz ,甚至超過了 RTX 4090 的 21GHz。算力方面提供了高達 52 TFLOPS、121 RT TFLOPS 以及 836 AI TOPS,可以更好的滿足遊戲生產力用戶。最重要的是 618 期間價格已經幹到 8K 以內,相比 4070 SUPER 價差不大但性能提升巨大。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

再來談談型號選購,就我看來,一 線品牌性能釋放都差不多,SUPER 系列在功耗上也和 40 系保持 一 致,像 4080 SUPER 滿載也不過 320W,散熱壓力並不大,所以我認為選購時性價比是最應該考慮的因素,其次下來則是品牌口碑、售後、散熱以及設計等因素。

下圖是網上蒐集的各品牌 4080 SUPER 用料表(並未涵蓋所有)

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

本次測試的主角是索泰 RTX 4080 SUPER 16GB TRINITY OC 月白,推薦理由里很簡單。

首先是品牌靠譜,畢竟後面站著的是 NVIDIA 核心夥伴栢能,性能、品質口碑都是一流,但又比禦三家的價格更加親民。其次月白這個系列我前前後後入手過 4060TI、4070TI,總結就是不算堆料但性能釋放相當出色,溫度控制的也很好。正如我前面所說,40 系顯卡尤其是高端系列都屬於規格溢出,反而是月白這種供電散熱不存在短板,同時又保持了親民的價格定位。此外,推薦它的原因是顏值高。眾所周知,純白系顯卡本來可選餘地就小,而能把設計感做的到位更是鳳毛麟角,索泰月白系列算是少有的高顏值白色系顯卡,對於搭建純白主機很有優勢。對了,索泰月白系列還有個優點 ~ 身材纖細、長度適中,對小尺寸機箱兼容性較好。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

純白圓潤,不誇張但實用的機體造型

索泰 RTX 4080 SUPER 16GB TRINITY OC 月白,和天啟系列同為它家次旗艦(再往上就是 AMP 和 PGF )。相比公版卡來說基頻相同,但核心頻率提升到了 2565MHz。由於沒有進行過於激進的官方超頻,因此,這塊卡可能是目前市場上價格最實惠的白色 RTX 4080 SUPER 顯卡之 一。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

索泰 RTX 4080 SUPER 16GB TRINITY OC 月白基於三風扇設計,純白配色,轉角採用曲線過渡顯得較為圓潤。三 只直徑 90mm 的“仿生盾鱗2.0”風扇,不僅加大了扇葉面積,而且利用鱗狀仿生條紋和特殊定製的曲率,優化風扇的進氣風道,起到增加風壓、減小亂流的效果。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

▼風扇支援支援智能啟停技術,可以在高、低溫度和負載之間讓風扇智能啟停,減小噪音,增加顯卡壽命。同時,用戶還可以利用索泰的 FireStorm 軟件來自定義風扇的轉速和性能曲線,以適應不同的使用場景和個人喜好。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

顯卡頂部設計了一個醒目的鏤空品牌標識,內部鋪設了名為“虹橋幻影”的大型 RGB 燈帶,高達 1670 萬種顏色的自定義設置,可以通過 FireStorm 軟件進行個性化調整,以滿足不同場景下的工作模式需求。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

▼顯卡內部是索泰自家的 IceStorm3.0 散熱系統,由仿生盾鱗 2.0 三風扇、7 條 6mm 鍍鎳熱管以及加厚型散熱模組構成,配合 11 + 2 相的供電設計,可以很輕鬆壓製顯卡產生的熱量。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

▼顯卡背部是從 一 體成型合金背板,金屬背板不僅增強了顯卡的結構穩定性和電氣性能,特殊的尾部的通風孔設計有助於提高散熱器的空氣流動,從而提升散熱效率。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

30.7 * 59 * 12cm 的尺寸、2.5 卡槽佔用,在同規格顯卡陣營堪稱纖細,可以更好的適配小尺寸機箱。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

4K 毫無壓力,開啟光追更輕鬆

本次測試平台如下,處理器是 Intel Core™ i7 14700KF,搭配 Z790 小雕,足以保證不拉後腿。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

遊戲加加性能跑分總體得分 190056、工作站性能 M-374557。CPU單核性能評分 39492分、CPU多核性能評分 583500分、GPU性能評分 148380分、 得到了“S”級評價。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

首先是 3D Mark Fire Strike,這是一項適用於高性能遊戲電腦和超頻系統的 DirectX 11 基準測試,其統 一 的打分機制對於不同設備的性能比較很有參考。實測下來,索泰 RTX 4080 SUPER 16GB TRINITY OC 月白的總得分為 51976 分,其中顯卡分數 64417分,預估在【荒野大鏢客2】遊戲最高畫質下可跑到 130+FPS 以上的好成績。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

▼而 4K 版本的 Fire Strike Ultra,顯卡得到了17959 分,,其中顯卡分數 17469分,預估在【荒野大鏢客2】遊戲最高畫質下可跑到 105+FPS 以上的好成績。此時 GPU 最高溫度 45.04°C,GPU 負載 38.99%,GPU 時鍾頻率 2760MHz.

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

Time Spy 則是針對 DirectX 12 遊戲設計的基準測試,支援原生 API 功能,比如如異步計算,多顯卡適配器技術和多線程。實測下來,索泰 RTX 4080 SUPER 16GB TRINITY OC 得分為 27470 分,其中顯卡分數為 28339 分,預估【戰地5】最高畫質下可以跑到 200+FPS 。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

Time Spy Extreme 作為進階版,看重的是 4K 解像度下 DirectX 12 的遊戲性能測試。實測下來顯卡得分為 6297 分,其中顯卡分數為 6068分,預估【戰地5】最高畫質下可以跑到 135+FPS ,

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

針對實時光線追蹤的【Port Royal】總分 18110分,大力水手關閉 40.21FPS,開啟能跑到 134.79FPS,提升極為明顯。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

賽博朋克作為少有的同時支援 INA 三家超解像度技術,以及光追與 DLSS 3 技術的單機大作,自然不能錯過測試。在預設的 4K 解像度 / 超級光追模式下 平均幀率 能做到 113.90FPS,最小幀率都能跑到 80FPS 以上。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

▼設置不變,僅將“大力水手”切換到性能檔,平均幀率來到 148.81FPS,最小幀率也來到了 128FPS 以上。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

極限競速:地平線 5 在 4K 解像度,預設極端模式下,平均幀率 122FPS,最低幀率 113FPS

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

▼原設置不變,開啟NVIDIA DLSS AI 超解像度(超高性能)、DLAA關閉、開啟幀生成技術,平均幀率 166幀,最低幀率,主打流暢二字。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

Ubisoft的 3A 大作刺客信條.幻境,這遊戲的優化著實喜人,但最高只支援 nvdida DLSS2 技術.雖然有國外網友開發了 DLSS 3 幀生成 MOD,但使用之後遊戲內置的 benchmark 就無法運行。這裏我測試的 4K 解像度最高畫質,遊戲平均幀率達到了 101FPS,最低 1% 也有 83FPS。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

溫度測試環節,利用 Furmark 對 索泰 RTX 4080 SUPER 月白進行烤雞,在負載拉滿的情況下,顯卡最高功耗跑到了 320W 左右,完美對應標稱數據。此時 GPU 表面溫度 76°C 左右、熱點溫度 90°C 左右,考慮到顯卡本身並沒有做誇張的散熱設計,這個溫度控制應該算是相當完美。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

AI 生產力才是王道

40 系顯卡價格偏高,最重要的原因它不是純遊戲卡,對於跑 AI 的朋友來說更是妥妥的生產力需求。

為什麼說 N 卡最適合跑 AIGC?

確切來講,AIGC 技術並不局限於 NVIDIA顯卡 ,但目前大多數加速計算環境是基於 CUDA 構建的,而 CUDA 是 NVIDIA 開發的技術,NVIDIA的 GPU 擁有卓越的並行處理能力和針對 AI 工作負載優化的架構。例如,NVIDIA 的 DLSS 技術,它通過 AI 生成額外的幀來提升遊戲和應用程式的渲染性能,這就是 AIGC 技術的 一 個應用實例。此外,市面常見的 AIGC 模型都是用 N 卡跑出來的,所以硬件兼容度也是最高的。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

我之前出過一篇利用 Stable Diffusion 跑本地 AI 繪圖的文章,相比流行的 Midjourney(Mid)來說,Stable Diffusion 可以進行本地部署,部署完畢可以免費無限次使用,沒有使用成本,在圖像質量和用戶可控性都更高。但也因為需要本地跑圖,所以對硬件有一定的要求,尤其是 GPU,推薦至少 4GB 顯存的顯卡,8GB 及以上顯存可以獲得更好的性能。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

本次 AI 繪圖測試同樣基於 Stable Diffusion 本地模型,評測之前先和大家分享下索泰 RTX 4080 SUPER 的優勢

眾所周知,在 AI 繪圖領域,核心數量主要決定計算的快慢,顯存大小則決定解像度、模型以及批次數量的上限。

對於 SD 來說,12GB 顯存已經可以滿足日常圖像繪製的需求,不過如果你喜歡嚐試不同的插件、擴展、乃至相互組合生圖

那麼 16GB 可以更好的保證不出現爆顯存的風險。

更別提現在流行的視頻生成項目,這可比生成靜態圖片所需顯存要求可大了一截

所以,選擇大顯存不僅是速度更快,而且在其他項目的嚐試也能更加的自由

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

本次 AI 測試基於秋葉aaaki 大佬的整合包和 SDXL 大模型,首先做哈準備工作

顯存優化這裏,如果是 >12GB 顯存就選無優化,

然後關閉下方的 VAE 半精度優化

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

進入 Stable Diffusion ,先來到系統信息 – 基準測試跑個分

索泰 RTX 4080 SUPER 16GB TRINITY OC 月白在預設模型下跑出了 16.49it/s、24.56it/s、28.14it/s

這是什麼水準呢,從跑分天梯圖來看就是妥妥的第二名(排名僅供參考,數據量目前很少)

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

換成 SDXL 大模型 + SDXL VAE 的組合,分數就會驟降到 6.41it/s、11.73it/s、19.53it/s

要知道,這還是優化相對算好的高質量模型,想想要是用優化普通的模型 + LORA + 額外擴展的組合,渲染量一大不崩才怪。

這應該就是高端卡的優勢所在 ~ 生產力!

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

使用 SDXL 1.0 模型、搭配 sxdl/VAE 模型,采樣方法: DPM++2MSDE、迭代步數:60;圖片寬度:1024;圖片長度:1024;總批次數:1;單批數量:8。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

耗時 1 分 56秒,顯存最高達到了 13.3GB,基本上 4070TI SUPER 以下陣亡了。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

成品圖

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

不僅如此,Nvidia 還專門推出了用於加速 AI  矩陣運算 的 Tensor Cores ,這是一個針對深度學習推理的高性能 GPU 加速器,它可以自動對神經網絡模型進行優化,提高運行速度並降低內存佔用。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

Stable Diffusion 中使用相同的提示詞,一次生成 20 張圖片,對比 Tensor Cores 加速前後耗時

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

Tensor Cores 加速前後,生成時間從 2 分 36 秒縮短到了 1 分 43 秒,加速實際效果達到了 51%。

這還只是用的基礎模型庫,關鍵字等各項參數也不複雜,換成高解像度輸出和多模型組合的話,這個差距只會越來越大。

而這才是老黃卡不愁賣的根本原因,生產力永遠是核心需求。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

總結

增量減價,堪稱良心,這是我對 Nvdida RTX 4080 SUPER 顯卡的看法。遊戲性能相較於 RTX 4080 有 2%~10% 提升,可以很輕鬆滿足 3A 大作對畫質和幀率的需求,滿血版 AD103 核心和 16GB 的超大顯存,對於需要進行視頻編輯、3D建模等高負載任務的生產力用戶來說,簡直就是雪中送炭。大顯存意味著你可以同時打開更多的應用,處理更大的文件,而不會感受到絲毫的卡頓。

索泰 RTX 4080 SUPER 16GB TRINITY OC 月白則是家用遊戲顯卡的典範。小巧纖細的機身,可以輕鬆適配各種小型機箱,讓你的桌面空間不再受限。而且,它並沒有因為體積小而犧牲性能,對比某些品牌用誇張的造型、過分的堆料來強行提高價格,索泰這樣的做法無疑才是真正為玩家著想。

PS:發文前突然發現的福利:

國產3A遊戲之光《黑神話:悟空》即將於8月20日正式發售,恰逢當下618年中購物狂歡節,索泰攜手NVIDIA給玩家們送福利啦,沒錯,就是送《黑神話:悟空》WeGame平台標準版遊戲(價值268元)。

AIGC生產力、3A遊戲統統不能錯過_新浪眾測

即日起至2024年6月18日,在指定店舖購買索泰 GeForce RTX 4070及以上顯卡或電腦整機,即可申領《黑神話:悟空》遊戲兌換碼。

兌換碼數量有限,先到先得,贈完即止。