AMD新核顯性能媲美4070!APU將成AI PC主流方案?
很長一段時間里,人們對於CPU核顯的性能,都還停留在「能用」的階段, 不過蘋果的M系列芯片核顯卻顛覆這一認知,讓大家意識到核顯的性能其實也有很大的進步空間。
在核顯領域,強大的並不只有蘋果,在獨顯市場被英偉達打得滿地找牙的AMD,前段時間就曝光了目前最強的x86架構核顯,並將會搭載於未來發佈的Radeon 8000S系列上。
作為x86生態的一員,AMD的核顯在泛用性上無疑是遠遠超越蘋果的,而且從目前曝光的信息來看,其性能更是一個大「驚喜」。
AMD核顯大戰獨顯,
底氣何在?
近日曝光的AMD新核顯,其芯片代號已經基本確定,並非沿用此前的Radeon 800M/900M,而是直接更名為Radeon 8060S和Radeon 8050S。新的命名方式與AMD積極發佈的下一代RX獨立顯卡保持一致,換言之所採用的核心與AMD的獨顯大概率是同款。
雖然此前AMD也嘗試過將獨顯核心部署到CPU里,但是受限於工藝製程,並沒有取得很好的效果,所以後續還是單開一個序列,只是沿用了獨顯的同款GPU架構。不過,即使並非同款核心,出色架構設計帶來的性能提升也讓AMD的APU(AMD對擁有高性能核顯單元的CPU的稱呼)成為x86最強。
而在台積電的3nm製程成熟後,加上DDR5內存的成熟以及CAMM2內存標準的正式確定,AMD也終於找到了進一步提升核顯性能的機會。從曝光的信息來看,Radeon 8060S/8050S將分別擁有40/32個CU單元,其中Radeon 8060S的單元數與蘋果的M4 Max一致,其實際性能或將接近移動版的RTX 4070。
如果曝光信息無誤,那麼這將會是核顯性能首次能夠與高端獨立顯卡角力,要知道上一代核顯的實際性能只是剛好超過GTX 1650的水平(英偉達在2019年發佈的入門級獨顯),而RTX 4070則是英偉達2023年發佈的高端顯卡,如果按綜合測試的基準成績來算,RTX 4070的性能約等於GTX 1650的3.8倍。
如此大的提升是怎麼做到的?很簡單,看看CU單元數量就知道了,Radeon 890M的CU單元數量只有16個,而Radeon 8060S則是40個,是前者的2.5倍,即使其他參數不做調整,性能也將是前者的兩倍以上。
而且,搭載Radeon 8060S的銳龍AI MAX 300系列將會採用chiplet分離式設計,簡單來說將GPU芯片與CPU芯片分開封裝並彼此獨立。因此可以在CPU里塞進超大規模的GPU核心,甚至從曝光的內部設計圖來看,GPU核心的面積要明顯大於CPU核心。
另外,chiplet分離式設計還可以讓AMD將HBM3內存集成到芯片內,作為GPU核心的獨立顯存使用,解決主板內存帶寬和速度無法滿足GPU性能釋放的問題。正是因為有望解決了GPU核心以及顯存帶寬問題,才讓新一代核顯在性能上出現了驚人的突破。
核顯性能媲美高端獨顯,或許真的不只是說說而已了。
AI時代,
核顯成芯片巨頭必爭之地
為什麼AMD要執著於將高性能的GPU塞進CPU里?以前主要是為了押注入門娛樂PC的賽道,只需要購買一個比同規格CPU貴一點的APU,你就可以得到一個高性能CPU+入門級獨顯性能的核顯,能夠滿足網遊及部分單機遊戲的娛樂需求,而且因為不需要考慮顯卡的安裝,可以做成盒子大小的迷你主機,便於部署和擺放。
但是隨著AI大模型的出現,APU的用途就悄然發生了變化,核顯的用途不再是影片編解碼加速和遊戲,而是成為AI算力的一部分。雖然現在的CPU大多將NPU作為主要的AI算力來源,但是GPU在並行計算和高計算量任務方面的優勢是無可替代的。
舉個例子,AI大模型中非常熱門的文生圖功能,在部分AI PC上已經實現了端側運行,但是實際效果並不好,往往只能生成構圖簡單且小尺寸的圖像。這是因為NPU雖然在AI運算上非常高效,但是卻不具備GPU的超強並行計算性能,難以進行複雜的非線性操作和深層次的模型計算。
實際上,NPU和GPU在文生圖等功能上是可以互補的,利用NPU的高效推理分析和理解用戶需求,同時生成簡單的圖像框架,再用GPU來執行更深層次的優化並豐富畫面,最大程度地利用各計算模塊的優勢,就可以提供更高效的AI服務。
未來的AI功能想要在圖像分析、生成、修改等方面進行更深層次的功能探索,那麼GPU就是必需的,因為其本身的性能特點是無可替代的。而且,不要覺得這些功能離你還很遙遠,就以我們常用的Adobe Photoshop來說,新版本已經支持大量AI功能,並且提供本地端側的AI功能支持。
而在實際測試中,雖然沒有獨立顯卡的PC也可以運行端側AI功能,但是卻有大量功能被限制,即使是可用的功能效率也大減價扣。所以,Adobe建議用戶搭配至少擁有4GB顯存的GPU,以此來保證端側AI功能的基礎功能都可以啟用。
隨著Adobe在旗下軟件中普及AI功能,輕薄本的核顯性能已經無法滿足需求,除非你只打算使用Adobe套件的基礎功能,否則一個性能過得去的GPU就是必需的,不管它是獨顯還是核顯。
Adobe只是整個AI生態的其中一部分,未來的AI PC顯然不會止步於此。
AI PC爆發,
APU核顯將成為主流方案?
那麼問題來了,為什麼一定要核顯?CPU+獨顯的組合難道不行嗎?並非如此,APU和CPU+獨顯都是未來AI PC的方向,但是側重點卻有所不同。CPU+獨立顯卡,也就是現在的高性能筆記本電腦,雖然性能強大但是因為需要應付兩個熱源,所以對散熱系統要求更高,無法做到真正的輕薄設計。
但是APU不同,因為CPU、GPU等都被封裝到一個芯片里,可以通過均熱板等技術更好地優化散熱系統,在保持散熱系統輕量化的同時滿足散熱需求,更好地滿足移動辦公需求。
換言之,APU能夠滿足AI PC的移動化和隨時部署要求,雖然在性能峰值等方面肯定無法與CPU+獨顯的組合相比,但是卻可以更好地部署在小型PC、移動PC里。當然,一個高性能的APU本身功耗肯定不會低,屆時就只能看CPU廠商如何進行取捨了。
此外,APU可以利用統一內存等技術,讓CPU、GPU共用高速內存,雖然成本會顯著上升,但是也可以提供更高的性能,並且滿足大型AI模型的運行要求。比如蘋果的Mac就利用超大統一內存的優勢,能夠流暢運行RTX 4090都無法流暢運行的AI模型,不管是AI開發還是AI應用,都有著更顯著的優勢。
實際上,CPU+GPU的組合芯片已經被多個半導體巨頭盯上,除了前面提到的蘋果和AMD外,英特爾、英偉達也在探索這個市場,英特爾的Xe-LPG就採用了獨顯同等核心,只是性能與AMD還有很大差距,僅相當於780M的水平。至於英偉達,則是更激進一些,選擇直接將CPU內置到GPU里,反其道而行之。
其實英偉達的思路也是可以理解的,既然自家的優勢在於GPU而非CPU,那麼將GPU打包為主要賣點,CPU作為附贈功能來銷售就可以更好地發揮出英偉達的技術優勢,只是對於PC市場來說這樣的組合確實很新鮮。
核顯賽道以前是英特爾獨秀,後來AMD加入戰場,現在則是進入三國爭霸的階段,英特爾、AMD、英偉達都想在這個市場上取得優勢,因為這將關係到未來的AI PC市場走向。蘋果呢?作為四大主流芯片平台里唯一的封閉式生態,蘋果雖然並不直接參與競爭,但是卻已經成為其餘三家無法忽視的對手。
未來,隨著蘋果逐漸完善自己的系統生態,Mac設備的市場份額會不可阻擋的上升,雖然因為價格等問題並不會直接威脅到x86 PC的核心地位,但是卻會蠶食掉相當一部分移動PC和AI PC市場。
誰能想到,曾經毫不起眼,被視為CPU附贈品的核顯,會有一天成為兵家必爭之地。