亞馬遜新款AI芯片上市!下一代芯片將與英偉達生態「合體」

來源:財聯社

財聯社12月3日訊(編輯 史正丞)香港時間週三淩晨,全球雲計算「伊古達拿」亞馬遜AWS在Re:Invent大會期間宣佈,華爾街翹首期待的新一代自研AI芯片Trainium3正式公開上市。

綜合公司介紹,Trainium3是亞馬遜首款3nm製程芯片。與上一代Trainium芯片相比,Trainium3計算性能最高提升4.4倍,能效提升4倍,內存帶寬幾乎提升4倍,主打AI算力競爭的性價比賽道。由Trainium3組成的UltraServer系統還可以互聯,每台可容納144枚芯片,為單個應用提供多達100萬枚Trainium3芯片,為上一代的10倍。

公司表示,與同樣使用圖形處理單元(GPU)的系統相比,訓練和運行AI模型的成本能夠降低最多50%

當然,指望亞馬遜Trainium3與GoogleTPU一戰,甚至「挑戰英偉達」的投資者可能會有些失望,畢竟沒有任何資料顯示這款芯片除了「性價比」之外的其他優勢。

亞馬遜拒絕透露新款AI芯片與Google、英偉達最新產品的基準性能對比,也未披露功耗參數。目前我們僅知道每枚芯片集成144GB的高帶寬內存,而Google最新的Ironwood TPU為192GB,英偉達的Blackwell GB300則最高可達288GB。

負責Trainium項目的AWS副總裁兼首席架構師Ron Diamant也直言:「我不認為我們會試圖取代英偉達」。

Diamant進一步表示,歸根結底,這款自研芯片最大的優勢就是性價比。他的主要目標是為客戶在不同的計算工作負載上提供更多選擇。

對於亞馬遜的AI芯片而言,最大的短板並不是芯片本身,而是亞馬遜缺乏足夠有深度且易於使用的軟件庫

除了亞馬遜自己以及公司大力投資的AI初創企業Anthropic外,現在幾乎找不到使用Trainium芯片的知名公司。

而Anthropic也在10月表示,將採購最多100萬塊Google的TPU,又在11月宣佈與英偉達簽署投資入股協議,並將進一步購買英偉達芯片的算力。不過Anthropic也強調,亞馬遜仍然是其「主要的訓練合作夥伴和雲服務提供商」, 預計到年底將使用超過一百萬顆Trainium 2芯片。

使用人工智能賦能施工設備自動化的Bedrock Robotics介紹稱,公司基礎設施運行在AWS服務器上,但在為挖掘機構建引導模型時,就得用英偉達芯片。公司首席技術官Kevin Peterson總結稱:「我們需要它既高性能又易於使用,那就是英偉達。

亞馬遜似乎也意識到了這個問題。在Trainium3的公告中,公司特別強調Trainium4已在研發中,最大的亮點是「能與英偉達芯片協同工作」。

公司表示,Trainium4將支持英偉達NVLink Fusion高速芯片互連技術,最終形成一種兼顧GPU與Trainium服務器的經濟高效機架級AI基礎設施。

英偉達介紹稱,NVLink Fusion的核心是NVLink Fusion chiplet,超大規模雲服務商可以將該chiplet嵌入其定製ASIC設計中,以連接NVLink規模化互聯和NVLink交換機。

這意味著,基於Trainium4的系統將能夠與英偉達GPU互操作,並提升整體性能,同時依然使用亞馬遜自研的、更低成本的服務器機櫃技術。這也將使得那些以英偉達GPU為核心構建的大型AI應用,更容易遷移到AWS。