生成式AI驅動數據計算加速演進,Arm提出系列解決方案

21世紀經濟報導記者駱軼琪 深圳報導 

隨著AI近兩年來的快速發展,人們對於數據傳輸速率的要求日益高企,由此也對芯片架構和生態靈活性提出更多挑戰。

近日,Arm高級副總裁兼基礎設施事業部總經理Mohamed Awad表示,通過提供Arm全面計算解決方案 (Arm Total Compute Solutions)、Arm Neoverse平台、Arm Corstone、SOAFEE等,Arm在包括移動、基礎設施、物聯網與汽車等目標應用市場,正在向生態夥伴提供一個完整、集成的解決方案。“希望合作夥伴能選擇適合自身的方式進行產品開發——我們既可以為合作夥伴提供一個完整的解決方案;他們也可以選用個別Arm IP,根據需求自由選擇。”

(Arm高級副總裁兼基礎設施事業部總經理Mohamed Awad,圖源:受訪者提供)(Arm高級副總裁兼基礎設施事業部總經理Mohamed Awad,圖源:受訪者提供)

他表示,中國是Arm重要的市場之一。來自中國市場的創新也是Arm不斷髮展,並在業務上取得成功的原因之一。如今,中國合作夥伴基於Arm架構芯片的總出貨量已累計達300億顆。“目前我們在中國有近400家技術授權客戶,我們也一直通過與安謀科技合作以進一步助力本土合作夥伴。”

架構新挑戰 

Mohamed Awad分析道,傳統的服務器系統架構,是由內存連接到一個通用的現成CPU,該CPU又負責管理多個加速器。這是過去市場上唯一可用的架構。

(傳統服務器系統架構,圖源:21世紀經濟報導記者拍攝)(傳統服務器系統架構,圖源:21世紀經濟報導記者拍攝)

“但問題在於這個通用的現成CPU和加速器之間的接口直接限制了產品最終性能水平,因為所有加速器都必須要通過一個通用的現成CPU訪問額外內存,這樣就無法達到內存一致性,也就意味著加速器的性能無法被充分利用,也無法很好支持生成式AI時代的需求。”他分析道。

因此出現一種現代化系統架構:每顆CPU都可以單獨和一個加速器相連,由此可實現較強的內存一致性。“這種新型架構的關鍵在於,設計方可以根據用戶實際場景和用例進行CPU定製化設計,如此一來,便能提高加速器的使用效率。這種架構設計,才能更好支持未來基礎設施的市場需求,包括生成式AI。”他續稱。

(現代化系統架構,圖源:21世紀經濟報導記者拍攝)(現代化系統架構,圖源:21世紀經濟報導記者拍攝)

但這種架構並不是Arm的構想,正是NVIDIA(英偉達)GH200 Grace Hopper超級芯片所使用的架構。在該架構中,72顆Arm Neoverse核心,加上來自NVIDIA的GPU組合,其AI性能較基於x86架構的系統可提升10倍。

國內已經有大量採用Arm Neoverse的應用案例。阿里巴巴倚天710就是基於Arm Neoverse平台打造的CPU;鴻鈞微電子、遇賢微電子、雲豹智能則根據需要基於Arm Neoverse平台打造相應SoC或DPU解決方案;聯想更多是將基於Arm架構的解決方案部署到5G領域。

Arm中國區業務全球副總裁鄒挺介紹道,Arm Neoverse在中國市場,特別是基礎設施領域有很多客戶。過去三、四年中,整個Neoverse在中國的發展非常強勁。同時Arm也積極參與數據中心、雲計算等本土生態、開源軟件社區,包括龍蜥社區等,希望幫助這些社區更好融入Arm全球生態系統中。

Mohamed Awad在受訪時表示,現在判斷一個CPU對一個GPU作為加速器,是不是未來主趨勢或唯一趨勢,仍為時尚早。“但我認為會發生的是,鑒於我們正處於計算加速時代,在未來架構中,任何通用CPU旁,一定會有一個加速器。不管是通過緊密耦合、中度耦合或中散耦合的方式(進行連接)。但具體這個加速器是什麼樣、採用什麼架構,目前業界也在不斷探索中。”

更重要的是,該CPU是定製,跟加速器實現一對一組合後,整體鏈路及數據吞吐率會達到最高,以提高加速器本身的利用水平。

“Arm的獨特之處在於,能夠幫助合作夥伴從頭開始、根據所需構建定製化CPU,並做好CPU和加速器之間的連接。此外我們龐大豐富的軟件生態系統,可以賦能整個開發,加速產品上市進程。”他指出。

應對定製化

生成式AI為半導體廠商進一步打開發展空間,當然更多樣化的市場落地需求,也對相關芯片產品的靈活性提出更高要求。

Mohamed Awad指出,為了緩解未來基礎設施的壓力,行業需要依賴強大的軟件生態系統,在高效、可擴展的多核計算基礎上,打造專用處理能力。為此,當下的基礎設施建設已逐漸趨向定製化。“我們賦予合作夥伴將有限的資源專注在關鍵差異化的能力,Arm也繼續在提供可擴展且高效的計算基礎。”

今年8月,Arm推出Arm Neoverse CSS(計算子系統),該產品預集成了Arm Neoverse平台,並完成驗證配置,可降低開發成本並加速產品上市進程。

合作夥伴反饋,通過使用Neoverse CSS,節省了80人/年的工程師時間;也有反饋稱,Neoverse CSS助力他們的項目從概唸到流片僅耗時13個月。

在Neoverse CSS基礎上,其又提出Arm全面設計 (Arm Total Design)生態項目,旨在進一步結合生態系統的力量,簡化定製化芯片的開發流程,讓交付變得更加容易、便捷,從而讓基於Arm Neoverse的專用解決方案能覆蓋AI、雲、網絡、邊緣等各種基礎設施領域。

“人工智能時代已經到來,AI的關鍵在於硬件和軟件緊密集成,以及性能和計算能力提升。當今70%的機器學習工作負載運行在Arm平台上。”Mohamed Awad指出,Arm為移動平台所提供的Arm全面計算解決方案,能夠賦能移動設備上AI的實現,推出的Arm Cortex-M52、Cortex-M55,都是針對物聯網所推出支持AI的產品。

他強調,Arm希望從更加廣義的角度界定AI。傳統意義上提到的AI主要指服務器中的AI或生成式AI,但AI其實還可以存在於邊緣、網絡中。即從傳統數據端,到存儲、服務器等,AI將融入每一個過程中。

Mohamed Awad介紹,Arm Neoverse平台用例增長迅速。目前全球主要公有雲廠商都在提供基於Neoverse的雲實例,“我們很多合作夥伴將會在2024年將第一代CSS設計投入生產,微軟Cobalt 100在2023年就已經實現。”

(作者:駱軼琪 編輯:駱一帆)