蘋果官宣：在GoogleTPU上訓練其AI模型

本文來自：硬AI，作者：李丹，題圖來自：視覺中國

公開文件顯示，蘋果開發自家的人工智能（AI）系統Apple Intelligence離不開Google定製芯片的支持。

美東時間7月29日週一，蘋果官網公佈了一篇技術論文，詳細介紹為支持蘋果個人智能化系統Apple Intelligence而開發了一些基礎語言模型，包括一個用於在設備上高效運行的約30億參數模型——端側「蘋果基礎模型」（AFM），以及一個為蘋果雲端AI架構「私有雲計算」（Private Cloud Compute）而設計的大型服務器語言模型——服務器AFM。

論文中，蘋果介紹，端側AFM和服務器AFM是蘋果開發的生成式模型大家族成員，這些模型都用於支持用戶和開發者。論文中，蘋果披露，訓練模型採用了Google研發的第四代AI ASIC芯片TPUv4和更新一代的芯片TPUv5。文章寫道：

「我們在8192塊TPUv4 芯片上從無到有訓練服務器AFM，使用4096的序列長度和4096個序列的批量大小，進行6.3萬億token訓練。」

「端側AFM在2048塊TPUv5p芯片上進行訓練。」

在這篇長達47頁的論文中，蘋果沒有提到Google或是英偉達的名字，但表示，其AFM和AFM服務是在「雲TPU集群」上訓練。這意味著，蘋果向雲服務商租用了服務器執行計算。

事實上，今年6月的全球開發者大會（WWDC）期間，媒體已經在蘋果公佈的技術文件細節中發現，Google成為蘋果在AI領域發力的另一位贏家。蘋果的工程師在構建基礎模型時運用了公司自研的框架軟件及多種硬件，包括僅在Google雲上可用的張量處理單元（TPU）。只不過，蘋果未透露，相比英偉達等其他AI硬件供應商，蘋果有多依賴Google的芯片和軟件。

因此，本週一在社交媒體X上有評論指出，6月就出過蘋果用Google芯片的消息，現在我們有了更多關於訓練堆棧的細節。