Google雲Next ’25連放大招,新一代TPU、新模型、Agent互聯協議等接連發佈,向「推理時代」全面進攻

剛剛在拉斯維加斯召開的Google雲下一步(Google Cloud Next ’25)大會上,Google向世界展示了其在人工智能領域的強大野心,通過一系列重磅公告試圖在日益激烈的雲 AI 市場中鞏固自己的領導地位。從全新設計的芯片到革命性的互操作性協議,從新的推理模型到無代碼代理開發工具,Google在會議上釋放了其近期最全面的 AI 攻勢。

今年的Google雲大會主題明確指向了AI 發展的新階段,Google將其定義為推理時代age of inference)——AI 不再僅僅是對用戶請求做出即時響應,而是能夠主動檢索和生成數據,協作提供見解和解答。Google雲 CEO Thomas Kurian 在大會上強調,他們的戰略是承諾提供世界級的基礎設施、模型、平台和代理;提供開放、多雲平台以實現靈活性和選擇;並構建互操作性

根據Google在今年月發佈的財報,其 2024 年第四季度雲業務收入達到 120 億美元,同比增長 30%。Google高管表示,AI Studio 和 Gemini API 的活躍用戶僅在過去一個月就增長了 80%,在此強勁形勢下,Google連續發佈多項創新技術,試圖重新定義 AI 基礎設施和應用的未來發展方向。

Ironwood:專為推理模型設計的全新 TPU 芯片

在一系列發佈中,最吸引人眼球的無疑是Google的第七代張量處理單元(TPU)——Ironwood。與之前同時兼顧訓練和推理的 TPU 不同,Ironwood 是Google首款專為推理工作負載設計的芯片,標誌著其 AI 芯片設計理念的根本性轉變。

Ironwood 是我們迄今為止最強大、最具擴展性和能源效率的 TPU,專為規模化部署思考型、推理型 AI 模型而設計,Google機器學習、系統和雲AI 副總裁兼總經理 Amin Vahdat 在發佈會上表示。它標誌著AI 發展和支持其進步的基礎設施的重大轉變,從提供實時信息供人解讀的響應式 AI 模型,轉向提供主動式見解生成和解釋的模型。

圖丨

圖丨

Ironwood(來源:Google

為支撐這種高級AI 能力,Ironwood 在多項技術指標上實現了大幅提升。首先,在核心的計算性能方面,當配置為包含 9216 顆芯片的完整計算集群時,據Google公佈的數據,Ironwood 能夠提供高達 42.5 Exaflops 的 FP8位浮點)峰值計算力。Google將其與當前世界領先的超級計算機之一 El Capitan 進行了對比,稱其算力達到後者的 24 倍以上,但需要注意這種比較基於特定的精度(FP8)和潛在的理想化條件,且超級計算機通常針對不同的科學計算負載進行優化。即便如此,42.5 Exaflops 的 FP8 算力對於大規模部署需要高吞吐量和低延遲的推理任務而言,仍是一個相當可觀的數字。單顆 Ironwood 芯片的峰值 FP8 算力也達到了 4614 TFLOPS

圖丨相對於

圖丨相對於

TPU v2(Google的第一款外部雲 TPU),Ironwood FP8 峰值浮點運算性能的提升

其次,Ironwood 在內存子系統方面進行了大幅升級。每顆芯片配備了 192GB 的高帶寬內存(HBM),這一容量是其上一代 TPU Trillium(配備 95GB HBM)的兩倍多,相較於更早的 TPU v4(配備 32GB HBM)更是提升了六倍。同時,內存帶寬也提升至 7.2 Tbps,相比 Trillium 的 2.8 Tbps 有了顯著增長。更大的內存容量意味著可以在芯片本地緩存更大規模的模型參數和更長的上下文信息,減少對外部存儲的訪問;更高的帶寬則能更快地將數據喂給計算單元,這兩者對於降低推理延遲、提升複雜模型處理效率具有直接作用。

再者,能源效率也是Ironwood 設計的關鍵考量。Google表示,Ironwood 的每瓦性能(performance per watt)相較於 Trillium 提升了約兩倍,並且比 2018 年推出的第一代Google雲 TPU 的能效高出近 30 倍。在數據中心能耗日益成為瓶頸和主要運營成本的背景下,能效的提升對於 AI 技術的可持續發展和大規模經濟化部署具有重要價值。Google還強調了其配套的先進液冷散熱技術,旨在確保芯片在高負載下能夠穩定、高效地運行。

Google還強調Ironwood 將與其機器學習運行時 Pathways 配合使用,使開發者能夠輕鬆地利用數萬個 Ironwood TPU 的組合計算能力。對企業客戶而言,Ironwood 將提供兩種配置:256 芯片配置和 9,216 芯片配置,計劃於今年晚些時候推出。

Agent2AgentAI 代理互操作性的新標準

如果說Ironwood 代表了Google在 AI 算力基礎上的持續深耕,那麼 Agent2Agent (A2A) 協議的發佈則體現了其試圖構建一個開放、協作的 AI 應用生態的戰略意圖。

當前,隨著不同企業和開發者構建出大量針對特定領域或任務的AI Agent,一個日益嚴重的問題是這些 Agent 往往運行在隔離的平台、框架或數據環境中。這種碎片化狀態嚴重限制了Agent 之間進行有效協作的可能性,使得實現跨系統、跨業務流程的複雜自動化任務變得困難重重。

為應對這一挑戰,Google聯合了超過50 家技術合作夥伴與服務提供商(包括 AtlassianSalesforceSAPServiceNowCohereLangchain 等軟件公司,以及 AccentureDeloittePwC 等諮詢服務機構),共同發起並推出了一個全新的開放協議——Agent2Agent (A2A)

A2A 的核心目標是定義一套標準的通信規範和互操作框架,使得由不同供應商開發、基於不同技術棧構建的 AI Agent 能夠相互發現、安全地交換信息、協調行動並協同完成任務。該協議的設計圍繞幾個關鍵原則展開:首先是能力發現(Capability Discovery),A2A 允許每個 Agent 通過一個結構化的Agent Card(以JSON 格式定義)來描述自身的功能、可處理的任務類型、輸入輸出要求等信息。這使得一個需要幫助的客戶端Agent能夠查詢並識別出最適合執行某項特定子任務的遠程Agent

圖丨

圖丨

A2A 的工作原理(來源:Google

其次是任務管理(Task Management),A2A 將 Agent 間的交互聚焦於完成最終用戶的請求。協議定義了一個明確的任務(task對象及其生命週期管理機制。通信流程圍繞任務的創建、執行、狀態更新和完成進行。這套機制既能支持可以立即響應的短時任務,也能支持需要較長時間運行(可能數小時甚至數天)、涉及多輪交互甚至可能需要人工介入的複雜研究或處理流程。協議確保了參與同一任務的多個Agent 能夠就任務進展保持同步,並能可靠地傳遞任務的最終產出物,這些產出物在協議中被稱為artifact

第三是協作與通信(Collaboration),A2A 定義了 Agent 之間發送結構化消息的規範,用以傳遞必要的上下文信息、中間步驟的回覆、最終的artifacts以及來自用戶的具體指令或修正。

第四是用戶體驗協商(User Experience Negotiation),認識到 Agent 交互的多樣性,A2A 協議的設計超越了純文本交互。它支持 Agent 之間就最適合向用戶或調用方呈現信息的方式進行協商。例如,一個 Agent 可能生成了圖像數據,另一個 Agent 可能需要處理影片流,或者需要在用戶界面嵌入一個 Web 表單(iframe)以收集用戶輸入。A2A 的消息結構設計(包含帶有明確內容類型定義的parts)允許進行這種靈活的格式與交互方式協商。

最後,A2A 協議強調基於現有標準與安全性。它構建在如 H湯臣PServer-Sent Events (SSE)JSON-RPC 等廣泛應用的網絡協議和數據交換格式之上,旨在降低與現有企業 IT 基礎設施集成的難度。同時,協議在設計之初就考慮了企業級的安全需求,計劃提供與 OpenAPI 規範相當的認證和授權機制支持。

值得注意的是,A2A 與我們所熟知的 Anthropic 的模型上下文協議(Model Context ProtocolMCP)是不同的。Google官方及技術社區的普遍觀點認為兩者是互補而非競爭的關係。MCP 主要關注 Agent 與其所處環境的交互,即 Agent 如何發現並調用外部工具、訪問 API 或獲取數據資源。而 A2A 則專注於 Agent 與 Agent 之間的直接通信與協作流程。簡而言之,可以理解為 MCP 幫助 Agent 具備做事的能力,而A2A 則幫助 Agent找到合適的夥伴一起做事。Google在其新發佈的Agent Development Kit (ADK) 中同時包含了對這兩種協議的支持,也印證了其認為兩者在構建複雜多 Agent 系統中各自具有不可或缺的價值。

A2A 還包含一些 MCP 所沒有的重要概念,例如任務準備度和長時間運行任務的狀態追蹤,使一個代理可以給另一個代理一個任務,幾天后完成,並通過 webhook 或輪詢獲得通知。這種功能對於企業環境中的複雜工作流程尤為重要。

Google已將A2A 協議的規範草案作為開源項目發佈,並設立了明確的貢獻途徑。公司表示正在與合作夥伴合作,計劃在今年晚些時候推出該協議的生產就緒版本。

Google的整合AI 生態戰略:從智能模型到開發工具

Ironwood TPU 和 A2A 協議這兩大重點發佈之外,Google還推出了一系列相互關聯的 AI 創新,共同構建了一個從模型到開發工具的完整生態系統。這些創新彼此銜接,形成了Google完整的推理時代戰略佈局。

首先,Google擴展了其Gemini 模型系列,推出了 Gemini 2.5 Flash,這是其前不久所推出的旗艦 AI Gemini 2.5 Pro 的高效版本,同樣具備Google所強調的推理能力。Gemini 2.5 Flash 的一個特點是能夠根據輸入提示的複雜度動態調整其推理深度,從而在響應速度和結果質量之間取得平衡,適用於對成本和延遲較為敏感的日常應用場景。

為了使這些模型能夠真正發揮作用,Google同時推出了一系列代理開發工具。公司推出了代理開髮套件(Agent Development KitADK),允許開發者用不到 100 行代碼構建多代理系統。對於非技術用戶,Google增強了其 Agent Space 平台,添加了 Agent Gallery(提供可用代理的單一視圖)和 Agent Designer(創建自定義代理的無代碼界面)功能。這些工具充分利用了 A2A 協議的能力,使不同代理之間能夠無縫協作。

在內容創作領域,Google進一步擴展了其模型的多模態生成能力,更新了Imagen(圖像生成)、Veo(影片)、Chirp(音頻),並新推出了文本到音樂生成的模型 Lyria

圖丨

圖丨

Imagen 3 的一句話 圖能力進一步提高(來源:Google

Google還通過Cloud WAN 服務向企業開放其龐大的全球網絡基礎設施,使企業能夠訪問Google長達 200 萬英里的光纖網絡——與支持 YouTube 和 Gmail 等消費者服務的網絡相同。與客戶管理的網絡相比,Cloud WAN 將網絡性能提高多達 40%,同時將總擁有成本降低相同比例。這一基礎設施升級為運行 AI 工作負載的企業提供了更高效、更經濟的全球網絡連接,是Google全棧 AI 戰略的關鍵組成部分。

總結:Google全面押注「推理時代」

綜合來看,Google雲Next ’25 大會發佈的系列內容,全面地展現了Google意圖構建一個覆蓋從底層硬件(定製 TPU、全球網絡)到核心模型(Gemini 系列)、再到開發者生態(A2A 協議、ADK 工具)直至上層應用(Workspace 集成、行業解決方案)的全棧式 AI 能力體系。

尤其是,Ironwood TPU 的推出及其對推理時代的明確側重,也反映出當前AI 發展的一個重要趨勢:隨著模型能力的增強,行業關注點正逐漸從單純追求更大的模型規模和更快的訓練速度,轉向如何更高效、更經濟地部署這些模型以執行實際任務,以及如何讓模型具備更強的自主解決問題的能力。推理成本和效率正成為衡量 AI 技術成熟度和商業可行性的關鍵指標。

Agent2Agent (A2A) 協議的提出,也顯示了Google試圖在日益複雜和多元化的 AI Agent 市場中扮演連接者標準製定者角色的戰略意圖。通過倡導並聯合業界夥伴共同構建一個開放的互操作性協議,Google希望能夠打破當前存在的技術孤島,降低不同AI 系統之間集成的複雜度和成本,從而促進一個更繁榮、更具活力的協作式 AI 生態系統的形成。這不僅可能加速 AI 技術在各行各業的滲透和應用創新,也可能為Google自身的雲平台和 AI 服務帶來更廣闊的市場空間和更強的用戶粘性。面對來自微軟(AzureOpenAI 合作)、亞馬遜(AWSAnthropic 合作、自研芯片)等主要競爭對手的激烈競爭,Google通過其獨特的垂直整合能力(自研 TPU)和推動開放標準的策略,試圖形成差異化優勢。

但另一方面,這種全線出擊的策略也意味著巨大的資源投入和執行風險。何況,Google內部也並非歲月靜好,用我們之前說過的一句話作為總結,對Google來說,最大的挑戰可能不是技術本身,而是如何將這些技術轉化為可持續的商業模式,同時應對監管壓力、維護用戶信任,並保持創新速度。

Google雲Next ’25 無疑投下了重磅籌碼,但這場關乎未來的 AI 競賽,才剛剛進入更複雜的深水區。

參考資料:

1.https://cloud.google.com/blog/topics/google-cloud-next/welcome-to-google-cloud-next25

2.https://blog.google/products/google-cloud/ironwood-tpu-age-of-inference/

3.https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/

4.https://venturebeat.com/ai/google-cloud-next-25-new-ai-chips-and-agent-ecosystem-challenge-microsoft-and-amazon/

5.https://techcrunch.com/2025/04/09/google-unveils-ironwood-a-new-ai-accelerator-chip/