Google Gemini 2.5 Flash 混合推理 AI 模型上線:性能成本雙優

IT之家 4 月 18 日消息,Google公司昨日(4 月 17 日)發佈公告,宣佈在 Google AI Studio 和 Vertex AI 中,以 Gemini API 的方式推出 Gemini 2.5 Flash Preview 預覽 AI 模型。

用戶還可通過 Gemini 應用內的模型選擇器直接使用,並結合 Canvas 工具優化文檔和代碼編輯。

IT之家此前報導,Gemini 2.5 Flash 是一個混合推理模型,具備「動態且可控」的計算能力,開發者能夠根據查詢請求的複雜程度靈活調整處理時間。

Google指出,Gemini 2.5 Flash 非常適合用於「高容量」和「實時」的應用場景,例如客戶服務和文檔解析。Google在其博客文章中提到:「這款工作型模型專門針對低延遲和降低成本進行了優化,是響應式虛擬助手和實時總結工具的理想引擎」。

根據Google官方公佈的定價,Gemini 2.5 Flash 模型每 100 萬 tokens 輸入為 0.15 美元,每 100 萬 tokens 輸出(不含推理)為 0.6 美元、每 100 萬 tokens 輸出(含推理)為 3.5 美元.

作為首款全混合推理模型,開發者可根據需求開關推理功能,靈活調整響應質量、成本和延遲,與 Anthropic 和 Grok 的前沿模型相比,Gemini 2.5 Flash 成本更低但表現不俗。

廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。