Google推出Gemini 3.5系列模型 Omni影片生成迎來關鍵突破

來源:財聯社

財聯社5月20日訊(編輯 牛佔林)在全球人工智能(AI)競爭加劇的背景下,Google宣佈推出Gemini 3.5系列模型,以及一款用於模擬物理世界的新型AI模型,旨在在模型開發方面保持領先,同時為其龐大的用戶群提供更多AI智能體服務。

Google在週二舉行的年度開發者大會(Google I/O)上發佈了上述消息,當前市場正高度關注OpenAI與Anthropic兩家公司飆升的估值,這兩家公司均計劃最早於今年進行IPO。

GoogleAI戰略的核心依然是Gemini系列及相關工具。週二公司重點展示了Gemini 3.5 Flash,這是該系列的一款輕量級產品。

Google首席執行官桑達爾·皮查伊表示,Gemini 3.5 Flash在提供尖端能力的同時,其成本僅為同類頂尖模型的一半,甚至有時不到三分之一,同時保持了高智能水平。

皮查伊稱Gemini 3.5 Flash「速度極快」。Google同時宣佈,該型號將成為全球Gemini應用和搜索AI模式的預設模型。

Google在博客中指出:「用戶無需再在質量與響應速度之間做取捨。」公司還強化了Gemini 3.5 Flash的網絡安全防護,使其「生成有害內容的可能性更低,也不易在安全問題上拒絕回答。」

至於重量級版本Gemini 3.5 Pro,目前僅在內部使用,預計下月才會向更廣泛的用戶開放。

在AI智能體方面,Google推出了Gemini Spark,這是Gemini應用中一款新型通用AI智能體,能夠對關聯應用中的信息進行跨平台推理。Google表示,該工具能夠管理用戶的數字生活,並代表用戶執行操作。Gemini Spark目前處於測試階段,下週將首先向受信任的測試用戶及Google AI Ultra訂閱用戶開放。

皮查伊表示:「我們已經將智能體帶給開發者和企業一段時間了。現在,我們專注於將這種前沿能力安全可靠地帶給消費者,讓每個人都能受益。」

隨著越來越多的互聯網用戶使用聊天機器人,Google正在努力說服傳統搜索用戶信任其完成最少輸入即可執行的任務。在公司資本支出大幅上升的情況下,華爾街關注Google是否能實現產品深度整合,而智能代理功能可能成為重要突破口。

AI公司的市場預期持續上升,尤其是在Anthropic近期發佈的Mythos模型背景下。據稱,該模型強大到能夠發現全球軟件基礎設施中的數千個未知漏洞。

Google的AI產品組合還包括Gemini Omni,這是一款用於模擬物理環境的世界模型,可以根據用戶的操作預測接下來會發生的情況。世界模型通常用於機器人和遊戲領域,多年來一直是DeepMind重點研究方向。而Omni在物理模擬方面更準確,例如重力、流體動力學和動能等。

GoogleDeepMind首席AI架構師兼技術總監Koray Kavukcuoglu介紹稱:「Omni可以生成非常高質量的影片,並允許用戶在生成後與影片進行互動。可以想像,這為學習和探索提供了類似教程的能力。」

Omni可在Gemini Flash、Gemini應用、Google Flow及YouTube Shorts中運行,支持圖像和音頻功能。Google在另一篇博客中指出,用戶可利用Omni編輯影片並生成更逼真的圖像效果。

「拍攝一段影片,可以讓Omni改變其中正在發生的內容。」Google表示,這款AI模型能夠「編輯動作、添加新角色或物體」。

高質量影片的生成一直是AI工具的難點,而且對計算資源要求極高。OpenAI在今年早些時候就放棄了其影片生成工具Sora,部分原因就是為了將算力資源用於其他項目。