Gemini 2.0 來了,只干三件事:智能體,智能體,智能體
一般來說,「帶貨直播」有兩個常見槽點:一是拖拖拉拉搞得太長,看官們注意力被別處拉走;二是上貨痛快,發貨卡殼。很不幸,OpenAI 全趕上了。
當 OpenAI 還在耍寶似的「老鐵快看我多美」十二天連續發佈會呢,Google 悄咪且雞賊地亮出了 Gemini 2.0——一個被其 CEO 劈柴稱為「為新智能體時代構建的下一代模型」。
其所有的重點特徵都聚焦在了能帶來新一代的、真實可用的智能體之上了:根據目前公佈的信息,在搜索、瀏覽器、學術科研、代碼開發,甚至遊戲助手等場景下的智能體使用體驗,都會被 Gemini 2.0 重塑升級。
Gemini 2.0 的 Flash(輕巧快速尺寸) 體驗版自今日起已經開放給全部 Gemini 用戶,立等可用;最新的 Deep Research 也已經對所有Gemini Advanced 用戶開放(這個功能類似於科研學術助手,可以幫助個人分析理解複雜的科研項目,並撰寫研究報告)——吸取了之前的教訓,終於不用再因為「畫餅發期貨」而被「抽水」了。
其餘將在明年年初推出的新功能智能體中,還真有這麼幾個很有趣的東西:
Project Astra 升級版:生活更生活
(我們惦記的是它麼?我們惦記的事每次展示 Astra 都出現的那個新眼鏡~)
Project Astra 是在今年 I/O 大會上推出的多模態智能體應用,你可能還記得當時那段在 Deepmind 倫敦辦公室利用其找東西的驚豔宣傳片。基於 Gemini 2.0 的 Project Astra 會被賦予更強升級:
– 新版 Project Astra 可以聽懂多種語言和混合語言的對話,對不同口音和生僻單詞也更加包容(你看,雖然你討厭中英夾雜,但是人家 AI 就很大度);
– 可以調用 Google Search、Google Lens 和 Google Maps,讓這個助手的價值變得更加日常高頻。演示影片中就出現了典型的查詢門禁密碼、查詢水洗標和洗衣機功能檔位、騎行路途中實時查詢店舖和街景信息等;
– 新的 Project Astra 最多可以記住長達 10 分鐘的對話內容(這已經比開會時候的我強不少了);
– 能夠理解人類對話中的延遲(嗯……嘿……那個……是吧……挺適合用來理解相聲的……)
Project Mariner:牛馬更牛馬
Project Mariner 是個 Gemini 2.0 之下的新玩意,一個在瀏覽器場景下提供交互的新功能——它的理解和交互範疇包括了瀏覽器頁面(是瀏覽器,而非單一網頁)中的像素、圖像、文字、表單和代碼等,通過Chrome 擴展程序來實現。
在一項針對智能體在端到端的真實世界網頁任務的性能測試里(WebVoyager 測試),Project Mariner 實現了 83.5% 的工作效率,屬於目前最先進的水平。
也正因為瀏覽器場景下這些更加複雜多變的任務,以及個人隱私、交易安全等可能的風險因素,Google 在發佈的同時也承認了:測試中的 Project Mariner 仍處在速度慢、準確率不理想的早期狀態。
Jules:代碼更智能
另一個 Gemini 2.0 帶來的新玩意,一個可以直接集成到 GitHub 工作流當中的 AI 代碼智能體。
遊戲助手:小白更高玩
Google 還稱,利用 Gemini 2.0 構建了一種「遊戲助手」智能體,根據遊戲進度實時分析戰況、做出決策建議。他們正在同一些大型遊戲開發商進行合作,目前測試中的知名遊戲,比如《部落衝突》和《海島奇兵》等。
樂觀地想,當年要是有這麼個玩意,我的聯盟小獵人也不會被三季稻老師秒殺那麼多次了……
按照劈柴在公開信中的說法,「如果說 Gemini 1.0 是整合和理解信息,那麼 Gemini 2.0 能夠讓信息更加有用。」若真能如此,那會令我對這個被 AI 命名的時代更有信心。
本文來自微信公眾號「果殼」,作者:臥蟲,36氪經授權發佈。