Google放大招,Gemini 2.0全家桶來了

去年底,Google Deedmind推出了面向智能體時代的Gemini 2.0 Flash模型,一隻腳邁入了2.0時代,時隔兩個月,Gemini 2.0系列全家桶終於正式上新。

在DeepSeek「鯰魚效應」的催化下,這次發佈與往常不太一樣,不僅在性能上有進一步的提升,還揮舞起AI性價比的大旗,同時也擁抱多模態能力。

在最新的大模型競技場中,Gemini 2.0 Pro在所有類別中排名第1,Gemini 2.0 Flash排名第3,Flash-lite則以出色的性價比躋身前十。

Deepmind CEO Demis Hassabis發文稱:

令人興奮的進展!我們在不斷提升質量的同時,努力降低成本。Gemini 2.0系列是性價比和性能方面的領先模型。

通過今天的發佈,大家都可以利用它們強大的推理和多模態能力,這也為我們的智能工作奠定了基礎。

Gemini 2.0系列模型主要特點如下:

  • 2.0 Pro Experimental:主打編碼性能和處理複雜提示能力,在知識理解和邏輯推理方面表現出色。

  • 2.0 Flash:專門面向開發者提供API接口,支持快速構建App。

  • 2.0 Flash Thinking Experimental:已在Gemini App中開放使用,供用戶體驗。

  • 2.0 Flash-Lite:在保持高性能的同時實現了更優的成本效益和響應速度。

不到1美元能幹什麼?Google新模型能給4萬張圖片配標題

具體來說,Gemini 2.0系列全家桶模型各具特色。

其中,已全面發佈的Gemini 2.0 Flash支持多模態輸入和文本輸出,具備100萬tokens的上下文窗口,並支持結構化輸出、函數調用和代碼執行等功能。

值得注意的是,其多模態實時API目前仍處於「beta」階段,圖像和音頻輸出功能也將在後續推出。

該模型的定價方案也已確定,文本、圖像和影片輸入每百萬tokens收費0.10美元,音頻輸入則為0.70美元,(2月20日起正式生效)。文本輸出每百萬tokens收費0.40美元。

各類緩存費用也都維持在較低水平。文本/圖像/影片緩存費用為每百萬token收費0.025美元,音頻緩存費用為0.175美元。

在此基礎上,Google還推出了更具性價比的「輕量版」——Gemini 2.0 Flash-Lite。

雖然這款模型在功能上做了一定取捨,暫不支持多模態實時API、搜索工具和代碼執行,但它保留了100萬tokens的上下文窗口,以及多模態輸入、文本輸出和函數調用等核心功能。

其定價更為親民,文本、圖像和影片輸入每百萬tokens僅需0.075美元,幾乎比標準版便宜了三分之一。音頻輸入也為0.075美元,文本輸出為0.30美元,文本/圖像/影片緩存為每百萬tokens僅需0.01875美元,音頻緩存為0.175美元。

作為對比,DeepSeek-V3模型現在在擊中緩存的情況下每百萬tokens需要0.014美元。2月8日起,其價格將恢復到每百萬tokens 0.07美元的水平。這一調整或許也是促使Google製定當前價葛斯略的重要因素之一。

據Google介紹,使用該模型為4萬張獨特圖片生成標題的成本僅需不到1美元。

產品線的頂端則是Gemini 2.0 Pro Experimental版本。這款模型擁有200萬tokens的超大上下文窗口,相當於可以一次性處理約150萬個單詞,能同時消化整個《哈利·樸達》系列的七本書還綽綽有餘。

在功能上,它也是最為全能的選手,不僅支持多模態輸入和文本輸出,還具備結構化輸出、函數調用、搜索工具和代碼執行等全方位能力。

在性能測試方面,Gemini 2.0系列表現可圈可點。

在MMLU-Pro測試中,2.0 Pro Experimental以79.1%的得分領先,而2.0 Flash Lite Preview和2.0 Flash GA分別獲得71.6%和77.6%的成績。

在代碼生成、數學和多語言能力等方面,2.0 Pro Experimental同樣表現優異,在數學(91.8%)和多語言能力(86.5%)方面的成績尤為突出。

遺憾的是,即便是最強的Gemini 2.0 Pro Experimental版本也要遠遠落後於OpenAI o3模型,並未完成外界期待的「彎道超車」。

不過也有網民認為,由於Gemini 2.0 Pro並非典型的CoT模型,當前的性能對比可能並不完全合理。

這些模型的主要優勢在於其快速響應能力和較低的成本,特別適用於命名實體識別或分類等特定任務。隨著圖像生成和文本到語音等新功能的即將推出,Gemini 2.0系列的應用場景將進一步擴展。

現在,這些新模型現已在Google AI Studio和Vertex AI平台上向開發者開放,Gemini高級用戶也可以在其設備上選用。

貪吃蛇大戰、跳躍球,Gemini 2.0還能這樣玩

誰說AI只會乾巴巴地回答問題,隨著Gemini 2.0全家桶的上線,網民迫不及待地將其玩出了新花樣。

比方說,想看貪吃蛇大戰嗎?讓Gemini 2.0自行操刀設計一個貪吃蛇遊戲。

或者,Gemini 2.0 Flash Thinking模型是首個能夠訪問YouTube的推理模型,它還支持Google搜索和地圖功能。

在圖像渲染方面,有開發者要求模型使用p5.js編寫腳本,生成了一個包含100個動態彈跳黃球的三維場景。並且,球體內的黃球還要能夠正確地相互碰撞,球體緩慢旋轉,以及始終保持在球體內。

我們也在Google AI Studio中簡單體驗了此次上新的幾款新模型。這幾款新模型響應的速度倒是挺快的,至於效果嘛,Emmm,就屬實有點難評了。

在Gemini大展拳腳之際,慣常狙擊的OpenAI也在持續發力。

今天,OpenAI淩晨宣佈Deep Research功能向所有Pro用戶全面開放,包括英國、歐盟、挪威、冰島、列支敦士登和瑞士等地區。Plus用戶流下了羨慕的淚水。

並且,ChatGPT的搜索功能現已向所有用戶開放,無需註冊即可使用,這進一步降低了用戶的使用門檻。

不過,在卷模型之前,不妨先卷一下AI模型的起名,無論是Gemini系列,還是OpenAI的GPT/o系列,隨著新模型接踵而至,各類版本號和命名規則也是讓人眼花繚亂。

去年當OpenAI CEO Sam Altman被問及公司產品的命名策略時,他也坦言相當頭疼。

包括Anthropic CEO Amodei曾表示,雖然Claude的命名方式在早期看起來不錯,但隨著模型的快速迭代和更新,沿用的命名體系同樣變得捉襟見肘。

他指出,目前沒有任何AI公司真正「搞掂命名」這一問題,大家都在努力尋找更簡單、更清晰的命名方式。這或許也是AI巨頭們少有達成的共識。

本文來自微信公眾號:APPSO (ID:appsolution),作者:APPSO