Google Nano Banana 2 首批 AI 樣本流出:不僅會畫畫,還懂物理

IT之家 11 月 11 日消息,科技媒體 testingcatalog 昨日(11 月 10 日)發佈博文,報導稱Google新一代 AI 圖像模型 Nano Banana 2 的早期預覽樣本意外泄露,展示了其強大的圖像生成與編輯能力。

Nano Banana 2 的預覽版本在 Media.ai 平台短暫上線後被迅速撤下,但其生成的圖像樣本已在社交媒體上廣泛傳播,其在提升低質量圖片清晰度(圖像修復)和執行複雜的色彩編輯指令方面,展現出強大的技術實力。

根據泄露的資料,Nano Banana 2 主要帶來 2 項改進,其一是能夠解決與物理邏輯相關的視覺任務。例如,在一張泄露的圖片中,模型通過「圖生圖」(img2img)技術,準確繪製出了小球運動的物理軌跡,這是當前其他模型難以完成的複雜任務。

其二,該模型在文本渲染方面表現極為出色,能夠根據自然語言提示,在白板等介質上繪製出字體一致且排列精確的複雜文字,有效解決了以往模型在圖像內生成清晰文本的難題。

該媒體還指出,Nano Banana 2 在視覺保真度和指令遵循能力上的飛躍,表明其模型內部集成了更深層次的世界知識。這一進步使其不再局限於簡單的圖像生成,而是能夠理解並執行更複雜的、包含邏輯關係的指令。IT之家附上相關圖片如下:

這些高級能力為設計、媒體內容製作和自動化工作流等領域開闢了新的可能性。例如,企業未來或許可以通過 API 接口,程序化地調用該模型,快速生成符合要求的營銷海報或社交媒體視覺素材,從而大幅提升內容生產效率。

廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。