新版 Gemini 實測:堪稱降維打擊(含:4項能力測試,5個應用案例)

自從在一支菸花群裡和朋友測試起 Google 這個新工具,一上午就沒停下來 WOC 的感歎。

Google 總算放出了他們去年承諾的「可連續對話改圖」的 Gemini 文生圖能力。

照例先給總體評價:

  1. 1. Gemini (或者說 Imagen3)是當下最值得全設計行業,甚至全碳基社會使用的文生圖 AI

  2. 2. 它在自然語言的修改指令理解、材質質感複現、局部細節微調方面,達到了部分生產創作環節完全可用的水準(當然也有些 Case 還差點意思)

  3. 3. 這幾乎可以算 AI 許願機、超級嘴炮魔法了,甚至說句「快變天了」不為過 🥲

特別的,如果你是設計行業、內容創作相關的朋友,請務必要刷完本文。(文末附有 Gemini 使用指南)

本文將用 4 項能力測試,5 個應用案例,帶你理解 Gemini 的能力邊界。

主要測試,挑戰 AI 能力邊界

主測試 1:簡單形體的材質變換、連續微調形態細節,並大幅度改變視角

先用一些變態的 Case 開始,測試 Gemini 文生圖的能力邊界。

這是我測試的第一個 Case,因為一上來也不知道它到底邊界在哪,先從簡單的形體開始,讓它畫個正方體。⬇️

整個 Case 看下來非常連貫,指令理解到位,材質變換沒問題,基礎形態從未變形,甚至還能大幅更改相機視角,添加模特也完全沒問題。

💬

PS:我說這個「簡單」 Case 已經秒了其他的所有文生圖 AI,不過分吧。

主測試 2:手繪稿轉設計渲染圖,順便拍出產品宣傳圖

繼續測,在測試 1 的基礎上,我們上到設計生產級別,用一張手繪圖打底,讓 Gemini 完成全流程的產品造型概念設計推敲。

這個應該是很多設計公司在乎的 Case:

這張圖已經是最好的證明,感覺也不需要多說什麼解讀的話語了。

💬

如果你看到這裏,也發出了「WOC」的感慨——非常感謝你點讚、轉發、在看、評論本文。

雖然在實測中,在產品穿到人身上這不算穩定,總會帶著一些人像與產品的變形。

就這手稿轉 3D 產品渲染圖,還能再微調局部設計的水平,已經完全超出本科設計專業的畢業生水平(對,因為我自己就是工業設計畢業的)

還能快速在概念設計階段,生成模特使用場景圖,進一步驗證設計方案的效果。

對了, 如果你還不服氣,我再補一句:每張圖的生成時間不超過 10s……這還不算「炸裂」,那還有什麼算呢?

主測試 3:一次性生成多套不同風格的設計

我發誓,這是本文最後一個工業設計的 Case 了,後面還有遊戲設計、自媒體應用等更多元的 Case,一個比一個精彩。⬇️

💬

我其實一貫 AI 評測挺克製的,但在測試 Gemini 文生圖的 4 小時內,基本每分鐘都在發出粗鄙的感慨……

這個 Case 就是進一步模擬工業設計的造型推敲環節。

原本我們會需要大量的時間在犀牛(一套工業設計建模軟件)中花數天時間建模,再花數天在 keyshot(一套工業設計渲染軟件)中調整材質、打光出圖。

而且一旦建模完成後,想要再對模型進行造型調整,簡直是對設計師無盡的折磨。

現在,Gemini 在 20s 內就給你一次性生成 12 張 🥲 ……

主測試 4:摳圖、換背景、打光影

搞掂了產品設計,正常商業流程中,我們還要解決一下最終宣發的物料問題。

這時候離不開摳圖、換背景、打光影拍照的工作流程。

先摳個圖,無中生有地換背景:

沒問題,換的非常好。

再看看商業級別的背景合成與打光:

再引用一個 WaytoAGI 上看到的例子:

絕了,每次都只用一句嘴炮,就能在 10s 內取得相當穩定的預期結果。甚至複雜的形體打光,也能做的有模有樣。

OK,fine,測到這裏,我只想說:

——大碳奸恭迎矽基老爺重塑人類社會。

社區實例一覽

💬

再看一些社區里大家在嘗試的應用實例,也幫助我們獲得更多啟發

更多應用 1:遊戲角色與道具設計

對遊戲行業可能的影響與啟發之一:遊戲內容設計(來自群友 @z.z.h

更多應用 2:家裝設計

來自群友 @Zhenyuan_Branton,家裝設計也不含糊,你也可以直接把自己的手稿、房子照片拍給它,讓它自己添加傢俱,完成設計推演。

更多應用 3:創作教育、自媒體內容素材

如果 Gemini 這麼強的能力,用在教育、自媒體內容創作領域呢?

更多應用 4:漫畫繪製與改色

來自Twitter @Linaqruf

更多應用 5:遊戲複雜場景與動作變換預覽

來自Twitter @Cristian Peñas

如何使用?

  1. 1. 登錄 Google AI studio,鏈接:https://aistudio.google.com/prompts/new_chat

  2. 2. 在 Model 中選擇 PREVIEW – Gemini 2.0 Flash Experimental(new)

  1. 3. 確認選擇「Images and text」

好,接下來也和我一起參與到恭迎矽基老爺重塑人類社會的行列吧~

Btw:我有個設計師朋友對此評價

—— 以前我可以假裝建模、摳圖磨洋工,現在老闆只會跟我說趕緊 AI 生產改完發他了。

害!