高能預警,Google神器一句話P圖全網震動,PS直接淘汰,模特廣告業不存在了?

Google的Gemini 2.0 Flash憑一句話PS的功能,還在全網不斷掀起新的風暴!廣告業直接被顛覆,模特從此徹底不存在了。去水印、梗圖、交叉圖像,已經被網民玩瘋。甚至有人預言:Google已全面超越OpenAI,將率先實現AGI。

最近,Google的種種AI產品是全方位領先,大有全面超越OpenAI的架勢。

如今已經有人預測:GoogleDeepMind將比OpenAI率先實現AGI!

原因很明顯,如今GoogleDeepMind在多個領域佈局下的產品,已經表現出全面獲勝之勢,而且,它們並沒有炒作。

最佳通用模型:Gemini 2.0 Flash

最佳多模態:Gemini 2.0 Flash / Gemini 2.0 Pro Experimental

最佳原生圖像生成:Gemini 2.0 Flash

最佳文本/圖像到影片:Veo-2

最佳圖像生成:Imagen-3

最大的上下文窗口:2M(Gemini 2.0 Pro Experimental)

此外,Google的原生音頻生成功能也將很快上線。

對比之下,OpenAI近期最令人印象深刻的行動,大概就是發出15頁提案,呼籲美國政府全面封禁DeepSeek、鎖死中國AI了,這麼一對比,簡直高下立判。

總之,GoogleDeepMind不炒作,不對其他競品評頭論足,只是默默做事,給大眾留下了非常清新的印象。

如今,它已經愈發勢不可擋,而在機器人開發領域,如果僅是將額外開發的技術推向市場,或許就會引發巨大的衝擊波。

學會超強推理的模型,更懂怎麼生圖了

四天前,Google宣佈,自己的首個向公眾發佈的全模態圖像生成器上線,Gemini 2.0 Flash可以進行原生圖像生成了。

「一句話就能PS」的功能,當即震驚了全部網民。

Gemini生成的開懷大笑的蒙娜麗莎Gemini生成的開懷大笑的蒙娜麗莎

幾天過去了,Gemini 2.0 Flash引發的餘震,還在不斷迴響。

一句話去水印、交叉圖像生成等功能,被網民們玩瘋了。大家公認:它已經可以輕鬆取代Photoshop。

全模態圖像生成器,跟其他AI生圖模型最大的區別在哪裡?

因為它自身具備的超強推理能力,能結合現實世界的知識生成更符合上下文的圖像,理解更多細節,更遵循文化背景特徵。

其中,全程都是由Gemini模型完成,無需調用其他模型,只需通過自然語言提示。

此外,傳統的AI生圖器需要分開處理文本和圖片,它則是能同時輸出文本和插圖,保持驚人的一致性。

真正的多模態能力:同時理解文字、圖像,以及二者聯繫

理解世界知識:能做智能推理,結合現實世界知識生成準確內容

自然語言交互:僅用對話修改圖片,真正實現一句話PS

如此強大、令人震撼的修圖功能,不禁讓網民Oleks推測:以買圖為主業的公司,股價將暴跌、一瀉千里!

一句話PS,收費PhotoShop被創飛

如今看來,PS是已經被徹底顛覆了。

從11歲起從事視覺特效的Bilawal Sidhu表示,Google的Gemini新功能「一句話PS」將消除PS高手和小白之間的技術壁壘。

他展示了5個例子,用Gemini搞特效就是這麼簡單。

1. 將自己化身為Roblox和Minecraft角色

2. Gemini深刻的場景理解能力

演講圖片變三維線框模型

2D變3D線框模型渲染效果2D變3D線框模型渲染效果

3. 給不同人物添加墨鏡,表現良好

4. 3D線框+語義激光雷達點雲測試

3D測試

雷達點雲測試雷達點雲測試

5. 補畫與擴畫(in-painting and out-painting)

補畫:添加紅色激光眼

擴畫:擴大畫面場景擴畫:擴大畫面場景

把梗圖改成自己想要的樣子,從此以後so easy。

想腦洞大開製作其他「梗圖」,也是輕而易舉。

這張黑夜的照片,Gemini 2.0 Flash能讓它秒變白天的圖。

可以看出,在把夜景轉化為白天的實景時,景觀基本上準確的,沒有幻覺,如果要挑毛病,就是根據夜景圖像產生的圖產生了對光照條件的幻覺。

簡直讓人瘋狂。

有人不信邪,親自上手嘗試了一遍後,不得不承認:Google這次真的厲害了。

最令人驚喜的是,它幾乎沒什麼限制,可以毫無阻礙地生成名人肖像和受版權保護的角色圖像。

比如說,CMU機器學習博士James Campbell就嘗試把馬斯克P到了自己的辦公桌上。

這活靈活現的神態,人物和背景自然地融為一體,就問誰能看出來是P的?

網民們也紛紛展開實測。感受就是:這個功能太偉大了!

從此,一句話p圖真的到了next level。

上班要遲到了,需要火速編個理由,怎麼辦?打開Gemini 2.0 Flash,一鍵搞掂。

一句話,美女手中的手機就變成了我們指定的那款。

Gemini 2.0 Flash和pika的結合,也發揮出了奇效。

給模特一鍵換裝,簡直做到了極致。

從此,我們不必再去消息工作室拍寫真或者證件照了,直接上傳一張高清生活照就可以!

同理,一張正面肖像照,也可以切換至側視圖,或者縮小的視角。

各種角度的圖片都能生成。

結合Kling後,直接就生成了廣告大片,有望顛覆模特和廣告行業。

角色一致性的保持程度,也令人吃驚。

另外,這個功能還可以用來給我們設計房屋。

比如讓傢俱消失,然後將房屋裝修風格改成現代時尚美學。要知道,在美國找室內設計師幹這個活,可能會需要五千到一萬刀的費用。

甚至,它還能幫我們複原老照片。

去水印,網民們玩瘋了!

而在去水印方面,Gemini 2.0 Flash也是一絕!

這個意外解鎖的新技能,可是把網民們激動壞了。

這個功能不要錢,免費無限用,也不會因為刪除水印,產生的明顯的空白區域。

左:有多個水印的圖片;右:Gemini去水印後的效果左:有多個水印的圖片;右:Gemini去水印後的效果

在GoogleAI Studio上,可以使用「動動嘴,就能PS照片」的功能。

網民對去水印功能情有獨鍾。很多人實測之後,大為驚喜。

不過,這也引發了不少爭議,比如攝影師、設計師的作品被盜用,就會導致版權上的違法行為更加氾濫。

交叉圖像功能,一句話「講故事」

GoogleDeepMind研究及深度學習負責人,Gemini項目共同負責人Oriol Vinyals,被Gemini的新功能驚呆了!

在它看來,它的交叉圖像生成功能簡直是顛覆性的。

怎樣向2歲女兒的班級解釋AlphaFold的工作原理?

只要輸入提示:「Write an illustrated story about AlphaFold for toddlers」,圖文並茂,符合幼兒園風格的科普書,瞬間產生,Oriol Vinyals直呼這就是魔法!

AI可以讓AlphaFold這樣複雜的主題,對幼兒來說都變得更易理解。

Oriol Vinyals讚歎道:Gemini 2.0 Flash交錯圖像生成是一項革命性技術!

這個簡短的demo向世人展示了AI+教育的無限想像空間,以後啟蒙教育或許變得更加有趣!

而且,Gemini 2.0 Flash現在可以讓我們輸入任何人或物的圖片,在此基礎上創作出全新的形象,同時還能較好地保持原始人物/角色的特徵。

遊戲、漫畫、動漫圈都炸了

Gemini 2.0 Flash這個新功能,甚至可以用來迭代圖像,創建任何遊戲!

同時,Gemini 2.0 Flash也直接攻陷了漫畫圈。

現在用它來生成漫畫,只需要動動嘴的功夫。

有網民嘗試後,發現自己根本停不下來。只需一個簡單的提示,就能進行選擇性修改,而不會破壞整個圖像。

他激動地表示,「用它來製作漫畫和故事分鏡會變得非常輕鬆」。

給漫畫加個色,也是一句話的事情。

就連漫畫角色的動作——抬起手臂,也能用嘴完成。而且,輸出圖像與原圖保持了高度的一致性。

動漫圈的二次元們更是激動不已,有人驚呼,這是史上最佳動漫模型!

動漫創作的全流程,它都能依指示完成,比如把素描轉換為線稿;填充基礎色;添加一些柔和的陰影,光源位於左上角;添加一個室內背景,使其與當前的光源和陰影環境相匹配,使用合適的角度;調整為單色灰度,以符合輕小說插畫風格等等

更多的測試demo,自己體會。

Google最新生成模型Gemini API

而且剛剛,又有好消息傳來。

今天,開發者可以在Gemini 2.0 Flash Thinking Experimental的API中,使用圖片生成功能了!

用戶免費使用限制為1500次/天,最多10次/分鐘請求。付費價格也很便宜,每百萬tokens要0.40美元。

Gemini API的開發者Logan Kilpatrick,宣佈Gemini  API文檔已更新,使用代碼也可以生成圖像了。

開發者們可以用 API 來生成圖片做各種有意思的應用。

不懂編程,也沒關係,還可以把示例代碼作為參考發給Cursor之類AI編程工具,幫助寫生成圖片代碼。

比如,在文檔中,利用Pyton代碼,生成的「一隻戴著高頂帽、長著翅膀的豬」在一座充滿綠色植被的未來科幻城市上空飛翔。

在API文檔中,Google也指出了利用Gemini修圖時的一些限制,如下圖。

Gemini API文檔:使用編輯圖片功能,建議使用簡體中文等獲得最佳效果。

參考資料:

https://x.com/bilawalsidhu/status/1901078553736999340

https://x.com/OriolVinyalsML/status/1901328862656503826

https://x.com/gingfreecss325/status/19007989 6 4305457448

https://x.com/deedydas/status/1901042632958345369

本文來自微信公眾號「新智元」,作者:新智元,36氪經授權發佈。