AI影片生成告別默劇時代!GoogleVeo 3一步生成高質量音畫大片,rap、電影、動畫片都拿捏

一水 發自 凹非寺

量子位 | 公眾號 QbitAI

Google最強影片生成模型Veo 3鯊瘋了!

這一次,從畫面到對白,全都由AI原生直接生成。

不僅可以拿捏各種影視風格——

請看VCR(花式演繹「We can talk!」)

還能搞掂大段rap——

影片中的Flow只需簡單一句話就能搞掂,比如「讓老人談論宇宙」。

從畫面到口型再到音頻,完全以假亂真了。

還在發佈會現場,GoogleDeepMind CEO哈薩比斯就激動宣佈:

我們終於走出了無聲影片生成的時代。現在用戶能用自然語言直接描述角色、場景,還能指定對白和語氣。

而通過官方demo,我們也看到了Veo 3電影級的音影片能力:

目前Veo 3已在Gemini應用程序中面向Google AI Ultra訂閱用戶開放,企業用戶可以在Vertex AI平台調用。

雖然距離發佈會結束才幾小時,但一大波網民試玩已新鮮出爐——

說唱、洗腦神曲、烹飪節目花式整活

一上來,腦洞大開的網民們就開始搞起了抽像……

提示詞:a video with dialogue of two muffins while baking in an over, the first muffin says 「I can’t believe this Veo 3 thing can do dialogue now!」, the second muffin says 「AAAAH, a talking muffin!」

兩個鬆餅表情豐富地開始了對話,連口型都能完美對上:

還復古了上世紀80年代的烹飪節目,並帶來全新互動方式:

提示詞(中譯版):一段20世紀80年代復古電視烹飪節目的影片,主持人是一位65歲左右的英國老太太。她正把麵糰放在面前的檯面上擀著,說道:「現在,這得費點勁兒……」然後,麵糰變成了一張臉,抬頭看著她,用布魯克林口音說道:「嘿,女士,看著點!我正在努力膨脹。」 VHS錄像帶中的噪音

雖然最後一句話本該是麵糰的台詞(未完全遵照提示),但製作該影片的網民仍然被效果驚到了。

還有我們熟悉的洗腦神曲,連彈舌這種技術活兒都不在話下。(⊙o⊙)

提示詞:futuristic russian singer, techo vibes, eclectic tongue thing.

當然,除了這些好玩的,更有古希臘數學家畢達哥拉斯開展新式教學(連小蜜蜂都有)

提示詞:Pythagoras explaining his theorem, in ancient Greece

也能直接用來花式營銷,一遍又一遍強調同一個概念,主打一個洗腦。

甚至,憑空手搓一個和小紮的播客節目這樣的高難度任務也能實現:

原作者激動表示,再這樣下去Veo 4就和真的沒什麼區別了。

而另一邊,Google首席創意技術專家也透露了一些玩法細節。

他測試了一把Veo 3連續生成長影片的能力。

使用首尾幀功能,他最終製作了下面這個1分鐘左右的影片:

雖然這裏的背景音樂不是由Veo 3生成的,但男主角的自白和各種音效確實有電影內味兒了。

One More Thing

與此同時,GoogleVeo 2也迎來了升級。

最大亮點在於新增了「參考影片」功能,用來保持影片風格統一以及角色形像一致。

還有相機控制、首尾幀、畫面擴展、物體添加/移除等其他功能。

這些新功能目前已在Flow工具中部分上線,完整版很快將在Vertex AI平台推出。

最後,你認為Google這次的影片AI表現如何呢?

參考鏈接:

[1]https://x.com/arikuschnir/status/1924953349943697763

[2]https://x.com/MartinNebelong/status/1924926779677905014

[3]https://x.com/AIForHumansShow/status/1924934882930917861

[4]https://x.com/nearcyan/status/1924963340876710365

[5]https://x.com/skirano/status/1924957061969834382