AI影片生成告別默劇時代!GoogleVeo 3一步生成高質量音畫大片,rap、電影、動畫片都拿捏
一水 發自 凹非寺
量子位 | 公眾號 QbitAI
Google最強影片生成模型Veo 3鯊瘋了!
這一次,從畫面到對白,全都由AI原生直接生成。
不僅可以拿捏各種影視風格——
請看VCR(花式演繹「We can talk!」)。
還能搞掂大段rap——
影片中的Flow只需簡單一句話就能搞掂,比如「讓老人談論宇宙」。
從畫面到口型再到音頻,完全以假亂真了。
還在發佈會現場,GoogleDeepMind CEO哈薩比斯就激動宣佈:
我們終於走出了無聲影片生成的時代。現在用戶能用自然語言直接描述角色、場景,還能指定對白和語氣。
而通過官方demo,我們也看到了Veo 3電影級的音影片能力:
目前Veo 3已在Gemini應用程序中面向Google AI Ultra訂閱用戶開放,企業用戶可以在Vertex AI平台調用。
雖然距離發佈會結束才幾小時,但一大波網民試玩已新鮮出爐——
說唱、洗腦神曲、烹飪節目花式整活
一上來,腦洞大開的網民們就開始搞起了抽像……
提示詞:a video with dialogue of two muffins while baking in an over, the first muffin says 「I can’t believe this Veo 3 thing can do dialogue now!」, the second muffin says 「AAAAH, a talking muffin!」
兩個鬆餅表情豐富地開始了對話,連口型都能完美對上:
還復古了上世紀80年代的烹飪節目,並帶來全新互動方式:
提示詞(中譯版):一段20世紀80年代復古電視烹飪節目的影片,主持人是一位65歲左右的英國老太太。她正把麵糰放在面前的檯面上擀著,說道:「現在,這得費點勁兒……」然後,麵糰變成了一張臉,抬頭看著她,用布魯克林口音說道:「嘿,女士,看著點!我正在努力膨脹。」 VHS錄像帶中的噪音
雖然最後一句話本該是麵糰的台詞(未完全遵照提示),但製作該影片的網民仍然被效果驚到了。

還有我們熟悉的洗腦神曲,連彈舌這種技術活兒都不在話下。(⊙o⊙)
提示詞:futuristic russian singer, techo vibes, eclectic tongue thing.
當然,除了這些好玩的,更有古希臘數學家畢達哥拉斯開展新式教學(連小蜜蜂都有)。
提示詞:Pythagoras explaining his theorem, in ancient Greece
也能直接用來花式營銷,一遍又一遍強調同一個概念,主打一個洗腦。
甚至,憑空手搓一個和小紮的播客節目這樣的高難度任務也能實現:
原作者激動表示,再這樣下去Veo 4就和真的沒什麼區別了。

而另一邊,Google首席創意技術專家也透露了一些玩法細節。
他測試了一把Veo 3連續生成長影片的能力。
使用首尾幀功能,他最終製作了下面這個1分鐘左右的影片:
雖然這裏的背景音樂不是由Veo 3生成的,但男主角的自白和各種音效確實有電影內味兒了。

One More Thing
與此同時,GoogleVeo 2也迎來了升級。
最大亮點在於新增了「參考影片」功能,用來保持影片風格統一以及角色形像一致。


還有相機控制、首尾幀、畫面擴展、物體添加/移除等其他功能。
這些新功能目前已在Flow工具中部分上線,完整版很快將在Vertex AI平台推出。
最後,你認為Google這次的影片AI表現如何呢?
參考鏈接:
[1]https://x.com/arikuschnir/status/1924953349943697763
[2]https://x.com/MartinNebelong/status/1924926779677905014
[3]https://x.com/AIForHumansShow/status/1924934882930917861
[4]https://x.com/nearcyan/status/1924963340876710365
[5]https://x.com/skirano/status/1924957061969834382