OpenAI給不了的,DeepMind給,Sora聯合負責人跳槽後開組新團隊
機器之心報導
機器之心編輯部
入職三個月,委以重任。
在 Sora 發佈即翻車之前,其團隊掌舵人 Tim Brooks 在社交媒體上宣佈跳車,跳槽的去向還是競爭對手Google DeepMind。
這一消息立即引發軒然大波。據 The Information 爆料,Tim Brooks 的出走是因為 Sora 技術存在嚴重問題:不僅生成速度慢,還在各項性能上都難以與 Luma、Stability、Runway 等對手抗衡,更別提最近風頭正勁的 Pika 和國產影片生成模型們了。
在 Sora 還在閉門造車的這段時間,競爭對手們已經在市場上攻城略地,打得火熱。
當時,有業內人士預測,Tim Brooks 加入Google後很可能會在其影片生成模型 Veo 項目上大顯身手。
不過,Sora 之所以驚豔不僅是影片生成的效果,更在於它能模擬真實世界的物理規律。世界模型的風正在 AI 圈颳起:Google的 GameNGen 能不用遊戲引擎就直接生成遊戲,最近大火的 Oasis 更是能用影片模型直接做出能玩的遊戲。影片生成技術正在向模擬遊戲世界的方向狂飆。
而 Tim Brooks 入職Google DeepMind 後的新任務,就是這個方向。早在 DeepMind 聯合創始人 Demis Hassabis 致的歡迎詞中就劇透過這一點,他們要將「久未實現的創造世界模擬器的夢想變成現實」。
本週一,Tim Brooks 在 X 上宣佈:「DeepMind 有雄心勃勃的計劃,要打造能夠模擬世界的大規模生成模型。我正在為這個使命組建一個新團隊。」
根據這個帖子中所附鏈接的招聘信息,這個新團隊將與Google的 Gemini、Veo 和 Genie 團隊合作,並在他們的工作基礎上,解決「關鍵性的新問題」,並將模型擴展到「最高計算水平」。
Gemini 是Google的旗艦人工智能模型系列,可用於分析圖像和生成文本等任務。Veo 則是Google自己的影片生成模型,最新的 Veo 2 版本已經能一步生成美妝博主開箱影片或 Vlog,其逼真程度足夠以假亂真。
Google Veo 2 生成的 Vlog 影片,圖源:https://x.com/jerrod_lew/status/1872673797939044487
至於 Genie,它是Google對世界模型的嘗試 —— 一種可以實時模擬遊戲和 3D 環境的人工智能。就在上個月,Google震撼宣佈了他們的新一代世界模型 Genie 2,實現了輸入一張圖直接升維出一個交互可玩的 3D 世界。
Genie 2 生成的可交互的虛擬世界
「我們相信,在影片和多模態數據上擴展人工智能訓練是通往通用人工智能的關鍵路徑,」一則職位描述中寫道,「世界模型將推動眾多領域的發展,例如視覺推理和模擬、具身智能體的規劃,以及實時互動娛樂。」
Tim Brooks 團隊的招人要求
從以上 JD 來看,Tim Brooks 新團隊將致力於在其構建的模型之上開發「實時互動生成」工具,並研究如何將其模型與現有的多模態模型(比如 Gemini)進行整合。
主要招聘的有兩個崗位:研究科學家和研究工程師,年薪在 136,000 美元—245,000 美元區間。
評論區的反響也很熱烈,簡曆可能已經投上了。
世界模型是許多初創公司和大型科技公司追逐的焦點,比如李飛飛的 World Labs、初創公司 Decart 和 Odyssey。他們認為,世界模型有一天可以用來創建能與觀眾實時互動的媒體,比如只屬於你的獨家遊戲劇情。同時,世界模型也能更好地模擬世界,解決機器人訓練環境缺數據的問題。
但是原本靠創意吃飯的朋友們對世界模型的看法,可能就沒這麼樂觀了。
最近,《Wired》雜誌的一項調查發現,像動視暴雪這樣的遊戲工作室,已經裁減了大量員工,正在使用人工智能來偷工減料、提高生產力,並彌補人員流失。2024 年,由代表荷李活動畫師和漫畫家的動畫師公會委託的一項研究估計,到 2026 年,美國的電影、電視和動畫行業將有超過 10 萬個職位受到人工智能的衝擊。
不過,像 Odyssey 這樣的 AI 創業公司已經表態:他們的目標是與創意人士合作,而不是取代他們。至於Google能否用世界模型開創一個 AI 與人類創意共生的新時代,讓我們拭目以待。
參考鏈接:
Google is forming a new team to build AI that can simulate the physical world
https://x.com/_tim_brooks/status/1876327325916447140