徹底炸了!今天,又一次見證歷史!
來源:中國基金報
中國基金報 泰萊
兄弟姐妹們啊,OpenAI發佈新工具Sora,可根據文字生成逼真AI影片,再一次,震驚了世界!
OpenAI首個影片生成模型發佈
OpenAI推出了一項新技術,發佈了影片大模型Sora,進化到了可以通過文字描述直接生成高度擬真的影片,不僅是動畫了。
可以說,Sora出道即王炸,它能夠根據用戶的一句話生成長達一分鐘的影片,且影片流暢度和穩定性皆在水準之上。
目前官網上已經更新了48個影片demo,在這些demo中,Sora不僅能準確呈現細節,還能理解物體在物理世界中的存在,並生成具有豐富情感的角色。該模型還可以根據提示、靜止圖像甚至填補現有影片中的缺失幀來生成影片。
Runway Gen 2、Pika等AI影片工具,都還在突破幾秒內的連貫性,而OpenAI,已經達到了史詩級的紀錄。
![](http://n.sinaimg.cn/news/crawl/540/w500h840/20240216/8f65-4d10503268b3664eaf92bbf883b5c48a.jpg)
對比AI影片里Runway、Pika、Google和Meta這些主流玩家, Sora的特別之處在於:
1、能夠生成具有多個角色、特定類型動作和主題背景的複雜影片,時長可達到1分鐘。
2、可以在單個生成的影片中創建多個鏡頭,模擬複雜的攝像機運鏡,同時準確地保持角色和視覺風格。
3、最重要的是,它不僅理解用戶在提示中要求的內容,還能自己理解這些事物在現實世界中的存在方式。
![](http://n.sinaimg.cn/news/crawl/15/w550h265/20240216/d42b-61c24cb6dde280d213fad8c06621bbdd.jpg)
OpenAI首席執行官奧特曼(Sam Altman)週四在X網站上讓該平台用戶把自己想給Sora的文字描述提交給他。然後,他分享了Sora根據這些描述生成的影片。
「我們想向你們展示Sora能做什麼,」他在X上寫道,「不用擔心你的要求太細,或是難度太大!」
有人提出想要「一段海上單車比賽的影片,讓各種動物作為運動員騎單車,採用無人機拍攝視角」。奧特曼在回覆中發佈了一段由Sora生成的影片,影片中有企鵝、海豚和其他水生生物騎單車。
![](http://f.sinaimg.cn/news/gif_image/422/w1079h943/20240216/82f7-gifbe8f1f7d99676ff5eab1f5ba72bd44e2.gif)
另一段影片顯示,一位身穿圍裙、面帶微笑的白髮女士邀請觀眾進入她的廚房。有人向奧特曼要一段「由一名祖母輩的網紅主持的自製糰子烹飪課程,背景是一個質樸的托斯卡納鄉村廚房,並配有電影級的燈光」,之後Sora生成了這段AI影片。
![](http://f.sinaimg.cn/news/gif_image/356/w580h576/20240216/31fb-gif43bf4f40f56c026519d27e416a880867.gif)
OpenAI發佈了多個Sora生成的影片,大家可以感受一下。或許已經很難再分清,AI和現實的界限了。
「雪後的東京熙熙攘攘。鏡頭穿過繁忙的街道,跟隨著幾位享受著美麗雪景和在附近攤位購物的人們。美麗的櫻花瓣伴隨著雪花在風中飄舞」。
![](http://f.sinaimg.cn/news/gif_image/750/w480h270/20240216/4194-gif4ab86c0632e8560d9519d2cb45364955.gif)
「一位時尚女性走在充滿溫暖霓虹燈和動畫城市標牌的東京街道上。她穿著黑色皮夾克、紅色長裙和黑色靴子,拎著黑色錢包。她戴著太陽鏡,塗著紅色口紅。她走路自信又隨意。街道潮濕且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來走去」。
![](http://f.sinaimg.cn/news/gif_image/199/w640h359/20240216/4247-gife24e9aeb2d6832cf5a4d117224d1498b.gif)
一位時尚女士漫步在東京街頭,周圍是溫暖閃爍的霓虹燈和動感的城市標誌。
「讓Sora生成一張中國龍年舞龍的影片」。
![](http://n.sinaimg.cn/news/gif_image/176/w640h336/20240216/d9ba-gif9cbd0f1836f90b98daa4328db2978bc8.gif)
AI想像中的龍年春節,紅旗招展人山人海。
有緊跟舞龍隊伍抬頭好奇觀望的兒童,還有不少人掏出手機邊跟邊拍,海量人物角色各有各的行為。
![](http://f.sinaimg.cn/news/gif_image/199/w640h359/20240216/65f9-gif38cf201f35dd5600b9e92a8a02b49678.gif)
「穿過東京郊區的火車窗外的倒影」。
![](http://n.sinaimg.cn/news/gif_image/191/w640h351/20240216/a251-gifde85070e004cfa8bf3a254f68a890d01.gif)
「賽博朋克背景下機器人的生活故事」。
![](http://n.sinaimg.cn/news/gif_image/191/w640h351/20240216/0347-gif130a16ddc97613371f564f8f285e6bc0.gif)
「幾隻巨大的毛茸茸的猛獁象正踏著白雪皚皚的草地走來,它們長長的毛茸茸的皮毛在風中輕輕飄動,遠處覆蓋著積雪的樹木和雄偉的雪山,午後的陽光下有縷縷雲彩,太陽高掛在天空中。」距離產生了溫暖的光芒,低攝像頭視角令人驚歎地捕捉到了大型毛茸茸的哺乳動物,具有美麗的攝影和景深。
![](http://f.sinaimg.cn/news/gif_image/750/w480h270/20240216/9833-gif04bfa81e72e1e680754eada391e30fdd.gif)
「電影預告片講述了30歲宇航員戴著紅色羊毛針織電單車頭盔的冒險經歷,藍天、鹽漠,電影風格,35毫米膠片拍攝,色彩鮮豔」。
「一個華麗的珊瑚礁紙藝世界,到處都是五顏六色的魚和海洋生物」。
「鏡頭跟隨一輛帶有黑色車頂行李架的白色老式SUV,它在陡峭的山坡上一條被鬆樹環繞的陡峭土路上加速行駛,輪胎揚起灰塵,陽光照射在SUV上行駛土路,給整個場景投射出溫暖的光芒。土路緩緩地蜿蜒延伸至遠方,看不到其他汽車或車輛。道路兩旁都是紅杉樹,零星散落著一片片綠意。從後面看,這輛車輕鬆地沿著曲線行駛,看起來就像是在崎嶇的地形上行駛。土路周圍是陡峭的丘陵和山脈,上面是清澈的藍天和縷縷雲彩」。
網民直呼工作要失了!
![](http://n.sinaimg.cn/news/crawl/635/w550h85/20240216/4811-b446ff34c8e41932b5e12da441f9dd58.jpg)
甚至有人已經開始「悼念」一整個行業!
![](http://n.sinaimg.cn/news/crawl/196/w550h446/20240216/2c3c-2f4579fcd341554bfe2e4ffe6cce30a7.jpg)
![](http://n.sinaimg.cn/news/crawl/231/w550h481/20240216/3a53-057d1deaae4a7928da75f9869e3a63d2.png)
Sora目前存在的弱點
對於Sora目前存在的弱點,OpenAI也不避諱:模型在準確性方面可能會遇到困難,也可能無法理解具體的因果關係實例。
例如「五隻灰狼幼崽在一條偏僻的碎石路上互相嬉戲、追逐」,狼的數量會變化,一些憑空出現或消失。
![](http://f.sinaimg.cn/news/gif_image/320/w640h480/20240216/a39e-gifb18b1e1a716e9952b4d653088d84a3ab.gif)
該模型還可能混淆提示的空間細節,例如混淆左右,並且可能難以精確描述隨著時間推移發生的事件,例如遵循特定的相機軌跡。
如提示詞「籃球穿過籃筐然後爆炸」中,籃球沒有正確被籃筐阻擋。
![](http://n.sinaimg.cn/news/gif_image/293/w700h393/20240216/e18e-gif9f6d31086b63fb2c4b23250cdded620e.gif)
現在,Sora正面向部分成員開放,以評估關鍵領域的潛在危害或風險。
OpenAI表示,這項技術仍存在一些缺陷,包括一些空間問題。
該公司表示,它意識到Sora有可能製造錯誤信息和仇恨內容等。研究人員說,AI驅動的深度偽造已成為一種風險,可能會在2024年總統大選前給公眾造成困惑。
OpenAI表示,被選來測試Sora可被濫用方式的專家組將就如何加強對該系統的保護提供反饋意見。
該公司表示:「我們也在開發有助於檢測誤導性內容的工具,比如檢測分類器,它可以分辨影片是何時由Sora生成的。」