2024GIAC智能視聽大會丨微博王巍:影片生成已進入多強競爭時期

12月22日,以「數字文化 智能視聽」為主題的2024(GIAC)智能視聽大會在青島舉行,旨在打造全國數字文化產業的協同創新平台,以智能視聽賦能文化產業高質量發展。微博COO、新浪移動CEO王巍受邀參加本次大會,並分享了AIGC時代下,影片大模型的發展現狀以及面臨的挑戰。

影片大模型的應用潛力巨大,這一領域已成為國內外諸多平台著重發力、激烈爭奪的AI應用方向之一。

在這樣的背景下,王巍表示,影片生成已進入多強競爭時期。「在國際範圍,有Google的Veo 2、OpenAI的Sora等,這些頭部玩家在影片生成領域具有較大影響力。在國內,快手可靈、字節即夢等產品實力也很強勁」,王巍表示,就目前實際情況而言,國內影片大模型所呈現出的效果和質量並不遜色於國外頭部公司產品。

為了能夠生成更高質量的影片內容,當下影片大模型的研發重心聚焦於構建一系列便捷高效的影片內容編輯工具,拓展影片創作的無限可能。

王巍介紹,「OpenAI發佈的Sora提供了很多編輯工具,譬如re-cut功能,它允許用戶找到影片中最滿意的幾幀,以此為核心向前後方向延伸以完成新影片的生成。這些AI影片編輯功能的不斷湧現,為影片創作增添了更多創意元素。」

王巍還以電影製作模式為例,分享了影片大模型驅動下,將來可能呈現的智能視聽形式:人類創作者確定主題和故事梗概,GPT生成電影分鏡頭腳本,影片生成工具Sora根據腳本自動生成分鏡頭影片內容……這些包括影片大模型在內的人工智能應用未來會貫穿整個影片內容製作過程。

雖然影片大模型在當下取得了突破性進步,但其發展之路仍面臨諸多亟待解決的問題與挑戰。「譬如目前影片大模型生成的影片內容往往逼真度欠佳,細節處理的不到位,在生成長影片時也有些力不從心」,對此,王巍表示,新浪在AI技術的使用上,會根據影片類型做區分。

「今年我們舉辦了新浪新聞探索大會,開場的探索主題影片就是我們完全利用影片大模型製作的,畫面流暢自然,效果非常好」。但在一些需要真人參與的影片節目中,AI技術應用還有改進空間。王巍繼續舉例介紹,新浪新聞的真人秀訪談欄目《熱浪之外》,需要嘉賓之間有一些互動,影片大模型可以生成人物與場景融合的遠景影片,但對於手部姿態、面部表情等細節的生成還不太成熟,因此這類欄目還是主要由真人拍攝來完成,AI可以輔助剪輯包裝。」

王巍指出,這些問題嚴重影響了影片大模型的應用效果,需要在後續的研究中不斷探索改進,以突破現有困境。