製作成本降低97.5%!「清華版Sora」影片模型Vidu全球正選主體參照技術|鈦媒體AGI

「清華版Sora」Vidu再度迎來重要更新。

鈦媒體App 9月12日消息,在11日生數科技媒體開放日上,由生數科技和清華大學聯合研發的國內首個純自研原創影片大模型Vidu,公佈全球首個「主體參照」(SubjectConsistency)技術功能更新,能夠實現對任意主體的一致性生成,不局限於單一對象,而是面向「任意主體」,無論是人物、動物、商品,還是動漫角色、虛構主體,都能確保其在影片生成中的一致性和可控性。

生數科技表示,Vidu是全球首個支持「主體參照」能力的 AI 影片大模型,打破了分鏡頭畫面對影片內容的限制,改變了影片創作的「遊戲規則」,提供了一定自由度和創新空間。目前,Vidu已經上線,影片生成最長可以生成32秒,用戶可以免費註冊體驗 AI 影片生成功能。

「主體參照」技術對於專業創作領域影響很大。生數科技透露,Vidu與北京電影節 AIGC 短片單元最佳影片得主、Ainimate Lab 合作打造的動畫短片《一路向南》,畫面質量接近傳統動畫製作標準,但成本僅為傳統流程的 1/40,傳統600人天,而基於Vidu做的是15人天,包含導演、美術、建模、燈光、渲染等不同「工種」,相當於影片製作成本降低了大約97.5%,Vidu 大大縮短了製作週期並顯著降低成本。

生數科技聯合創始人、CEO唐家渝表示,「主體參照」這一全新功能的上線,代表著 AI 完整敘事的開端,AI 影片創作也將邁向更高效、更靈活的階段。無論是製作短影片、動畫作品還是廣告片,在敘事的藝術中,一個完整的敘事體系是「主體一致、場景一致、風格一致」等要素的有機結合。

今年4月,清華大學人工智能研究院副院長、生數科技聯合創始人兼首席科學家朱軍教授發佈了長時長、高一致性、高動態性影片大模型Vidu,可以一鍵生成長達16秒的影片。此次技術更新,Vidu影片最長可以生成32秒。

生數科技聯合創始人、CEO 唐家渝生數科技聯合創始人、CEO 唐家渝

會後群訪中,針對與快手、字節等大廠市場競爭話題,唐家渝表示,無論是動態基礎能力、語義理解,Vidu都是目前業績最好、全球正選的能力情況,這是當下非常直觀的競爭優勢。未來公司堅持自主的底層算法研發,不斷突破認知邊界,提升現在影片能力的天花板,有更好的穩定提升和補充。

」我們也不是只做基礎技術的科研機構,而是一家商業公司,在這個過程中會持續圍繞落地行業進行技術能力迭代,努力在實際場景中也有好的一些磨合打造,保持我們對落地這件事情上理解的領先性。」唐家渝稱。

談到影片模型商業化,唐家渝透露,生數落地商業模式有兩種:SaaS訂閱模式;API形式,即模型能力輸出形式提供給客戶(MaaS),客戶直接調用模型的能力。自7月30日上線以來,我們在全球範圍內已收到數萬個API接入申請。另外,目前從收入角度看,B端市場的收入更大,是比較明確、比較直接的需求在其中,因此B端是生數科技長期非常重點的方向;C端增長曲線非常高,在不斷的探索過程中。

據悉,生數科技成立於2023年,是「清華系」多模態企業的核心團隊成員,由清華系 AI 公司瑞萊智慧RealAI、螞蟻集團和BV百度風投聯合孵化成立。今年6月,「生數科技」完成數億元Pre-A輪融資,目前生數科技投資方包括直投基金北京市人工智能產業投資基金,百度,中關村科學城公司,啟明創投,螞蟻集團、BV百度風投、卓源亞洲、錦秋基金、達泰資本、智譜AI等機構。

鈦媒體App瞭解到,近期生數科技新增工商實體「生數科技(香港)有限公司」,推測該公司接下來可能會考慮港股IPO或發力海外市場等。

(本文正選於鈦媒體App,作者|林誌佳,編輯|胡潤峰)