影片大模型Vidu發佈3個月後正式全球上線 記者實測

7月30日,曾於3個月前亮相中關村論壇的AI生成影片大模型Vidu正式上線,開放給全球用戶使用。

Vidu是文生影片大模型Sora爆火之後,國內最早號稱要「對標Sora」的大模型。4月27日,在中關村論壇未來人工智能先鋒論壇上,清華大學教授、生數科技首席科學家朱軍發佈了Vidu,引發業界轟動,但此後便一直保持低調。在此期間,快手的可靈、智譜AI的清影已經先後開放給用戶使用,其中,可靈一上線就吸引了眾多用戶的關注,目前生成一次影片的排隊時間甚至要等待幾十小時。

作為第一個亮相,但上線略晚於同行的影片大模型,Vidu有何特別之處?新京報貝殼財經記者進行了實測。

分寫實與動畫風格 可生成4秒或8秒影片

新京報貝殼財經記者發現,此次Vidu上線面向的是全球用戶,通過網址(www.vidu.studio)用戶可以進入Vidu界面,此後可選擇Google賬戶登錄或者郵箱登錄。登錄後的創作界面,可選擇上傳圖片或輸入文字兩種方式進行AI影片生成,也可以採用圖片與文字結合的方式。

記者首先以「一個帶牛仔帽的身影背對鏡頭,看著對面的落日,天空中還有兩顆行星的影子,金黃色的天空下,地面是被風吹過的草地和樹影」為提示詞進行了輸入,Vidu生成的影片不僅滿足了記者在提示詞中的要求,天空中的雲朵和星球的光影也顯現出了跟隨時間轉換的效果,同時,影片中人物出現了一個「扶帽子」的動作,相比之下,記者數天前以同一提示詞輸入快手可靈和智譜清影時,人物並未出現明顯的動作場景。

Vidu的影片生成界面與生成效果。

智譜清影的影片生成界面與生成效果。

快手可靈的影片生成界面與生成效果。

在生成時間上,生數科技方面表示,Vidu在推理速度上取得了突破,4秒影片片段的生成時間實測僅需30秒,比業內最快水平的Gen-3工具快一倍。

不過,記者在實測中發現,對於上述生成的影片,Vidu生成進度條加載完畢的時間在40秒至50秒,但當「生成中」的進度條讀滿,影片並未立即出現,記者此後又等待了一段時間才看到最終生成的影片。而當記者在今日中午12時49分測試圖+文字生成影片時,等待超過2個小時也未能成功生成,最終截至發稿,影片顯示「生成失敗,積分已退回,請稍後重試」。

生數科技方面表示,Vidu生成的影片解像度最高達1080P,除了文生影片和圖生影片兩大基礎功能外,Vidu上線動漫風格和角色一致性兩大新功能。

其中,動漫風格選項不僅保持動漫風格的一致性,還提高了畫面的穩定性,避免了其他影片生成工具「動漫化」時常見的畫面跳變和風格突變等問題。而「圖生影片」板塊中,Vidu的角色一致性功能令用戶可上傳人像圖或者自定義的角色圖,然後通過文字描述指定該角色在任意場景中做出任意動作。

「目前業界對類Sora影片模型的評價主要圍繞三大核心維度:語義理解準確性、畫面美觀性、主體動態的一致性,Vidu很好地平衡了三個方面的表現。 在畫面質感上,Vidu在構圖、敘事和光影等方面,能達到接近電影級的畫面標準,Vidu還能生成影視級特效畫面,如煙霧、炫光效果、CG特效等。」生數科技方面表示。

每月免費贈送80積分 一次生成耗費4積分 

貝殼財經記者發現,進入Vidu後,預設使用的為Vidu「免費版本」,但與可靈和清影的免費設置略有不同,使用Vidu生成一次影片是耗費積分的,記者使用文字生成一次影片耗費了4積分,如果想把該影片升級成超清模式,還會再消耗4積分。

根據Vidu免費版的設置,每月每人有80積分,可生成4秒影片,支持超清。此外,對於商用、去除水印(目前使用免費版Vidu生成的影片在右上角有Vidu的水印)等要求,Vidu還推出了包月和包年套餐,以包月套餐為例,有「標準」「高級」「尊享」三個版本,收費分別為9.99美元、29.99美元、99.99美元。

和其餘許多影片大模型公司一樣,Vidu也設置了測試計劃,邀請一部分「Vidu藝術家」參與測試,提供積分與合作機會。

而對於B端用戶,目前Vidu開放了API,不過需要填寫申請問卷才能使用。貝殼財經記者發現,問卷包括7個問題,填報問卷將有機會獲得一定數量的免費API使用額度。不過,生數科技方面回覆記者稱,由於目前暫時還處在內測申請階段,API的價格暫未確定。

「我們希望開發者們能夠在Vidu的基礎上開發各類應用,將多模態大模型帶到更多場景中。目前,我們正在尋找第一批種子用戶來測試我們API服務的穩定性,以便更快向全部開發者推出。」Vidu在官網表示。

記者聯繫郵箱:luoyidan@xjbnews.com

新京報貝殼財經記者 羅亦丹 

編輯 李錚 

校對 王心