圖片一鍵變視頻,阿里媽媽發佈圖生視頻技術框架AtomoVideo

封面新聞記者 易弋力

一年來,國內各大電商AI佈局不斷提速。近日,淘天集團旗下阿里媽媽技術團隊推出高保真圖片生成視頻框架——AtomoVideo(阿瞳木視頻),可將圖片素材自動化轉換為高質量視頻動效。目前,該技術已在阿里媽媽的萬相實驗室、廣告投放平台等應用場景上線,所有商家都可以體驗“圖片一鍵變視頻”的人工智能新技術,快速生成創意短視頻。

年初OpenAI公司Sora的發佈,讓人們看到了視頻智能創作的巨大想像力。實際上,國內很多團隊也在文生或者圖生視頻上有著大量探索。今年初,字節跳動發佈了超高清文生視頻模型MagicVideo-V2,阿里雲旗下魔搭社區(Model-Scope)上線文本生成視頻大模型。而淘天旗下阿里媽媽,也一直專注於將視頻生成技術與電商結合,為淘寶天貓商家提供更智能的視頻創作工具,讓視頻生成技術在更真實的商業場景中加速落地。

最近,阿里媽媽發佈的AtomoVideo應用,讓電商人眼前一亮:以後的商品視頻,可能不用再找專業拍攝團隊來幹了。

記者在AtomoVideo的體驗中發現,用戶上傳一張圖,輸入動作文字指令,靜態的圖片就能在各種場景中動起來。比如,上傳一張玩偶圖片後輸入文字指令:穿紅色襯衣的玩偶在街上散步。很快,一段短視頻就生成了,玩偶邁開步伐行走,街景也跟著變化。此外,靜態的帆船也能在輸入指令後在大海中揚帆起航,海報中的樂手也開始彈奏吉他演奏,場景還原和人物表情、動作,都接近專業動畫師水準。

據介紹,以上視頻生成功能已在阿里媽媽廣告平台廣泛應用。商家可以在阿里媽媽電商圖片生成工具“萬相實驗室”中,一鍵將製作的商品圖片轉化為商品視頻。同時,阿里媽媽的設計師也可以應用該技術,為商家客戶量身訂製視頻創意並投放。

據瞭解,AtomoVideo應用了阿里媽媽技術團隊自研的諸多新技術,包括優質數據集構建、多粒度圖像注入、漸進性動作強度增加的多階段訓練等,目前可以支援任意像素的圖片生成4秒視頻動效,並兼容市面上各種文生圖模型。

阿里媽媽一位受訪技術人士稱,當前技術還遠未挖掘出視頻生成的真正潛力,在視頻畫面穩定性、內容創造可控性以及視頻時長等關鍵要素上,仍有非常廣闊的探索空間。這位人士認為,當前的應用生成雖然只是起步,但隨著技術模型不斷迭代,視頻生成的準確度和仿真度也會逐漸提高。

在創意生成領域,除了此次發佈的AtomoVideo,阿里媽媽技術團隊也研發出可擴展圖片、視頻的“尺寸魔方”等創意編輯工具,可以實現圖片和視頻的任意目標尺寸的拓展和補缺,同時保持素材的原生性。

一位服飾商家說,現在市面上已經有不少AI出圖工具,但將圖片變成視頻的還很少,生成高質量視頻的就更少了,很多商家認為圖生、文生視頻還只是個概念,甚至噱頭。“雖然AtomoVideo生成的視頻時長還不長,精度也有待提高,但是感覺苗頭不錯,是個趨勢。”這位商家表示,很多商家在討論AI電商,各界也在期待圈里能出現殺手級應用。