圖片一鍵變視頻，阿里媽媽發佈圖生視頻技術框架AtomoVideo

封面新聞記者易弋力

一年來，國內各大電商AI佈局不斷提速。近日，淘天集團旗下阿里媽媽技術團隊推出高保真圖片生成視頻框架——AtomoVideo（阿瞳木視頻），可將圖片素材自動化轉換為高質量視頻動效。目前，該技術已在阿里媽媽的萬相實驗室、廣告投放平台等應用場景上線，所有商家都可以體驗“圖片一鍵變視頻”的人工智能新技術，快速生成創意短視頻。

年初OpenAI公司Sora的發佈，讓人們看到了視頻智能創作的巨大想像力。實際上，國內很多團隊也在文生或者圖生視頻上有著大量探索。今年初，字節跳動發佈了超高清文生視頻模型MagicVideo-V2，阿里雲旗下魔搭社區（Model-Scope）上線文本生成視頻大模型。而淘天旗下阿里媽媽，也一直專注於將視頻生成技術與電商結合，為淘寶天貓商家提供更智能的視頻創作工具，讓視頻生成技術在更真實的商業場景中加速落地。

最近，阿里媽媽發佈的AtomoVideo應用，讓電商人眼前一亮：以後的商品視頻，可能不用再找專業拍攝團隊來幹了。

記者在AtomoVideo的體驗中發現，用戶上傳一張圖，輸入動作文字指令，靜態的圖片就能在各種場景中動起來。比如，上傳一張玩偶圖片後輸入文字指令：穿紅色襯衣的玩偶在街上散步。很快，一段短視頻就生成了，玩偶邁開步伐行走，街景也跟著變化。此外，靜態的帆船也能在輸入指令後在大海中揚帆起航，海報中的樂手也開始彈奏吉他演奏，場景還原和人物表情、動作，都接近專業動畫師水準。

據介紹，以上視頻生成功能已在阿里媽媽廣告平台廣泛應用。商家可以在阿里媽媽電商圖片生成工具“萬相實驗室”中，一鍵將製作的商品圖片轉化為商品視頻。同時，阿里媽媽的設計師也可以應用該技術，為商家客戶量身訂製視頻創意並投放。

據瞭解，AtomoVideo應用了阿里媽媽技術團隊自研的諸多新技術，包括優質數據集構建、多粒度圖像注入、漸進性動作強度增加的多階段訓練等，目前可以支援任意像素的圖片生成4秒視頻動效，並兼容市面上各種文生圖模型。

阿里媽媽一位受訪技術人士稱，當前技術還遠未挖掘出視頻生成的真正潛力，在視頻畫面穩定性、內容創造可控性以及視頻時長等關鍵要素上，仍有非常廣闊的探索空間。這位人士認為，當前的應用生成雖然只是起步，但隨著技術模型不斷迭代，視頻生成的準確度和仿真度也會逐漸提高。

在創意生成領域，除了此次發佈的AtomoVideo，阿里媽媽技術團隊也研發出可擴展圖片、視頻的“尺寸魔方”等創意編輯工具，可以實現圖片和視頻的任意目標尺寸的拓展和補缺，同時保持素材的原生性。

一位服飾商家說，現在市面上已經有不少AI出圖工具，但將圖片變成視頻的還很少，生成高質量視頻的就更少了，很多商家認為圖生、文生視頻還只是個概念，甚至噱頭。“雖然AtomoVideo生成的視頻時長還不長，精度也有待提高，但是感覺苗頭不錯，是個趨勢。”這位商家表示，很多商家在討論AI電商，各界也在期待圈里能出現殺手級應用。

你可能喜歡