美圖奇想大模型升級影片生成能力,逐步落地美圖秀秀、Wink、MOKI 等產品

9 月 23 日,美圖公司宣佈美圖奇想大模型(MiracleVision)影片生成能力完成全面升級,在實現生成能力、生成效率以及模型性能的三重進階基礎上,結合美圖在計算機視覺領域的多項自研技術優勢,影片生成時長與畫質、流暢性、真實性及可信度等方面提升顯著。

目前,美圖奇想大模型(MiracleVision)的單次文生影片時長、單次圖生影片時長均達 5 秒,已支持 1 分鐘、幀率 24FPS、解像度 1080P 的超長影片生成,可以任意影片尺寸輸出。

基於美圖公司在影像領域的長期深厚積累,全新升級的美圖奇想大模型(MiracleVision)結合對特徵的大範圍提取,實現了在藝術風格、細膩畫風、細節把控之間的高度平衡,並針對人像、動漫、國潮、商業設計等領域進行優化,具備強大的風格泛化力與兼具藝術審美的視覺表現力。此外,在複雜 3D 時空精準重構基礎上,影片生成能夠重現真實物理規律,支持大幅度流暢運動。

美圖奇想大模型(MiracleVision)於 2023 年 6 月上線,2024 年 1 月通過國家備案,2024 年 6 月迭代至 V5 版本並升級為 Diffusion 與 Transformer 模型結合的全新技術路線,採用 DiT 影片生成架構。

在新的技術路線下,相較業界先頭兵,美圖奇想大模型(MiracleVision)選擇優先攻克更具挑戰性的問題。此次升級,美圖奇想大模型(MiracleVision)在技術層面上解決了主體一致性、運動連貫性、物理邏輯合理性等影片生成能力落地的核心問題。

目前,美圖奇想大模型(MiracleVision)全新影片生成能力已應用於美圖旗下部分產品,憑藉高度可複用的模塊化能力,升級優勢將逐步覆蓋美圖秀秀、美顏相機、Wink、開拍、美圖設計室、WHEE、MOKI 等產品,進一步深化美圖在影片工具賽道的應用深度與廣度。

作為美圖 AI 產品生態的基石,美圖奇想大模型(MiracleVision)堅持以用戶需求場景驅動技術研發模式,追求用戶體驗和技術進步的平衡。本次升級完成後,美圖奇想大模型的架構進一步完善,從 AI 圖像、AI 影片、AI 設計三個維度,全方位支持美圖 AI 產品生態的豐富與進步,切實提升用戶的體驗與效率,深化美圖公司在電商、廣告、遊戲、動漫、影視領域的應用實踐。