豆包視頻生成大模型發佈：支持多風格多比例的一致性多鏡頭生成

09月24日 14:58 新浪網 tech-auto-hilite

新浪科技訊 9月24日下午消息，火山引擎總裁譚待正式發佈豆包視頻生成大模型。其特性包括高效的DiT融合計算單元、全新設計的擴散模型訓練方法和深度優化的Transformer結構，可以實現更充分地壓縮編碼視頻與文本，支持一致性多鏡頭生成，能夠大幅提升視頻生成的泛化能力，譚待表示，豆包視頻生成大模型支持多風格多比例的一致性多鏡頭生成，可應用在電商營銷、動畫教育、城市文旅、微劇本等領域。

此外，譚待表示，豆包大模型發佈以來，使用量爆髮式增長。豆包大模型日均tokens使用量超過1.3萬億，日均生成圖片5000萬張，日均處理語音85萬小時。（羅寧）