豆包視頻生成大模型發佈:支持多風格多比例的一致性多鏡頭生成

新浪科技訊 9月24日下午消息,火山引擎總裁譚待正式發佈豆包視頻生成大模型。其特性包括高效的DiT融合計算單元、全新設計的擴散模型訓練方法和深度優化的Transformer結構,可以實現更充分地壓縮編碼視頻與文本,支持一致性多鏡頭生成,能夠大幅提升視頻生成的泛化能力,譚待表示,豆包視頻生成大模型支持多風格多比例的一致性多鏡頭生成,可應用在電商營銷、動畫教育、城市文旅、微劇本等領域。

此外,譚待表示,豆包大模型發佈以來,使用量爆髮式增長。豆包大模型日均tokens使用量超過1.3萬億,日均生成圖片5000萬張,日均處理語音85萬小時。(羅寧)