崑崙萬維宣佈開源 Matrix-Game 大模型:工業界首個開源的 10B+ 空間智能大模型,支持《我的世界》

IT之家 5 月 13 日消息,崑崙萬維剛剛宣佈 Matrix-Game 大模型(17B+)正式開源,即 Matrix-Zero 世界模型中的可交互影片生成大模型。

崑崙萬維表示,Matrix-Game 是 Matrix 系列在交互式世界生成方向的正式落地,也是工業界首個開源的 10B+ 空間智能大模型,它是一個面向遊戲世界建模的交互式世界基礎模型,專為開放式環境中的高質量生成與精確控制而設計。

據介紹,Matrix-Game 包括三大核心:

  • Matrix-Game-MC 數據集:自主構建的大規模交互世界數據集,包含兩類數據:一是大規模無標籤的 Minecraft 遊戲影片,二是帶有鍵盤與鼠標控制信號的 Minecraft 與 Unreal 可控影片數據,具備精細的動作註釋。該數據集支持對複雜環境動態與交互模式的高效建模與學習。

  • Matrix-Game 主模型:基於先進擴散模型技術開發的圖像到世界生成框架,能夠根據用戶輸入(鍵盤指令、鼠標移動等)生成連貫、可控的互動影片,兼顧視覺質量、時序一致性與物理合理性。

  • GameWorld Score 評測體系:提出統一的遊戲交互世界評估標準,從影片的視覺質量、時序質量、動作可控性與物理規則理解四個維度,全面量化模型性能,填補了該領域缺乏系統性評測基準的空白。

Matrix-Game 能夠在不同 Minecraft 場景下(如森林、沙灘、沙漠、冰川、河流、平原等)實現可控生成,包括基礎運動、復合運動、視角運動等。例如,在一個沙漠場景中,Matrix-Game 能夠根據用戶輸入的任意控制指令(IT之家註:如鍵盤的 W / A / S / D 方向鍵、Space 鍵用於跳躍、Attack 鍵用於攻擊,以及鼠標用於視角移動),生成對應的遊戲世界影片,支持角色的前後左右移動、跳躍、攻擊以及視角變換等動態行為。

在此基礎上,Matrix-Game 支持自回歸式的長影片生成,不僅能實現動作與視角之間的絲滑銜接,還在時間一致性與環境適應性方面表現出色,為開發沉浸式長時體驗、創意內容生成及遊戲設計等應用奠定了堅實的模型基礎。

參考資料

  • 項目主頁:https://matrix-game-homepage.github.io

  • 技術報告:https://github.com/SkyworkAI/Matrix-Game/blob/main/assets/report.pdf

  • GitHub 開源地址:https://github.com/SkyworkAI/Matrix-Game

  • HuggingFace 開源地址:https://huggingface.co/Skywork/Matrix-Game

廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。