首份空間智能研究報告來了!一文全面獲得空間智能認知、要素、玩家圖譜

分析師 Xuanhao

量子位智庫 | 公眾號 AI123All

AI的未來,絕不僅限於聊天機器人和數字世界。

物理世界的AI推進,已經開始。而且定義正在被包括李飛飛在內的大牛明確——

空間智能

空間智能是什麼?包含哪些應用領域?如何系統性地看待空間智能?隨著技術的不斷進步,虛實融合邊界持續消融,空間智能的階段性成果、當前的認知和格局,正在愈發清晰。

在大量桌面研究、調研訪問、數據分析之後,為了更好把握空間智能現狀和未來發展方向,量子位智庫在《空間智能研究報告》(以下簡稱《報告》)中回答如上問題,同時系統性梳理了各應用領域重要玩家,並對產業迭代影響要素作出研判。

這也是國內首份明確以空間智能為對象,提供空間智能產業圖譜的報告

首份空間智能研究報告和產業玩家圖譜

《報告》認為,空間智能是主要基於3D視覺信息進行理解、推理、生成、交互的AI系統

以具體應用領域劃分,按不同的成熟度,空間智能可分為以下三種應用領域:

  • 自動駕駛

  • 3D生成

  • 具身智能

此外,擴展現實(XR,Xtended Reality)是空間智能的原生交互方式,而準確的世界模型是空間智能發展的終局狀態。

根據上面的應用領域劃分,結合目前的格局、發展等多方要素,量子位智庫在《報告》中詳細梳理了當下全球空間智能玩家的首份圖譜:

重點關注數據體系的成熟度

針對空間智能的不同應用領域,可以從數據成熟度、算法成熟度、算力支撐、普及便捷度、經濟性等維度進行觀察。

綜合不同維度來看,三個應用領域中自動駕駛成熟度最高,3D生成位居其次,最後是具身智能。

其中最值得重點關注的是「數據體系的成熟度」這一維度

對比得出,相比語言、圖片和影片等,空間智能現存的數據規模更少。這就可以解釋為什麼空間智能的成熟度更低——尤其具身智能,高質量的真機數據數量稀少。

文字、圖片及影片等數據的成熟支撐了以大語言模型為核心的AI浪潮爆發,《報告》認為,未來待3D、物理AI相關數據成熟後,空間智能也將迎來爆發時刻。

作為觀察空間智能進展最重要的維度,除上述數據積累規模外,數據體系成熟度具體還包括數據構成精簡度、數據分佈多樣性以及數據閉環成熟度4個部分。

數據構成精簡度主要指該領域數據模態、數據類型的複雜度,例如具身智能需要融合多種傳感器數據,成熟度更低、更複雜;數據分佈多樣性主要指該領域數據分佈是否足夠豐富以支持模型的泛化;數據閉環成熟度主要指能否構建數據飛輪的正反饋加速模型迭代。

自動駕駛領域已出現Scaling Law

《報告》表示,自動駕駛是空間智能目前規模最大、最成熟的應用,已經接近人類水平。

其技術前沿開始從模仿學習轉向強化學習,以保持性能增長。

目前,自動駕駛領域已經出現屬於空間智能的Scaling Law:可接管里程隨底層算力擴展和強化學習新進展快速增加。

數據顯示,2026年以後,當背後算力支持超過百萬卡集群時,預計自動駕駛水準將超過人類駕駛水準。

在空間智能的三大具體應用賽道,自動駕駛的數據體系目前最為成熟。

  • 數據積累規模來看,駕駛里程積累在百億英里級別;

  • 數據構成精簡度上來看,目前主要以視覺信息為核心,輔以激光雷達等少量信息;

  • 數據分佈多樣性來看,可以覆蓋多樣的駕駛場景(受益於發達的道路交通系統)

  • 數據閉環來看,自動駕駛構建了規模最大、最成熟的空間智能數據閉環。

3D生成已有千萬級別數據積累

3D生成是數字世界的空間智能,由圖形學和AI共同驅動,處於技術快速進步階段

當前,3D生成的最大瓶頸是難以找到具有良好擴展性的3D數據表徵。

數據積累規模來看,3D生成有千萬級別的數據積累,足以支撐可以商業化的產品;從數據構成上看,目前有多種數據表示形式,較複雜,技術方向尚未收斂;從數據分佈多樣性來看,可以覆蓋3D資產生成的大部分應用場景;從數據閉環來看,尚未形成閉環模式。

具身智能整體成熟度尚且較低

《報告》認為,可以和物理世界深度交互的具身智能,是空間智能未來規模最大的應用

但就目前而言,具身智能整體成熟度較低,不過頭部玩家即將開始生產環境實驗。

數據積累規模來看,需要廠商從零做起採集真機數據,存量積累規模小;從數據構成精簡度來看,具身智能涉及多種數據模態的融合,十分複雜,且面臨跨本體的泛化性問題;從數據分佈多樣性來看,目前真機數據的分佈也較為單一,以常見的運動和抓取場景為主;從數據閉環成熟度來看,機器人落地應用較為早期,尚未構建有效的數據飛輪

XR可實現3D類內容的原生消費

擴展現實(XR)的硬件基礎正在成熟,可實現3D類內容的原生消費,未來隨著3D原生內容和相關應用生態的成熟,將打開更大的市場。

XR是目前訓練具身智能的關鍵數據採集方式,可以加速真機數據增長推動空間智能發展。英偉達、特斯拉、Meta等領先機構已有相關探索實踐。

精確完備的世界模型是空間智能發展的終局狀態

世界模型是從大量數據中構建理解世界運作方式的內部表徵,可以推理行動後果預測未來,精確完備的世界模型是空間智能發展的終局狀態

《報告》認為世界模型可以通過各種技術路徑逼近,但不同路徑的精度和效率各異。

其中,側重3D和物理AI的空間智能,可能是建模真實世界的最佳方式。

有關空間智能的更多詳細內容,可在完整報告中獲取。

報告下載鏈接:

https://jkhbjkhb.feishu.cn/wiki/W5D7wuDcbiPXDLkaRLQcAJpOn8f