完成億元級融資,「自變量機器人」實現全球最大「具身智能操作基座模型」|36氪正選

文|周鑫雨

編輯|蘇建勳

近期,36氪獲悉,具身智能創業公司「自變量機器人(X Square)」連續完成Pre-A與Pre-A+輪融資,總金額達到億元級。投資方包括德聯資本、基石資本、啟賦資本、南山戰新投,老股東九合創投持續加註,一葦資本擔任獨家財務顧問。

據瞭解,融資將用於下一代統一具身智能大模型的訓練與場景落地。

自變量機器人成立於2023年12月。公司致力於通過研發具身智能通用大模型的路徑,實現通用機器人。2024年4月初,36氪曾報導過其完成數千萬元天使輪及天使+輪融資。

自變量機器人的創始團隊,兼具Robotics Learning(機器人學習)和大模型的雙重背景。

創始人兼CEO王潛畢業於清華大學,是全球最早在神經網絡中引入注意力機制的學者之一。博士期間,王潛在美國頂級機器人實驗室參與了多項Robotics Learning的研究,研究方向覆蓋了機器人的多個前沿領域。

聯合創始人兼CTO王昊是北大計算物理博士,在粵港澳大灣區數字經濟研究院(IDEA研究院)期間擔任封神榜大模型團隊算法負責人,發佈了國內首個多模態開源大模型「太乙」,首批百億級大語言模型「燃燈」以及千億級大語言模型「薑子牙」。

當前,「腦」(不論大腦還是小腦)日益成為具身智能賽道的熱門話題。

在海外,兩位前卡內基梅隆大學教授成立的Skild AI,在2024年7月完成了3億美元的融資,成立僅一年估值就達15億美元;由前Google研究員,Stanford與Berkeley教授成立的Physical Intelligence(PI),估值則已達到20億美元。

「自變量機器人從成立之日起就堅定選擇了‘統一大模型’的技術路線,與這兩家公司後續公佈的不謀而合。」王潛表示。

但目前,具身智能大模型領域還存在不少無人區。在國內,首批百億級大語言模型和機器人的結合還較淺,常常只局限在簡單的語音互動與感知規劃。

與此同時,全球範圍內尚未出現能真正解決物理世界複雜的操作問題的通用大模型。傳統機器人通常基於特定場景和任務,很難根據環境和任務的變化自主調整策略。長遠來看,作為「腦」的模型泛化性不足,也會給具身智能的規模化造成阻礙。

王潛對36氪表示,訓練具有高泛化性的具身智能通用大模型,也就是統一大模型,是目前真正的解法。

為具身智能接入一個通用的底層模型,意味著機器人有了一個學習了所有任務之間的通用架構的大腦,比如物理世界的規律、物體的特性、機械臂的控制力度等。

相較於適用於特定任務或場景的垂直模型,具身智能通用模型所具有的任務泛化性,能夠讓開發者不用根據每個新任務從0-1訓練模型,減少模型微調所需訓練數據量的同時,所得模型還能根據任務和環境變化自主調整策略。

成立以來,自變量機器人在具身智能通用操作模型的研發上進行了快速迭代。成立僅2個月,自變量機器人就訓練出了第一版具身智能操作模型,可實現切菜、倒水等步驟長且複雜的操作任務。在2024年中,模型在特定任務上已顯現出少樣本學習和自發的跨任務遷移能力。

近期,自變量機器人實現了全球目前最大參數規模的具身智能通用操作大模型:Great Wall系列(GW)的WALL-A模型,採用的技術路線為「統一具身智能大模型」。王潛表示,該模型在多個維度上達到或超過了SOTA水平。

據王潛介紹,WALL-A模型的特點在於,實現了兩個維度的「統一」:

一,實現了所有步驟「端到端」的完全縱向統一。輸入最原始的影片、語言、傳感器信號,輸出最後的機器人的速度、位姿、力矩,用一個模型完全解決,中間沒有任何切分的步驟;

二,實現了不同任務的橫向統一。所有的任務放在同一個模型訓練,推理用同一個模型進行操作。也就是說,一切操作任務,只用這一個模型,就解決所有問題。

王潛對36氪提到,端到端的縱向統一,可以避免人為干預所引入的噪聲和信息損失;任務的橫向統一,則讓機器人像人一樣從不同任務中獲得可相互借鑒的經驗。

「新一代的具身智能技術的突破體現在泛化性、通用性、自學習、處理複雜任務的能力上,這一切在統一大模型均有體現。」王潛表示。

他透露,自變量機器人已經實現了一系列創新,既包括底層算法、框架的創新,也包括數據工程、訓練工程的整體系統級創新和優化。

以下是投資人評價:

德聯資本:

德聯資本長期以來堅定支持機器人領域的早期創新,大模型帶來的具身智能技術躍遷將使機器人泛化性得到本質提升,加速場景普及應用。自變量機器人作為具身智能基礎模型公司,創新性地提出大小腦融合的統一端到端具身基礎大模型,展現了scaling law在具身智能領域的巨大潛力。自變量團隊具備行業稀缺的Robotics Learning與多模態大模型融合能力,將模型架構、訓練方法、數據管線深度耦合,具有顯著的差異化與競爭壁壘。德聯資本高度認可並堅定支持自變量成為行業領先的具身智能基礎模型公司。

基石資本:

自變量機器人在具身大模型上的深刻理解與技術積累令人印象深刻,是國內極少數既完整做過多模態大模型又深入理解機器人複雜操作的復合型團隊。公司成立之初就堅定選擇端到端的訓練範式,搭載其模型的機器人在空間關係理解、長序列複雜動作以及場景泛化能力等關鍵難點上都展現出國內外領先的水平。我們認為自變量是一個專業水平領先並有極客精神、心懷夢想並願意為之付出的創業團隊,熱烈歡迎他們加入基石大家庭,我們將持續堅定的支持公司的發展,協助公司達成遠期目標。

啟賦資本:

自變量機器人是當前國內唯一致力於端到端統一具身大模型的公司,也是少見的能將完整的語言及多模態大模型訓練經驗和機器人學習經驗有機結合的原生團隊。這一代的具身智能技術,既需要新的技術棧上的突破,也需要在整體工程落地上的創舉。公司在技術原始創新、工程創新、工程落地方面體現出了極大的優勢,是一個兼具探索家氣質、科學家精神、工程師實踐的團隊。我們相信隨著自變量機器人在模型、數據、工程等方面工作的逐步落地,必將顯現出領先世界的模型效果與真正落地通用機器人的商業潛力。

南山戰新投:

自變量機器人採用先進的端到端技術路線,致力於構建一個能夠從感知直接到動作的通用具身大模型。得益於其高效的數據採集系統,公司能夠實現數據與模型之間的快速迭代,確保技術持續領先。在短短半年內,公司自主研發的基礎模型已經能夠訓練機器人執行一系列複雜而精細的物理操作。團隊由機器人學習和大模型領域的專家組成,與國內其他具身智能公司相比,展現出明顯的差異化優勢。公司技術與南山區的人工智能戰略高度一致,有望解決具身智能機器人產業發展的核心瓶頸,並具備引領未來具身智能大模型發展的潛力。

九合創投:

自變量機器人從Day 1開始堅定統一大模型的技術路線,在具身智能的Foundation Model上持續投入,並已經產生了階段性的成果,當前模型的現場執行效果、複雜任務處理能力、泛化能力處於領先狀態。九合在自變量團隊持續加註,我們期待團隊在LLM理論基礎、實踐經驗的積累上,不斷推進具身智能大模型的技術路線演進,給具身賽道帶來新的變化。