對話地瓜機器人CEO王叢:人形機器人在2030年有望迎來「智駕時刻」

地瓜機器人CEO 王叢地瓜機器人CEO 王叢

今年以來,人形機器人的出現頻率有點高。

7月份在上海舉辦的世界人工智能大會上,大會場館入口展出了來自國內15家企業和單位的人形機器人「方陣」。緊接著,8 月份世界機器人大會來到北京,有媒體統計這次展會上光人形機器人就達到了27款。

與展會上的「熱鬧」呼應的是資本市場的青睞。根據鈦媒體App不完全統計, 2024年上半年,國內人形機器人投融資事件超過10起,融資總金額超過20億元。像宇樹科技、智元機器人、星動紀元、星海圖、帕西尼感知、星塵智能等初創公司都更新了融資進度。

當鈦媒體App就這一現象向地瓜機器人CEO王叢提問時,他也感歎到,人形機器人這麼複雜的東西,一年之內能出現20多家公司,火爆程度無需多言。但他更傾向於用「苗頭」來形容當前行業的狀態,畢竟仍有很多亟待解決的難題,大規模爆發還需要更多的等待。

人形機器人在2030年有望迎來「智駕時刻」

地瓜機器人源於地平線的機器人事業部,今年年初從地平線分拆獨立。王叢也在機器人領域工作多年,多年的觀察和實踐下,對機器人發展也有著自己的判斷。

機器人的形態有很多,自動駕駛汽車就可以看作是一種高級別的智能機器人,兩者之間,本就同根同源,都是通過攝像頭、雷達等傳感器感知周邊環境信息,並經過GPU、NPG或BPU等完成感知識別、決策規劃等,並最終輸出控制指令。

區別在於,自動駕駛系統應用的場景就是出行,所需操控的主要就是方向盤、油門、刹車。而機器人根據用途劃分,形態各異,能夠應用的場景也更加多樣。單就市場上較為成熟的機器人的形態來看,就可分為家用掃地機、割草機,商用的清潔機器人、倉儲和物流機器人等。而人形機器人,通過搭配機械臂、輪足等,自由度更高,應用場景會更為廣泛。

人形機器人之所以會成為風口,王叢對鈦媒體App總結說主要有兩點因素的推動。

首先,大模型催化具身智能概念的風靡。

如果說2022年9月,特斯拉Optimus全球首戰,掀起了如今這波人形機器人熱潮。那麼,真正將人形機器人這波浪潮推向高潮的還有另一個關鍵因素——2022年11月ChatGPT的發佈。「大模型的泛化能力,也為具身智能機器人賦予了很大的發揮空間。」

人形機器人相關技術可以分成三部分:大腦、小腦和本體。在人形機器人語境下,大模型等同於「大腦」。所謂泛化能力,意味著模型能夠適應各種不同的數據分佈,而不僅僅是在訓練時見過的樣本‌。通俗來講,泛化能力的高低決定了人形機器人「舉一反三」的能力。

其次,美國人形機器人產品的火熱起到了標杆作用,進而帶動了中國二級市場上市公司和一級市場創業公司的參與。

王叢表示,「具身智能現在的時間點很像2016、2017年自動駕駛發展的狀態」。當時深度學習剛剛爆發,各種圖像檢測、分割算法頻頻刷榜,各種資本不斷湧入,產學研各界人才紛紛聚集到各種自動駕駛大小公司,有的從L4切入,也有的從L2做起。

6、7年後的今天,雖然自動駕駛還沒有達到100分的狀態,但至少已經發展到了「體驗到、買得起的狀態」。王叢判斷,綜合技術、人才、資本等維度來看,機器人的發展也有望經過6~7年發展,在2030年迎來自己的「智駕時刻」。

因此,地瓜機器人也並非全部押注在具身智能人形機器人上,而是選擇面向機器人的全場景應用,提供從端側智能計算芯片、開發者套件,到雲側開發環境和算法中心的整體解決方案。

比如,針對比較成熟的掃地機、割草機等相對成熟的領域,地瓜機器人會通過旭日5智能計算芯片來與大企業合作,打造面向消費級的機器人產品,通過規模化來形成商業閉環。

同時,RDK系列則面向個人開發者和中小創客領域,探索更加多樣化的機器人產品,培育機器人的整個開發生態。最新的RDK X5便是基於旭日5的開發者套件,除了開發板硬件還配套大模型輔助開發工具、200+開源算法和應用程序等軟件,方便開發者快速進行算法和應用部署。

車廠,或成為人形機器人的「試煉場」

從這幾年人形機器人的發展來看,主要經歷了兩個階段:

第一個是從0到1的階段,主要以秀技術為主,多被用於教育科研、展覽展示、開發者比賽等。

而現在則處於第二階段,清華大學副教授周穀越表示,具身智能已經邁過了從0到1的階段,處於從1到100的狀態。「已經有人說證明這件事可行了,然後大家都在這裡面嘗試不同的方法。」

在目前人形機器人嘗試進入的諸多場景中,工業製造是人形機器人企業最關注的落地應用之一,尤其是在汽車工廠。

2021年AI Day上,馬斯克發佈了特斯拉的人形機器人計劃。時隔一年,在2022年9月的AI Day上,人形機器人Optimus(擎天柱)正式亮相。當時馬斯克就提出,未來的Optimus將會到特斯拉工廠內打工,包括搬運、用扳手給汽車安裝螺栓等。

今年5月,特斯拉特別發佈了一段關於Optimus二代的新影片。在影片中,Optimus二代從傳送帶上拾取4680電池芯,並將它們精確地插入之前由專用機器處理的托盤中。同時,背景中還有約10台人形機器人分別在進行物品擺放、衣物摺疊等操作。

在國內,今年2月,優必選也發佈了工業機器人Walker S在蔚來合肥基地總裝車間的影片。影片中,Walker S在汽車工廠流水線上,可以進行門鎖質檢、車燈蓋、板檢測、安全帶檢測、貼車標等工作,覆蓋多個生產環節,同時還能與人類員工互相配合,完成汽車裝配及質量檢查作業。7月初, Walker S 還進入到極氪5G智慧工廠,在CTU入庫上料工位協同員工執行搬運任務。

為什麼汽車製造業是人形機器人的試煉場?

王叢對鈦媒體App解釋說,一方面,對比戶外、家庭、商超等複雜場景,工廠環境相對穩定、簡單,數據充足,更適合人形機器人早期發展;另一方面,從產業鏈分析,汽車製造和機器人的技術原理有很多類似之處,因此,汽車製造也更容易向下兼容到人形機器人領域。

他還引用手機產業鏈的發展作為類比,手機產業大起來後,培養了很多人才,供應鏈也隨之成熟,之後很多淘汰的手機芯片放到了IoT上,等於手機作為一個優先級最高的東西孵化了IoT。同樣的道理,汽車需要一個大算力、高複雜度的芯片,算法上也是感知控制,也是多個攝像頭,多傳感器融合,在某種程度上和人形機器人類似。

然而,人形機器人要想在汽車工廠發揮真正的能力,還有諸多問題要解決。

首先從人形機器人本身來說,當前面臨的兩大難點:一是機器人目前的軟件端,適合機器人的通用大模型和垂直專業模型,還在攻堅階段;此外,硬件想要達到「靈巧」的程度無論是從技術上還是成本上都有難點。

在王叢看來,現在人形機器人還處於一個相對沒有收斂的狀態。「人形機器人的本體各家有各家的玩法,算法也各有各的玩法,比如有用仿真的,有用生成方式,有用Imitation Learning(模仿學習)的,有用Learning from video的。而不同的技術路線會導致數據採集的方式出現很大不同,再加上裡面又耦合了硬件設計,硬件不一樣也會導致數據採集的標準不一樣。」

不過,他也認為,任何一個行業,但凡是處在即將爆發的階段都會呈現一種很發散的狀態。「說不清楚哪個對,但每個點都值得去嘗試,這些點可能在試過一些鏈路之後才會出現一個相對普通的路徑。」

其次,雖然汽車和人形機器人有相似之處,但從細節來看仍存在差異,而差異便是挑戰之處。

從硬件本身來講,汽車的形態已經一百年沒有變化,它的控制單元很少,比如方向盤、刹車、油門。但機器人的各種動作繁多,任何一個自由度都是一種控制,比如特斯拉人形機器人第一代單手擁有 6 個自由度,第二代增加到 11 個自由度。更何況,不同廠家的人形機器人控制單元並不統一,光人形機器人的一個手,就可以做成靈巧手或者夾爪樣式。此外,機械臂的軸也不確定,這都會帶來很多技術上以及算法上的難點。

王叢總結說,目前人形機器人在汽車工廠最具挑戰的部分在於:針對每一種單一的任務,都有一種專用的設備,但在多任務模式下,目前人形機器人的泛化能力還有待提升。

比如,在固定場景下訓練「抓」這個動作,「反復學個1億次,一定能學會」。但如果學習更複雜的動作,比如打開杯子,就得需要重新訓練。

至於何時人形機器人才會在工廠發揮更大作用,王叢表示,未來誰能把泛化任務的能力做出來,哪怕一個人形機器人就做兩三種任務,但是確實能讓工廠真的節省成本,工廠才真的會買單。

就在近期舉辦的開發者日活動上,地瓜機器人推出了面向具身智能全場景的算力核心RDK S100。百TOPs的算力水平幾乎看齊當前的高階智駕,而且在核心架構上也採用專為大參數Transformer模型優化的BPU拿殊架構,為具身智能的各種大參數模型,打好硬件基礎。

但要真正解決技術路徑不夠統一和任務泛化難題,顯然不是地瓜機器人一己之力所能夠解決。在推出RDK S100的同時,地瓜機器人還宣佈,星動紀元、逐際動力、求之科技、睿爾曼、國訊芯微將率先搭載。有了這些一線玩家的強力支持,或許能夠更快地讓人形機器人找到屬於自己的「第一份工作」。

智能化才是這波最大的紅利

在2024 All-In峰會上,特斯拉CEO馬斯克接受訪談時談到了對人形機器人的願景:它能當你的夥伴,就像《星球大戰》里R2-D2以及C-3PO的結合體。它能帶你的步,能除草,還能給你的孩子洗澡,教育你的孩子等等。並且他還預測,未來機器人的數量將遠超人類,達到2:1至3:1的比例,成為人類生活中不可或缺的夥伴與助手。

當然,人形機器人距離馬斯克預想那般真正進入千家萬戶還需要相當長的時間。王叢提到了一個觀點:很多時候一個東西最終到老百姓消費使用之前,一定會經歷特定行業、特定場景、限制功能一系列過程,才會進入到千家萬戶。而在特定的場景當中,「就像達爾文進化論一樣,有的生物是長翅膀的,有的是長腿的,其實很多場景沒必要都用一個本體結構去做,目光也不要僅僅局限在‘人形’上,智能化是這波熱潮最大的紅利。

(本文正選於鈦媒體App,作者|韓敬嫻,編輯|張敏)