人形機器人,終究還是泡沫?

一年一度的機器人春晚——世界機器人大會(WRC2024)落幕了。

這次的世界機器人大會,一共有169 家機器人領域的企業參展。和智源大會、上海世界人工智能大會類似,這裏同樣「人山人海」。

在展館內熙攘的人群中,各種規格的機械臂、靈巧手在半空中揮舞,輪足、四足、人形機器人展示著各類任務。

人形機器人物品分揀失誤,影片經5倍加速‍‍‍‍‍人形機器人物品分揀失誤,影片經5倍加速‍‍‍‍‍

但在喧囂的水面下,我們在展廳內依然發現一些疑惑和爭議。

「人形」,是最大的非共識。

即便展館內人形機器人隨處可見,但全球機器人行業絕對大咖——波士頓動力公司的創始人Marc在大會中直言,自己非常不看好人形機器人行業。

他認為,工業機器人已經非常成熟,能夠商業化,目前人形機器人「在某種程度上是一種炫耀,而不是一種生產力」

Marc Raibert,波士頓動力創始人兼CEO 四木相對論拍攝Marc Raibert,波士頓動力創始人兼CEO 四木相對論拍攝

而展館內的最大亮點,也莫過於參展的27家人形機器人廠商。

這一年,承載著人類終極智能化想像的它們,已經從資本市場圈走近百億元資金。

人形主場,撲街現場?

在WRC2024,人形機器人擁有明星般的待遇。

假如你看到一群人舉著手機蜂擁而過,卻看不清被簇擁的核心人士,大概率是某家公司的人形機器人正在走路——身高一米六的機器人很符合人類身高,也很容易被人群淹沒。

宇樹的人形機器人展示 四木相對論拍攝宇樹的人形機器人展示 四木相對論拍攝

站在展館的一個十字路口,銀河通用、星動紀元、逐跡動力和星塵智能分列四周。不遠處,還有加速進化、宇樹、智元機器人、星海圖、鈦虎、UniX AI、開普勒等擁有人形機器人產品的公司。

人形機器人十字路口的四家公司,一年融資超10億  四木相對論拍攝人形機器人十字路口的四家公司,一年融資超10億  四木相對論拍攝

這些人形機器人公司在這一年里瘋狂「掃蕩」資本圈。

僅盤踞在「十字路口」的這四家,近一年公開披露的融資金額已經超過10億元。而它們的平均年齡,只有「一歲半」

但即便吸金無數,在直觀的現場演示中,不難發現各家人形機器人的Bug。

一家今年連續完成兩輪融資的人形機器人公司,目前僅能展示垂直領域的單點任務。

比如在分揀這個場景中,它只能在特定範圍內抓取雙面膠,不能抓取剪刀、捲尺。而且,這個機器人移動的速度非常緩慢,完成一個只需要移動20釐米的抓取動作,需要近40秒。

機器人抓取操作動作遲緩 四木相對論拍攝機器人抓取操作動作遲緩 四木相對論拍攝

還有展示炒菜機器人的樂聚,在眾目睽睽下直接上演了一出將菜倒在桌上的意外戲碼。

人形機器人盛菜撲街人形機器人盛菜撲街

另外,還有不少機器人存在難以站穩,分揀任務識別不清等問題。

在一個左右手分揀不同類型麵包的任務里,機器人放下右手準備拾起時,發現這是應由左手操作分揀的物品,只能上演一場大型空氣拉花。

人形機器人執行分揀任務時「懵逼」  四木相對論拍攝‍人形機器人執行分揀任務時「懵逼」  四木相對論拍攝‍

手和腳的非共識

雙足人形機器人到底有沒有用?是展館內出現次數最高的問題。

而現場的明星公司們,已經體現出對雙足的不同追求。

比如,逐際動力在現場大秀機器人「挨踹」後迅速平穩的絕技,星動紀元展示出自家機器人爬長城的影片。一牆之隔的銀河通用,則以輪式地盤代替下肢,以伸縮、吸盤、抓夾等部件完成取貨、清理桌面等任務。

銀河通用機器人,影片經3.5倍加速 四木相對論拍攝銀河通用機器人,影片經3.5倍加速 四木相對論拍攝

在行業中,雙足的擁躉認為,機器人只有具備了人形(尤其是雙腿),才能實現彎腰撿東西的操作,適應人類的工業、家庭、商業活動。

另一批公司則認為,哪怕是雙腿的設計也無法實現360度全場景的操作。而輪式方案,更讓人形機器人更快切入細分場景,率先落地。

在產業鏈的上下遊,靈巧手也存在技術路線之分。

手的關節靈活性要做到什麼程度?該是五指的形態,還是抓夾?

一種觀點是,人手在操作時,真正發力和掌握方向的只有大指和食指,其餘三指更多是輔助作用。也有廠商認為,只有五指形態的靈巧手,才能滿足對力敏感度要求高、材料差異大的場景需求。 

主攻靈巧手和視覺方案的「偉景智能」告訴「四木相對論」,現在沒有必要做到三個指節的靈活,因為僅靠食指和大拇指的捏合,就能完成大部分任務。

另一家靈巧手公司表示,自己的優勢就包括多個關節的靈活,「我們的食指關節都是能動的,裡面的部件比別家做得小,不會顯臃腫。」

會場中的靈巧手展示 四木相對論拍攝會場中的靈巧手展示 四木相對論拍攝

市面上靈巧手的售價在5萬~10萬左右,客戶為具身公司。一些主攻通用人形機器人的公司,也開始進入靈巧手市場。比如,星動紀元近期就推出了自己的靈巧手產品。

顯然,立刻擁有雙足和五指健全雙手的必要性,並未在機器人領域形成統一。‍‍‍‍‍‍‍‍‍‍‍

但盡快切入場景,獲得真實數據的反哺,則是各家的共識。

尤其是工業場景,海外人形機器人代表,特斯拉和Figure都選擇對智能化需求較高的工廠場景,作為落地第一站。

但不論是哪種場景,目前的人形機器人均處於訓練特定任務的階段,和非人形的差距並未拉開。

以汽車為例,汽車製造業分為四個工藝流程:衝壓、銲接、塗裝、總裝。在最複雜的總裝環節,自動化程度只有20%-30%。

在總裝環節,工人要用手操作機器,有時還要鑽到汽車里,要擰螺絲、敲敲打打,還要與其他工人配合,還要做檢測。

這個需要上下肢、大小腦一起協作的場景,理論上是「完全體」的人形機器人的目標。

不過現在,全世界沒有任何人形機器人能夠流暢地彎腰撿東西,更別提完成這一系列操作。

資本泡沫將至,行業難度不減

面對人形的天然流量,場館內有廠商堅定表示,自己決不會踏足人形機器人。

「我們的產品沒有人形,沒有腿和靈巧手,依然賣得很好。」一位創業近20年的服務機器人公司高管向「四木相對論」表示,他覺得人形機器人現在只是To VC的故事,而這個泡泡,明年下半年就會破。

事實上,決定扣下扳機的資方,已經紛紛作出選擇。

有投資人告訴「四木相對論」,雖然初創公司不少,但大家對國內的人形機器人標的已經形成一定慣性,「基本上都把錢砸給銀河通用和智元機器人」。

這一定程度上是因為人形機器人所需的高成本,使資本形成了聚集效應——只有獲取到足夠資金的公司,才能闖過接下來的關卡。

智元機器人展示 四木相對論拍攝智元機器人展示 四木相對論拍攝

理想狀況下,一個成熟的人形機器人產品,需要在算法、數據、傳感器搭配、力學設計、電力供給、零部件、新材料等層面完成適配。

而在2024年,人形機器人風起的第二年,雖然大模型、靈巧手等技術取得突破,但數據的稀缺、動力設計的困難、電機/傳感器等硬件的不匹配和價格高昂,都意味著人形機器人之路依舊漫長。

這其中的每一個環節,都需要長期的耐性和資金投入。

拿數據難題舉例。獲得高質量且足夠便宜的數據,是目前製約機器人發展的一大瓶頸,也是各公司希望構築的壁壘。

在大會現場,一家估值數十億元的人形機器人,不斷出現捏合不到位、抓取不到物品等Bug。這家公司的高管向「四木相對論」解釋,這主要還是因為訓練數據不充足。

而對於數據難關,海外巨頭特斯拉和Google都選擇「遙操」路線。這種方式,需要人帶上收集設備和機器配合完成動作,好處是數據真實,缺點是採集用時長,成本高

比如,Google為了訓練PaLM-E,用了13台機器人,收集了17個月,才拿到足夠的數據量。如果是更複雜的工業場景,數據採集成本會更高。

另一種方案則是十分火熱的仿真數據。這一方案的訓練過程往往需要判斷物體材質,比如判斷是杯子,然後再設計抓取的力量。

但缺少對「摩擦」等維度的建模,讓仿真數據徹底符合物理規律還存在難點。這種不夠真實的數據,可能導致機器人在實操中任務失敗。

銀河通用的高管也向「四木相對論」表示,仿真的數據雖然生成速度快,但依舊需要瞭解機器人場景的專業人士介入,否則不太能滿足需求。

這裏的專業,不僅指對數據和機器人場景的理解,還包括實操經驗的豐富度。

如果一家公司的人形機器人具備抓取、移動的能力,速度卻跟不上,那可能意味著他們缺乏經驗地採用了移動速度很慢的訓練數據,導致訓練出的機器人動作也很慢。‍

除卻數據,動力硬件和材料等難題依舊明顯。

比如,觸覺的缺失會使機器人難以判斷布料、水流等信息。但觸覺傳感器相比其他傳感器來說成本較高,且傳感器反饋的數據形態更加複雜。這些都是限制人形落地的阻力。

星動紀元的靈巧手,傳感器由其他供應商提供 ‍‍‍‍‍‍‍‍星動紀元的靈巧手,傳感器由其他供應商提供 ‍‍‍‍‍‍‍‍

人形機器人之外,各種各樣的機械臂、機器狗也充斥著會場。而且在家庭領域,一些更加垂類的智能工具已經體現出商業化潛力。

比如下棋機器人元蘿蔔,在展覽現場吸引了大量喜歡圍棋和象棋的學生。我們看到,家長也對下棋機器人充滿興趣,不斷詢問價格。

元蘿蔔展台擠滿了兒童和家長,四木相對論拍攝元蘿蔔展台擠滿了兒童和家長,四木相對論拍攝

宇樹的機器狗,也已經被一些普通用戶買單,用在露營等場景。

宇樹科技機器狗‍‍‍宇樹科技機器狗‍‍‍

世界上第一隻機器狗誕生於1968年,距今已有56年歷史。它身形巨大,有時需要人工進入機器內部操作。當時,沒有人認為它能走進家庭。

對於今天的人形機器人,或許相信它的人會給予同樣的耐性。