談談「機器人創業」圈子裡的鄙視鏈丨焦點分析
作者丨邱曉芬
編輯丨蘇建勳
2024年,雖然大模型掀起的「具身智能」創業潮還沒多久,但在「智能湧現」訪談過數十家機器人公司後,我們發現一條圈子裡的「鄙視鏈」。
「搞軟件的,鄙視搞硬件的,搞大模型的,看不起強化學習的」,多位行業人士給出了類似的觀察。
認知的不同,決定了機器人創業者的入局姿勢。
英諾天使基金合夥人王晟向智能湧現表示,國內湧現出的幾百家機器人創業公司中,大概有三類基因:
一是原來機器人出身的創始團隊,更關注機器人硬件能力,主要圍繞控制和電機。本體派的核心是機器人本體(人形/四足狗),其次是機器人的臂或關節。
二是軟件背景的團隊,更關注機器人的智能化和泛化能力,但「軟」還可以進一步細分:
一批是上一波AI熱潮中的創業者,轉型至機器人領域,比如CV、強化學習;另一批則是真正大模型背景的玩家,這波人更少,處於鄙視鏈頂端。
“看不上國內那些搞硬件的公司。」一傢俱身智能大腦公司創始人對智能湧現直言。在他看來,軟件才是機器人發展的卡點,但目前硬件公司在AI軟件上的預算太低,「只是簡單接接國外開源的大模型」。
宇樹科技是典型的「硬件派」,其創始人王興興曾在一次公開採訪中回應過這一點——他們對於AI的投入很克製,因為太燒錢了,「機器人才是我們的立身之本」,他甚至直言,「歡迎客戶用我們的硬件,哪怕把我們的軟件全刪了」。
一位機器人硬件公司人士無奈表示,目前機器人在「軟」的方面還沒收攏共識——行業存在太多的技術範式和路線,大腦和小腦的邊界是什麼?具身智能到底怎麼做?目前行業還很混亂,留有很多問號。
而「軟硬之爭」的結果是,國內大部分硬件公司,還在用傳統的硬件思維來做機器人,對於「腦」的運用只是蜻蜓點水;而大部分做「腦」的公司,則選擇自己從頭開始做一個硬件。
各自為政,行業呈現出一種隱約的割裂狀態。
大模型,還沒辦法「賦能」機器人
「現在搞硬件的公司,就是影片拍攝公司!」多位投資人、行業人士向智能湧現表示。
今年以來,許多機器人廠商在demo里展示的場景足夠酷炫:比如機器人可以在汽車工廠搬東西,幫忙分揀貨架商品,給人一種AGI時代機器人照進現實的感覺。
但實際情況卻並非如此。
一個完美demo的幕後往往是:若拍攝一個機器人從抽屜里抓水杯的場景,比如訓練的時候是早晨,到拍攝的時候天黑了;或者訓練時抽屜里多擺了兩個杯子、抽屜位置挪動了——這些細枝末節一改變,都可能導致機器人任務失敗。
「有的demo,甚至一萬次才成功一次,(影片里)不誠實的情況非常嚴重。」一位行業人士表示。
但你可能會疑惑,大模型在手機、電腦各類終端上已經足夠智能,為何無法讓機器人大腦變得更聰明?以至於讓硬件公司們需要在「完美」demo上如此努力。
據智能湧現瞭解,目前大部分硬件公司對大模型的理解和應用並不深入——基本只是簡單接入國內外通用語言大模型。但實際上,大模型與機器人真正需要的」空間智能「,還有很遠的距離。
多位行業人士向智能湧現表示,語言大模型的數據量越大,反而更容易產生「幻覺」,干擾任務執行。「語言大模型和機器人落地一點關係都沒有,區域任務上的成功率,慘不忍睹!」
而前述具身智能大腦公司創始人表示,目前國內沒有一個團隊真正從機器人出發,去做適配具身智能的大模型。
此前,機器人行業的一項解決方法是,在多模態大模型和機器人身體之間,引入一個中間層「小腦」——它的作用是承上啟下,存放多項「子任務」(比如把「讓機器人衝咖啡」任務拆成「拿杯子-磨豆子-衝水」等多項子任務),供大腦調配,也讓機器人身體能讀懂並且動起來。
但新的難點又出現了。一方面,小腦的引入,意味著機器人廠商們需要在其中預設無窮無盡的子任務,若遇上複雜的任務,各個子任務還需要再進一步拆分。
另一方面,數據匱乏則是更艱巨的難題。目前,政府和一些公司已經投入大量資源進行集中訓練,但多位行業人士表示,效果並不理想,因為大家既不清楚應該收集何種數據,也不知如何界定優質數據的標準。
以抓杯子的場景為例,理想狀態下的高質量數據應該是,拿一個機械臂控制它從頭到尾做一遍,告訴他——抓杯子要怎麼抓,當任一場景變化了,又要怎麼抓。但這也意味著,一個簡單抓取的動作,就需要幾千萬條、甚至幾億的數據。
當大家懷揣著「大模型改變一切」的心態闖進機器人領域,才發現中間的gap遠比想像的更大。
一場集體糾偏
從行業的角度來看,割裂的狀態並不健康,而如今的投資人、產業玩家們,正在出現一場關於「糾偏」。
2024年下半年,機器人行業的投資風向隱秘出現變化。王晟告訴智能湧現,在2024年前,很多投資人粗淺認為,投機器人=投資人形機器人硬件。
在過去的一年半,人形機器人公司烈火烹油,估值飆升。據智能湧現瞭解,以宇樹科技、智元機器人為例,兩家炙手可熱的機器人硬件廠商,近兩年連續完成數輪融資後,估值雙雙邁過10億美金大關,「貴到大家投不起」。
而彼時,國內眾多專攻機器人小腦/大腦的公司,則面臨融資困境,有一些甚至需要重新思考如何向市場講故事。
「今年下半年以前,我們和投資人講,做機器人統一大模型、講端到端,誰信呢?」前述機器人大腦公司創始人告訴智能湧現——「但是今天你不講端到端,都不好意思出門了」。
投資風向直至今年下半年,出現逆轉。
一家做人形機器人關節的公司創始人向智能湧現直言,今年以來,明顯感覺純做硬件的初創公司很難拿到大筆融資了,「市場有點冷」。
而從近期消息面上看——在海外,Skild AI、Physical Intelligence成立短短時間內,估值飆升至百億;在國內,不久前機器人小腦公司「星海圖」拿到螞蟻投資,大腦公司「自變量」、「千訣科技」也先後拿到融資。
「現在投資人從投人形,改投具身智能了」,王晟向智能湧現表示,因為大家現在意識到,具身智能才是更好機器人驅動完成泛化任務的關鍵。
反思不止是在投資層面,一波硬件廠商也開始集體複盤過去的模式——在以前,機器人廠商更多是在專用領域里收集數據,再去做專用的場景,大家信奉 「通用,就是沒用」。
如今,雖然大模型還沒辦法真正用起來,但它給這一派創業者的啟示是,或許要先學會忘記專項場景,先構建通用的基礎模型能力,再在上面長出專用的能力——這或許才是系統解決通用性的關鍵。
機器人領域的軟硬之爭,暴露的是,在AI的衝擊下,機器人行業目前還處於一種共識尚未彌合的混沌狀態。但不確定性中的確定是,機器人的終局是硬件與具身智能的結合,軟硬件缺一不可。
「無論是從軟件出發還是從硬件出發,大家的終局是接近的,就看誰的商業效率更高」,一位行業人士表示,「而AGI時代的機器人公司,本質上需要夠既懂AI、又懂硬件的團隊。但更關鍵的是,大家還要相互認同」。
(本文圖片都來自官方渠道)