人形機器人,距離「轉正上崗」還差幾步?
想像一下這個畫面:一個淩晨的車間,幾排整齊的人形機器人沙沙作響地做著流水線任務。這個場景放在幾年前只出現在科幻電影里,不過在今天已經實現了。
前不久,人形機器人企業Figure推出第二代人形機器人Figure02,在軟硬件上比起一代都有突破進展,更是搭載了「金主爸爸」OpenAI定製的語音推理模型,實現自然語言的交互 。現在的它,已經進入寶馬車廠開始「打工」了,可以無休止地狂干20個小時。
「炸裂」新品的發佈又把人形機器人推到了輿論中心,從去年底優必選(9880.HK)上市到今年WAIC上特斯拉Optimus新一代的亮相,再到近期Figure02的推出,人形機器人的發展在這兩年可謂進展神速。
但是,脫下「創新技術」這層外殼,人形機器人的量產難度到底在哪裡?從研發到商業化應用又需要面對什麼挑戰呢?
01.為什麼是「人形」
人形機器人,最近又火了。
被微軟、英偉達和OpenAI投資的人形機器人企業Figure在前幾天發佈了號稱「地表最強」新款人形機器人Figure02。據「趣解商業」瞭解,和上一代相比,Figure02進行了外觀的重構,機器人的外皮承擔了壓力,採用了外骨骼結構,這樣子機器人的電源和算力布線就集成在機體內部,由此提高了機器人 的性能;迭代後的Figure02手部具有16個自由度,能夠承受與人類相當的力量。
軟件方面,新一代機器人也搭載了投資人OpenAI定製的語音到語音推理模型,這樣子人類就可以直接用語音和機器人交互。
其實機器人發展到現在,在我們日常生活中的滲透率已經非常高了,比如在商場里常見的大型清掃機器人、物流流水線上的物流機器人等;專項機器人如此完善的今天,我們為什麼還要做人形機器人?
而且,為什麼一定要是「人形」?
答案其實很簡單,因為只有「人形機器人」才最有可能接近「全能機器人」。
我們生活的世界中,所有的場景、設備、工具都是服務於人類的形態設計的,所以各種單項的機器人可以拆解某一種具體的場景去使用,比如物流機器人可以做扛、放重物,工業機器人可以擰螺絲、掃地機器人可以打掃,但是出了這個特定的領域,這個機器人就成了一塊「高科技板磚」。
而只有人形機器人能夠不受場景的限制,融入人類生活的各個方面。人形機器人最大的特點是自由度高,具備較強的自主性和多功能性;例如,在工業製造中,人形機器人可以替代人類從事重覆、繁雜和危險的工作減少事故發生。我們可以將現在各種機器人理解成發展人形機器人的一個初級形態,而人形機器人才是終極形態。
為了實現這個終極形態,人形機器人需要做三件事:感知、運動、思考。
就拿跨越障礙物這件事情來說,得先「感知」到障礙物,然後「思考」是走過去、跳過去還是跨過去,最後「運動」或者說行動來實現跨越。這對普通人來說只是下意識的行為,對人形機器人就是一個複雜的訓練過程。
現在大部分的人形機器人的問題都出在「思考」這個環節上,畢竟感知和運動可以通過傳感器佈局、機器人關節設計的完善來在硬件上下功夫,不過「思考」這件事情實在是太複雜了。
以往大家的訓練方式都是「打標籤」,比如教人工智能學習什麼叫做「西瓜」就把各式各樣的西瓜打上標籤,人工智能在看到符合這個標籤的物體的時候就可以給出相應的認知。不過這樣的訓練方式放在有局限性的領域中還好,放在更大的領域中就很難做到窮盡。
現在有了大模型,就打開了一種新的訓練思路。大模型加上傳感器數據,可以訓練機器人更好地瞭解世界的規律。
比如同樣都是去冰箱里拿飲料,拿瓶裝可樂和袋裝牛奶的方式就不一樣,大模型學習可以讓機器人「理解」可樂可以直接捏起來而袋裝牛奶就要輕輕拎起來的區別。
更重要的是,大模型可以訓練機器人對自然語言的理解,比如你說「我餓了」,現在的機器人未必懂它需要做什麼,但大模型訓練之後,機器人就可以為你跳轉到外賣平台的界面,更甚者可以給你去炒盤菜。對自然語言的深入理解,幫助機器人更好地理解人類,也能更大地減輕人類與機器人的交互難度。
可以說,大模型的應用又給人形機器人的發展推向了next level。
02.多方入局
在大模型的加持下,2023年被稱為「人形機器人元年」。
從融資表現來看,據「IT桔子」數據,2023年人形機器人領域融資事件有23起,總金額達到54.71億元,是過去十年以來的巔峰。而截至當前,2024年人形機器人領域已經有14起融資事件,總金額接近24億元。
從產品來看,2023年開始至今,不論是新銳的產品還是企業都在湧現。比如2023年成立的星動紀元,由清華大學交叉信息研究院孵化,致力於具身智能以及人形通用機器人技術和產品的研發;同年成立的開普勒,自研算法實現人形機器人預設動作與端到端全自主規劃相結合模式及精準控制…
還有趕在今年元旦之前上市的機器人賽道老牌選手優必選,更是以「人形機器人第一股」的姿態給整個產業的資本化再次推上快車道。
以優必選為例,這些三方供應商是整個領域的主力軍。這些企業基本都會以某種使用場景為切入來進行人形機器人的研發,比如優必選更專注於工業製造、 達闥更 多面向家庭服務。作為整個產業鏈的中遊,三方供應商最重要的自然是爭取下遊的訂單,趁早「進廠」;所以,市場化、商業化就對他們非常重要。比如,今年2月,優必選的Walker S已經在合肥蔚來汽車工廠進行「實調」; 據「趣解商業」瞭解,優必選已經和數十家國內頭部 新能源 汽車企業接觸,推進人形 機器人 需求對接。
而這些「被進廠」的下遊企業當中,也有部分開始自己搞人形機器人的選手。
特斯拉,就是一個代表。機器人作為馬斯克的「宏圖計劃」當中非常濃墨重彩的一筆,其機器人的代表作Optimus也一直都有進展,如今已經可以雙臂與腿配合完成基礎瑜伽動作,與此同時保持軀幹的穩定性;還可以通過純視覺輸入,以正常的速度拿起積木,並能按照藍、綠兩類顏色正確分類,在對面發生人為移動積木的動作時,Optimus依舊能以自身原本的節奏順利完成任務,且在積木擺放出錯時,自主調整正面朝上,完成糾錯。
小米也早在2022年就發佈了「Cyber one」,近期又聯手機器人泰鬥王田苗,投資了一家名為”小雨智造”的具身智能科技公司,這也是小米首次對外投資具身智能領域公司;而本田入局機器人領域都已經三十多年 的時間,推出的ASIMO甚至在2002年就跑去和紐交所董事長握手去了。
和中遊供應商有差別的是,下遊企業的研發出了實用性還有品牌效應,尤其是這幾位都是現在典型的造車企業,在汽車智能化勢不可擋的趨勢下,對於智能機器人的研究能讓車企更敏銳地捕捉前沿技術,也展現自己的技術實力。
在去年的 1024 小鵬汽車科技日上,小鵬汽車董事長兼CEO何小鵬推出了小鵬汽車自研的人形態雙足機器人 PX5;據「趣解商業」瞭解,小鵬團隊耗時 5 個月,實現了自研雙足機器人的穩定行走。
8月12日,何小鵬在微博上發佈一則影片,展示了一隻機器手訂購MONA M03的過程。何小鵬還表示:「AI及大型硬件的新進展今年內我們將跟大家同步,敬請期待。」雖然微博透露的信息不多,但也能看出小鵬在積極佈局機器人賽道。
在實用性上,中遊廠商更重視「開源」,因為要「開張賣錢」,而下遊廠家就更重視「節流」。馬斯克就表示Optimus量產之後也會率先進入到特斯拉的生產流水線。用人形機器人代替工人擰螺絲,可以收穫一個24小時待機、不會疲勞、不會鬧情緒的「完美打工人」,成本降低、效率提升,最終實現的就是生產成本的控制。
當然,下遊廠商研發的人形機器人足夠穩定後也可以進行商業化,從而成為整個企業收入的一個增長部分;不過從底層邏輯來說,雖然都是爭先「進廠」,但中遊和下遊的側重點還是略微不同。
03.何時量產
不論是中遊還是下遊選手,雖然都熱熱鬧鬧的,但也各有各的麻煩。
特斯拉的人形機器人已經開始拖延量產時間了。去年就表示Optimus要在2024年底前實現量產的馬斯克在不久前發推稱特斯拉明年會小批量的生產人形機器人,然後預期在2026年實現量產以及對其他企業客戶的交付;也就是說整個機器人的進展推後了幾乎一年。
小米的「Cyber One」在2022年亮相之後最後一次展示是在2023世界機器人大會上,而且展示的也是2022年的老版本,之後也沒傳來什麼突破性的消息。
「預計優必選人形機器人進入汽車工廠將在2024年底實現小規模交付。」優必選董事會主席、執行董事兼行政總裁周劍表示。不過在交付之前, 已經上市的優必選還要面對市值滑坡的困境。
截至8月14日,優必選的報收86.25港元/股,相比今年3月7日最高峰的股價328港元/股,不到半年時間跌幅已經超過了70%;市值也由高峰的超 1300億港元 跌到了361.87億港元,蒸發近千億港元。
那麼,人形機器人的困境到底在哪裡?
首先是技術難關。有媒體曾經報導,國內一線研發專家在人形機器人系列電話會上提出了人形機器人量產的四個技術痛點:
1.手部和腿部硬件集成難度大,需要更高的損失峰值功率和驅動能力;
2.腿部行走算法穩定性難以保證,學術界尚未出現真正意義上的類人走行算法;
3.手部精細化感知難度大,涉及到手的21-26個自由度;
4.雙臂協同、混合智能操控和避讓等算法難度大,需要高維度的規劃。
其次是在成本層面。機器人的量產還得考慮軟硬件的成本控制,如何隨規模效應逐漸均攤成本。
但這邊成本控制都還不成熟,那邊市場定價就已經捲起來了。今年5月,宇樹科技發佈的G1人形機器人售價只要9.9萬元,用得著和用不著機器人的都沉默了,因為人形機器人的定價當時還動輒在百萬元的區間。結果大家還沒為9.9萬元這個定價吃驚多久,3.65萬元售價的眾擎機器人發佈的專業級雙足機器人SA01整機或散件套裝上市 ,主要面向科研教育市場發售。
這種兩極分化的情況就讓很多機器人廠商十分為難了,而這背後反應的實際是人形機器人下遊市場需求不明確的情況。這也是大部分高新技術產品市場化的問題,由於高新技術產品對技術創新有極高要求,結果滿足要求的產品又太貴,所以中遊廠家只能推出一個又一個便宜的版本。
還有就是,人形機器人在非結構化場景中的應用受限;由於機器人通用性不足,無法靈活應對突發事件。人形機器人的商業化落地,最需要的是一個迫切又確切的場景;以現在的局面來看,高端製造需求下的工業化場景,以及人口老齡化趨勢下的生活化場景是商業化價值最高的場景。但是市場上仍缺少一個產品的典範,讓大家能更直觀地看到人形機器人的商業價值。
人形機器人能否真正取代人類的部分重覆勞作,還有很長一段路要走;但 人形機器人必然是未來的趨勢,誰能把這個「故事」具象化,誰才是贏家。
本文來自微信公眾號「趣解商業」,作者:劉亮,36氪經授權發佈。