地表最強人形機器人問世,擎天柱頭號勁敵,每天工作20小時,前代已進寶馬打工

智東西8月7日報導,昨晚,由微軟OpenAI英偉達英特爾聯手投資的明星機器人創企Figure,發佈了新一代機器人Figure 02,再次顛覆我們對人形機器人的想像。

升級後的Figure 02不僅外形更像人,還在OpenAI多模態大模型的加持下,實現了與人類語音對話;擁有16個自由度的第四代手部靈活度大幅提升,可以實現更精細的操作,而特斯拉的擎天柱二代手部自由度為11個。

與第一代相比,Figure 02從外觀設計、軟硬件性能,到內置AI模型都進行了徹底的升級,主要體現在以下方面:6個板載相機、電池容量增加50%以上、3倍推理速度、第四代手部、語音到語音交互、內置VLM(視覺語言模型)。

Figure 02Figure 02

Figure成立於2022年,截至目前共完成5輪融資,總額8.54億美元(約合人民幣61.08億元),估值達到26億美元(約合人民幣185.88億元)。其投資方包括微軟、OpenAI、英偉達、英特爾、貝索斯等,涵蓋了時下生成式AI熱潮中的大模型、算力、投資公司等明星玩家,陣容十分亮眼。

今年2月,Figure宣佈與OpenAI達成合作,將在OpenAI大模型的支持下開發下一代人形機器人模型,將其多模態模型擴展到機器人的感知、推理和交互中。Figure 02的語音到語音交互功能,便是其基於OpenAI為其定製大模型的最新嘗試。

Figure 02在工廠中行走Figure 02在工廠中行走

Figure創始人兼CEO Brett Adcock稱,Figure 02的續航可支持每天完成約20小時的有效工作,這有助於其進入勞動力市場和家庭。值得一提的是,Figure的初代機器人Figure 01已經在寶馬工廠落地,在汽車製造過程中「自動執行困難、不安全且乏味的任務」。

從概念設計到落地,Figure 02僅用時18個月。Adcock還提到,團隊將推動低成本、高效率地製造,預計明年開始批量生產

01.推理能力提升3倍,每天可工作20小時

從外形上看,Figure 02比第一代酷炫了許多,布線不再裸露在外,看起來更加完整,外骨骼為其增添了現代感和科技感。不得不說,Figure 02現在看起來更像特斯拉的擎天柱了。

Figure 01(左)、Figure 02(中)和擎天柱二代(右)外形對比Figure 01(左)、Figure 02(中)和擎天柱二代(右)外形對比

在Figure 01的基礎上,Figure對機器人的軟硬件進行了徹底的重新設計,覆蓋AI、計算機視覺、電池、電子設備、傳感器和執行器等關鍵技術。

Figure 02Figure 02

Figure 02在6個方面取得突破,包括語音交互、攝像頭、手部、VLM(視覺語言模型)、電池、CPU/GPU

具體來看,Figure 02通過定製AI模型驅動的板載馬克風和揚聲器,以語音到語音的方式直接與人類對話。

它的頭部、前軀幹和後軀幹共有6個板載RGB攝像頭,通過AI驅動的視覺系統感知和理解物理世界,並在內置VLM的支持下進行快速常識性視覺推理。

Figure 02的6個攝像頭Figure 02的6個攝像頭

Figure 02採用Figure自研的第四代手,其具備16個自由度,且力量與人類等同。

Figure 02手部Figure 02手部

Figure 02內置的電池容量為2.25 KWh,相比上一代增加了50%以上,據稱每天能夠完成約20小時的有效工作,這為人形機器人進入勞動力市場和家庭鋪平了道路。

Figure 02在寶馬工廠Figure 02在寶馬工廠

模型推理方面,Figure 02板載的CPU/GPU提供比上一代高3倍的計算和推理能力,具備自我修正的學習能力。

Figure 02在寶馬工廠Figure 02在寶馬工廠

在外骨骼的加持下,Figure 02的重量相比上一代有所減輕,但由於增加了電池、攝像頭、CPU/GPU等,淨重量增加到約70kg

Figure 02的外骨骼細節Figure 02的外骨骼細節

02.曆時18個月落地,預計明年開始量產

Figure創始人兼CEO Brett Adcock稱,Figure 02在2023年2月完成概念設計,從概唸到成品曆時18個月

Adcock解讀了Figure 02在語音交互、布線等方面的技術原理。Figure 02的語音交互能力是基於OpenAI為其定製的大模型實現的。

語音到語音推理語音到語音推理

在接收到語音後,模型首先將其轉換為文字,同時,板載的VLM(視覺語言模型)基於攝像頭捕捉到的圖像和語音理解進行常識推理,然後基於推理控制機器人的行為,同時將輸出文本轉換為語音輸出。

在布線方面,Figure 02採用集成電源和計算布線,並設計了定製的電線端子和連接器,從而隱藏電線,並實現更高的可靠性、更緊密的包裝。

基於板載CPU和GPU,Figure 02能夠運行最新的AI模型,其推理能力達到Figure 01的3倍,能夠完全自主執行現實世界中的任務。

Figure 02的CPU和GPUFigure 02的CPU和GPU

對於Figure 02的進步,不少行業大佬和網民紛紛發來賀電

英偉達高級研究經理兼具身智能實驗室負責人Jim Fan稱:「恭喜Brett!製作高自由度靈巧手的決定絕對是正確的。」

Jim Fan評論Jim Fan評論

有的網民已經迫不及待地想看Figure 02和馬斯克的擎天柱大戰2024了。

網民評論網民評論

有的網民則迫切地想購買一台幫自己洗碗。

網民評論網民評論

同時,也不乏有一些質疑的聲音出現。有網民問道:「他是否具備超級工廠的製造能力?他真的能在垂直整合方面做到精細到原子成本的程度嗎?」

Adcock很堅定地回答:「是的。我將推動低成本、高效率製造,明年開始批量生產。」

Adcock回應成本問題Adcock回應成本問題

也有網民對Figure 02所謂的「世界上最先進的AI硬件」產生質疑,稱擎天柱在7個月以前就已經做到這些了。

網民評論網民評論

有網民認為Figure 02的營銷大於其真實進步:「這很酷,但靈活性顯然不足。你浪費了很多時間展示平移,而本可以給我展示更多手部操作——這才是真正的訣竅,不是嗎?它把零件衝壓到位了?這是進步,但不值得你所營造的那種大肆宣傳。」

網民評論網民評論

03.成立2年估值185億,初代機器人已進寶馬打工

Figure成立於2022年,其創始人Brett Adcock是一位連續創業者,其此前創立的兩家公司分別實現IPO和以1億美元被收購。

Figure致力於開發能夠在倉儲、零售、看護等不同環境中工作,並處理各種任務的通用人形機器人。

截至目前,Figure共完成5輪融資,融資總額達到8.54億美元(約合人民幣61.08億元),估值26億美元(約合人民幣185.88億元)。

Figure融資歷程Figure融資歷程

去年10月,Figure發佈第一款通用人形機器人Figure 01行走的影片,此時團隊剛剛成立一年多,擁有60名工程師。

Figure 01行走Figure 01行走

今年1月7日,Figure發佈了一則Figure 01煮咖啡的影片,並強調其使用端到端的AI系統,僅通過觀察人類煮咖啡,即可在10小時內完成訓練。

Figure 01煮咖啡Figure 01煮咖啡

1月18日,Figure宣佈與寶馬簽署商業協議,機器人Figure 01將進入寶馬工廠,在汽車製造過程中「自動執行困難、不安全且乏味的任務」。

2月,Figure獲得6.75億美元高額融資,一舉躍升獨角獸,投資方包括微軟、OpenAI、英偉達、英特爾、貝索斯等,涵蓋了時下生成式AI熱潮中的大模型、算力、投資公司等明星玩家,陣容十分亮眼。

Figure官宣融資Figure官宣融資

同時,Figure宣佈與OpenAI、微軟達成合作,將與OpenAI合作開發下一代人形機器人模型,將其多模態模型擴展到機器人的感知、推理和交互中,並利用微軟雲進行AI基礎設施構建、訓練。

半個月後,Figure於3月13日發佈了Figure 01在OpenAI大模型加持後的進展。

在2分半的影片中,Figure 01展示了如何描述自己眼前看到了什麼,判斷自己眼前看到的東西相互之間有什麼關聯,給饑餓的測試員找到桌子上唯一能吃的蘋果並精準遞過去,進行「回憶」並對自己做過的事情給出評價,用簡單易懂的話語口頭解釋自己做事的緣由等高難度動作。

7月,Figure發佈了一段影片,展示其機器人在寶馬工廠訓練的最新成果,其已經可以在生產車間上從事簡單的抓取工作。

不得不說,僅看Figure 02此次發佈的演示影片,我們並不能十分明確地感知到它相對於上一代實現的突破,也難怪不少網民感到失望。

04.結語:人形機器人賽道再添一把火

今年年初,人形機器人一度迎來爆髮式開局。從史丹福機器人大秀廚藝做大餐,到特斯拉擎天柱化身保姆疊衣服,再到兩家創企的機器人比賽煮咖啡。除了Figure之外,另一家機器人企業1X也獲得OpenAI等知名投資者的巨額投資支持。

半年多過去,人形機器人的熱度有所退卻,不過Figure 02的發佈又為這個賽道添了一把火。Figure 02在軟硬件諸多方面展現出了顯著的升級與突破,但由於演示影片的局限性,也面臨著網民的質疑與期待。

科技的進步從來不是一蹴而就,每一次的創新都伴隨著挑戰與爭議。後續Figure能否不斷優化Figure 02,交出更亮眼的答卷,特斯拉擎天柱等同類產品又能否實現新的突破,我們將持續關注。

本文來自微信公眾號「智東西」(ID:zhidxcom),作者:香草,編輯:心緣,36氪經授權發佈。