地表最強人形機器人問世，擎天柱頭號勁敵，每天工作20小時，前代已進寶馬打工

智東西8月7日報導，昨晚，由微軟OpenAI英偉達英特爾聯手投資的明星機器人創企Figure，發佈了新一代機器人Figure 02，再次顛覆我們對人形機器人的想像。

升級後的Figure 02不僅外形更像人，還在OpenAI多模態大模型的加持下，實現了與人類語音對話；擁有16個自由度的第四代手部靈活度大幅提升，可以實現更精細的操作，而特斯拉的擎天柱二代手部自由度為11個。

與第一代相比，Figure 02從外觀設計、軟硬件性能，到內置AI模型都進行了徹底的升級，主要體現在以下方面：6個板載相機、電池容量增加50%以上、3倍推理速度、第四代手部、語音到語音交互、內置VLM（視覺語言模型）。

Figure 02

Figure成立於2022年，截至目前共完成5輪融資，總額8.54億美元（約合人民幣61.08億元），估值達到26億美元（約合人民幣185.88億元）。其投資方包括微軟、OpenAI、英偉達、英特爾、貝索斯等，涵蓋了時下生成式AI熱潮中的大模型、算力、投資公司等明星玩家，陣容十分亮眼。

今年2月，Figure宣佈與OpenAI達成合作，將在OpenAI大模型的支持下開發下一代人形機器人模型，將其多模態模型擴展到機器人的感知、推理和交互中。Figure 02的語音到語音交互功能，便是其基於OpenAI為其定製大模型的最新嘗試。

Figure 02在工廠中行走

Figure創始人兼CEO Brett Adcock稱，Figure 02的續航可支持每天完成約20小時的有效工作，這有助於其進入勞動力市場和家庭。值得一提的是，Figure的初代機器人Figure 01已經在寶馬工廠落地，在汽車製造過程中「自動執行困難、不安全且乏味的任務」。

從概念設計到落地，Figure 02僅用時18個月。Adcock還提到，團隊將推動低成本、高效率地製造，預計明年開始批量生產。

01.推理能力提升3倍，每天可工作20小時

從外形上看，Figure 02比第一代酷炫了許多，布線不再裸露在外，看起來更加完整，外骨骼為其增添了現代感和科技感。不得不說，Figure 02現在看起來更像特斯拉的擎天柱了。

Figure 01（左）、Figure 02（中）和擎天柱二代（右）外形對比

在Figure 01的基礎上，Figure對機器人的軟硬件進行了徹底的重新設計，覆蓋AI、計算機視覺、電池、電子設備、傳感器和執行器等關鍵技術。

Figure 02

Figure 02在6個方面取得突破，包括語音交互、攝像頭、手部、VLM（視覺語言模型）、電池、CPU/GPU。

具體來看，Figure 02通過定製AI模型驅動的板載馬克風和揚聲器，以語音到語音的方式直接與人類對話。

它的頭部、前軀幹和後軀幹共有6個板載RGB攝像頭，通過AI驅動的視覺系統感知和理解物理世界，並在內置VLM的支持下進行快速常識性視覺推理。

Figure 02的6個攝像頭

Figure 02採用Figure自研的第四代手，其具備16個自由度，且力量與人類等同。

Figure 02手部

Figure 02內置的電池容量為2.25 KWh，相比上一代增加了50%以上，據稱每天能夠完成約20小時的有效工作，這為人形機器人進入勞動力市場和家庭鋪平了道路。

Figure 02在寶馬工廠

模型推理方面，Figure 02板載的CPU/GPU提供比上一代高3倍的計算和推理能力，具備自我修正的學習能力。

Figure 02在寶馬工廠

在外骨骼的加持下，Figure 02的重量相比上一代有所減輕，但由於增加了電池、攝像頭、CPU/GPU等，淨重量增加到約70kg。

Figure 02的外骨骼細節

02.曆時18個月落地，預計明年開始量產

Figure創始人兼CEO Brett Adcock稱，Figure 02在2023年2月完成概念設計，從概唸到成品曆時18個月。

Adcock解讀了Figure 02在語音交互、布線等方面的技術原理。Figure 02的語音交互能力是基於OpenAI為其定製的大模型實現的。

語音到語音推理

在接收到語音後，模型首先將其轉換為文字，同時，板載的VLM（視覺語言模型）基於攝像頭捕捉到的圖像和語音理解進行常識推理，然後基於推理控制機器人的行為，同時將輸出文本轉換為語音輸出。

在布線方面，Figure 02採用集成電源和計算布線，並設計了定製的電線端子和連接器，從而隱藏電線，並實現更高的可靠性、更緊密的包裝。

基於板載CPU和GPU，Figure 02能夠運行最新的AI模型，其推理能力達到Figure 01的3倍，能夠完全自主執行現實世界中的任務。

Figure 02的CPU和GPU

對於Figure 02的進步，不少行業大佬和網民紛紛發來賀電。

英偉達高級研究經理兼具身智能實驗室負責人Jim Fan稱：「恭喜Brett！製作高自由度靈巧手的決定絕對是正確的。」

Jim Fan評論

有的網民已經迫不及待地想看Figure 02和馬斯克的擎天柱大戰2024了。

網民評論

有的網民則迫切地想購買一台幫自己洗碗。

網民評論

同時，也不乏有一些質疑的聲音出現。有網民問道：「他是否具備超級工廠的製造能力？他真的能在垂直整合方面做到精細到原子成本的程度嗎？」

Adcock很堅定地回答：「是的。我將推動低成本、高效率製造，明年開始批量生產。」

Adcock回應成本問題

也有網民對Figure 02所謂的「世界上最先進的AI硬件」產生質疑，稱擎天柱在7個月以前就已經做到這些了。

網民評論

有網民認為Figure 02的營銷大於其真實進步：「這很酷，但靈活性顯然不足。你浪費了很多時間展示平移，而本可以給我展示更多手部操作——這才是真正的訣竅，不是嗎？它把零件衝壓到位了？這是進步，但不值得你所營造的那種大肆宣傳。」

網民評論

03.成立2年估值185億，初代機器人已進寶馬打工

Figure成立於2022年，其創始人Brett Adcock是一位連續創業者，其此前創立的兩家公司分別實現IPO和以1億美元被收購。

Figure致力於開發能夠在倉儲、零售、看護等不同環境中工作，並處理各種任務的通用人形機器人。

截至目前，Figure共完成5輪融資，融資總額達到8.54億美元（約合人民幣61.08億元），估值26億美元（約合人民幣185.88億元）。

Figure融資歷程

去年10月，Figure發佈第一款通用人形機器人Figure 01行走的影片，此時團隊剛剛成立一年多，擁有60名工程師。

Figure 01行走

今年1月7日，Figure發佈了一則Figure 01煮咖啡的影片，並強調其使用端到端的AI系統，僅通過觀察人類煮咖啡，即可在10小時內完成訓練。

Figure 01煮咖啡

1月18日，Figure宣佈與寶馬簽署商業協議，機器人Figure 01將進入寶馬工廠，在汽車製造過程中「自動執行困難、不安全且乏味的任務」。

2月，Figure獲得6.75億美元高額融資，一舉躍升獨角獸，投資方包括微軟、OpenAI、英偉達、英特爾、貝索斯等，涵蓋了時下生成式AI熱潮中的大模型、算力、投資公司等明星玩家，陣容十分亮眼。

Figure官宣融資

同時，Figure宣佈與OpenAI、微軟達成合作，將與OpenAI合作開發下一代人形機器人模型，將其多模態模型擴展到機器人的感知、推理和交互中，並利用微軟雲進行AI基礎設施構建、訓練。

半個月後，Figure於3月13日發佈了Figure 01在OpenAI大模型加持後的進展。

在2分半的影片中，Figure 01展示了如何描述自己眼前看到了什麼，判斷自己眼前看到的東西相互之間有什麼關聯，給饑餓的測試員找到桌子上唯一能吃的蘋果並精準遞過去，進行「回憶」並對自己做過的事情給出評價，用簡單易懂的話語口頭解釋自己做事的緣由等高難度動作。

7月，Figure發佈了一段影片，展示其機器人在寶馬工廠訓練的最新成果，其已經可以在生產車間上從事簡單的抓取工作。

不得不說，僅看Figure 02此次發佈的演示影片，我們並不能十分明確地感知到它相對於上一代實現的突破，也難怪不少網民感到失望。

04.結語：人形機器人賽道再添一把火

今年年初，人形機器人一度迎來爆髮式開局。從史丹福機器人大秀廚藝做大餐，到特斯拉擎天柱化身保姆疊衣服，再到兩家創企的機器人比賽煮咖啡。除了Figure之外，另一家機器人企業1X也獲得OpenAI等知名投資者的巨額投資支持。

半年多過去，人形機器人的熱度有所退卻，不過Figure 02的發佈又為這個賽道添了一把火。Figure 02在軟硬件諸多方面展現出了顯著的升級與突破，但由於演示影片的局限性，也面臨著網民的質疑與期待。

科技的進步從來不是一蹴而就，每一次的創新都伴隨著挑戰與爭議。後續Figure能否不斷優化Figure 02，交出更亮眼的答卷，特斯拉擎天柱等同類產品又能否實現新的突破，我們將持續關注。

本文來自微信公眾號「智東西」（ID：zhidxcom），作者：香草，編輯：心緣，36氪經授權發佈。

你可能喜歡