揭秘|人形機器人「上崗」要過幾道關?

在2024世界機器人大會上,27款人形機器人進行了整機展示,數量創曆屆之最。記者在現場看到,幾乎每個人形機器人的展位都圍滿了觀眾。

除了與人外表相似之外,人形機器人在工業和商業等場景已有廣泛應用。人形機器人如何在不同場景中完成工作任務?人形機器人與人的互動如何實現?在上崗前,它們需要經過哪些「考試」?

上崗工作:基於模型的運動控制或通過模仿學習

2024世界機器人大會上,中國兵器裝備集團自動化研究所有限公司展出了D11智能人形機器人,這款機器人具備擬人的形態、移動能力和操作能力,今年7月進入一家3C智能製造企業產業園內的5G+工業互聯網生產線,承擔物料搬運、掃碼貼簽等工作。

D11智能人形機器人正在搬運物料。受訪者供圖D11智能人形機器人正在搬運物料。受訪者供圖

「以工業製造場景中常見的掃碼、貼標工序為例,人形機器人通過視覺對目標物進行識別,並反饋位置信息,控制機器人的手臂進行抓取、黏貼、掃瞄等一系列動作。」中國兵器裝備集團自動化研究所有限公司工程師張嘯甫表示,人形機器人有兩種方式完成這些操作,一種是基於模型的運動控制,另一種則是通過模仿學習進行訓練。

「基於模型的運動控制,需要設計一些程序讓機器人完成識別、抓取、放置等動作,屬於硬編碼,關鍵在於算法控制精度、環境感知精度等方面。」張嘯甫介紹,人形機器人通過這種方式完成任務的穩定可靠性較高,但在泛化性方面有所局限,即一旦工作場景和任務內容改變,就需要重新編碼設計,且面對較複雜的操作任務時,開發任務較繁重。

D11智能人形機器人正在掃碼貼簽。受訪者供圖D11智能人形機器人正在掃碼貼簽。受訪者供圖

模仿學習在跨任務推廣、複雜技能泛化方面優勢突出,但前期數據採集和穩定訓練難度較大,目前難以穩定、可靠地完成任務。模仿學習前期通過遙操作等方式,讓人形機器人在複雜場景下完成演示任務,並收集過程數據,「比如關節數據、圖像數據等,將這些信息積累成龐大的數據集,再用數據集進行訓練,讓機器人‘理解’如何在不同場景中完成操作任務。只要將這個模型訓練出來,人形機器人就能較快投入到對應的工作場景中。但是要實現高泛化性和高成功率,數據採集的成本目前非常高。」張嘯甫說,這兩種方式業內都在研發,「長遠來看,人形機器人執行複雜操作任務,模仿學習會是未來發展的趨勢,只是目前由於一些限制,無法完全把優勢發揮出來。」

與人交互:識別指令並調用大模型

在教育、文旅、商業等領域,人形機器人能和人打招呼,並針對特定領域進行交流。例如,大會上展出的青少年孿生人形機器人「躍遷」,有著孩童的外觀,可以在兒童的啟蒙教育階段提供有情緒價值的問答內容。EX仿生人形機器人中有一款外形是蘇軾的交互型仿生人形機器人,通過對古代文學、歷史知識、人物經歷的深度學習,能夠複現蘇軾的詩文和思想,可以在歷史文化景區和遊客互動。來自上海清芸機器人有限公司的「清寶」機器人,不僅可以快速根據問題給出答案,還能在接收指令後動嘴唱歌,並揮舞雙手做出舞蹈動作。

8月21日,小朋友和身著漢服的人形仿生機器人「蘇軾」打招呼。新京報記者 李木易 攝8月21日,小朋友和身著漢服的人形仿生機器人「蘇軾」打招呼。新京報記者 李木易 攝

上海清芸機器人有限公司副總裁張傑東告訴記者,對大模型的調用,是人形機器人實現與人交互的關鍵。在語音交互過程中,人形機器人接收人的語音指令,將其轉化成文本指令,再調用大模型中的文本指令實現語音輸出,達成與人對話的目的。交互中伴隨的表情和動作,也是相同的實現路徑。

「這個過程雖然有好幾個步驟,但我們人形機器人的反饋速度很快,大模型的調用通常能在1秒左右完成,如果網絡存在延遲,可能會是2秒左右,基本上和人在交流中的反饋速度相當。」張傑東表示,「大模型需要不斷修正和完善,我們的人機交互技術已經過三年迭代,達到業內優秀水平。」

崗前考試:重要部位逐項測試

人形機器人在「上崗」之前需要完成一系列「考試」,考試環節設計有核心零件、運動控制、適應性與可靠性、智能化、安全性能、通信性能等多個方面。

和人一樣,關節、手指等都是人形機器人身體的一部分,要讓機器人「健康」,每個部分的「考試」都得達標。

記者從北京具身智能機器人創新中心瞭解到,人形機器人一體化關節作為機器人運動系統的核心部件,其性能直接影響機器人的整體表現,包括動作精準度、靈活性、安全性及能效等,因此技術人員要對機器人的關節開展一系列測試,包括絕對定位精度、重覆定位精度、穩態誤差、振動等。

據介紹,當前技術下,人形機器人一體化關節的絕對定位精度普遍較高,一般而言,高端機器人關節的絕對定位精度可達到0.01°-0.1°,甚至部分頂尖產品能達到0.001°或更高的精度。這種高精度確保了人形機器人在執行精細操作時的準確性和可靠性。

在現有技術條件下,人形機器人一體化關節的重覆定位精度通常優於絕對定位精度,高端機型的重覆定位精度可達到0.005°以內。這意味著機器人在多次執行相同動作時,能夠保持極高的位置一致性,從而提高工作效率和產品質量。

隨著機器人產業的不斷髮展,機器人的「手」越來越靈活,測試人員對其的測試也十分嚴格,測試主要包括抓握力量、動作精度和靈活性。通過對這些指標的測試和優化,可以顯著提升人形機器人的任務執行能力、精度和適應性,擴展其應用領域和場景。

8月21日,「天工」人形機器人在和觀眾一起巡館。新京報記者 李木易 攝8月21日,「天工」人形機器人在和觀眾一起巡館。新京報記者 李木易 攝

「天工」是本次機器人大會的明星機器人,其引人矚目的能力是可以穩定小跑,同時具備爬坡等能力,讓它更像人類。在這些能力的背後,機器人需要完成一系列運動控制測試,比如行走、奔跑、攀越、跳躍、蹲起、轉彎、可通行性和腿部靈活性。人形機器人不僅要走得穩,還得走得巧,這就意味著機器人得學會轉彎。在機器人的轉彎能力測試中,包括了特定的轉彎類型,比如U形轉彎、三點轉彎和L形轉彎。

「上崗」前有了新「考場」

人形機器人崗前考試的「考場」既可以在研發機構,也可以在測評中心。國家機器人檢測與評定中心(總部)北京測評中心在本次機器人大會期間全新亮相,它同樣是人形機器人「上崗」前的「考場」之一。

該中心負責人柴熠介紹,北京測評中心智能化評價試驗室一期建成了智能感知、認知決策試驗室和交互試驗室。目前感知試驗室可依據相關標準要求,開展機器人視覺算法測試和視覺模擬測試。「視覺是機器人重要的感知方式。視覺算法測試是通過連接被測樣品,導入算法模型,依據被測樣品的應用場景,選擇對應測試數據集進行視覺算法測試,測試系統會自動輸出視覺算法智能等級測試結果。」

移動能力是不同應用場景中機器人最重要的認知決策能力。在認知決策試驗室,機器人將進行移動算法測試和移動實物測試。

交互能力對人形機器人或室外移動機器人都至關重要。在交互試驗室,人形機器人將開展交互能力的測試評價,包括上肢測試系統和下肢測試系統。柴熠介紹,上肢測試系統可測試人形機器人在與人類交互時的操作交互性能、力控性能及柔順性能等,通過一系列參數指標,評估人與人形機器人交互的安全性、柔順性和智能化。

新京報記者 葉紅梅 吳婷婷

編輯 白爽 校對 楊許麗