人形機器人必須外觀像人嗎?它們有何優勢?專家解答

人形機器人擁有聰慧的「大腦」、敏捷的「小腦」、靈活的「肢體」,是通用人工智能的理想載體,蘊藏著巨大的市場空間和發展機遇。在今年的機器人博覽會上,共有27款人形機器人亮相,讓觀眾感覺離未來又近了一步。

人形機器人發展還面臨哪些挑戰?未來它們有哪些終極應用場景?對此,新京報記者採訪了北京郵電大學人工智能學院教授方斌,北京航空航天大學副教授、博士生導師陶永,北京具身智能機器人創新中心數據智能負責人李廣宇。

8月22日,2024世界機器人大會機器人博覽會,「天工」人形機器人被團團簇擁。新京報記者 李木易 攝8月22日,2024世界機器人大會機器人博覽會,「天工」人形機器人被團團簇擁。新京報記者 李木易 攝

問題1

人形機器人有何特點?它和具身智能的關係是什麼?

方斌表示,人形機器人在形態上仿人。一方面是移動能力,像人下肢一樣運動;另一方面是仿人手臂的靈巧操作能力。具身智能是機器人本體和人工智能結合形成的物理閉環系統。人形機器人是具身智能非常典型的應用。由於人工智能僅依靠數據和算力,所以迭代的速度比機器人本體更快一些。

陶永認為,更寬泛的人形機器人還有環境感知能力和人機交互能力。

李廣宇介紹,人形機器人相當於是具身智能機器人的一個典型應用示範。首先在技術上是高地,如果把人形機器人的技術問題都解決的話,可以向下兼容其他類型的機器人,比如把腿換成輪式底盤,這就是現在比較流行的輪臂機器人。

在通用性上,世界上大部分的設計都是以人為核心用戶,所以做人形機器人在細分場景的效率不一定最高,但泛化性和通用性是最好的。從倫理的角度來說,人形機器人更能和人產生情感的共鳴。

問題2

人形機器人「大腦」「小腦」的作用是什麼?

陶永介紹,人形機器人擁有聰慧的「大腦」、敏捷的「小腦」、靈活的「肢體」。「大腦」作為人形機器人控制系統的中心,承擔著類似於人類大腦的複雜認知和決策功能。基於通用大模型、數據集、高效計算架構、多模態融合感知等關鍵技術,「大腦」使人形機器人具備了學習與適應能力,使其能夠處理基本運算、圖像處理、視覺識別、決策規劃和智能決策。

「小腦」在人形機器人運動控制與協調方面發揮重要作用,是實現精確動作的保證。「小腦」由傳感器融合模塊、動力學模型和控製器等組成,製定運動策略,確保機器人動作的流暢性和穩定性。

問題3

近幾年,人形機器人的熱度為何這麼高?

陶永表示,特斯拉等公司研發的人形機器人向大眾展示了它的潛力,引起了關注。人形機器人搭建了一個通用的平台,可以將人工智能、大模型技術遷移到人形機器人上進行驗證,比如將汽車上基於視覺的環境識別、避障運動、路徑規劃的功能遷移到機器人上後,將發揮更大的優勢。

在相關領軍企業的推動下,人形機器人的技術正在加速迭代、快速研發,硬件成本不斷降低,有望更廣泛地出現在檢測、搬運等場景中。

李廣宇認為,這很大程度上歸功於大模型發展突飛猛進,特別是過去兩三年,從ChatGPT的發佈到最近多模態大模型的進展,都遠遠超出業界預期,已經走向公眾視野。但大模型畢竟是在軟件層面,和現實的物理世界缺少交互媒介,所以業界希望給通用的人工智能加一個身體,也就是具身智能。

另外,這也歸功於國內多年來產業鏈的發展,包括傳感器技術、電機技術等,使人形機器人研發門檻降低。同時,國家在政策引導方面對人形機器人產業給予了較大支持。

問題4

人形機器人和工業機器人等相比有何優勢?

陶永認為,人形機器人可以適應複雜地形,比如在電力巡檢過程中,輪式機器人邁不過去的台階,人形機器人可以上得去。另外,人形機器人上肢有更多自由度,可以實施精確操作。

李廣宇表示,工業機器人重覆定位精度非常高,但沒有泛化性,基本按照編程重覆進行。人形機器人既有移動能力,也有操作能力,其泛化性帶來了通用能力的預期,在物料分揀、上下貨等環節可以對工業機器人進行補位。

GALBOT G1人形機器人展示超市工作場景。新京報記者 李木易 攝GALBOT G1人形機器人展示超市工作場景。新京報記者 李木易 攝

問題5

發展人形機器人還有哪些技術需要突破?

人形機器人不僅使用了計算芯片、存儲芯片、控制芯片、觸覺傳感器,還應用了各類軟件、各類關節、伺服電機、人造皮膚等新材料。

方斌說,目前,經過人形機器人這波熱潮,小型化的電機、驅控一體化的關節相對成熟了不少。受限的在於關鍵的傳感器件,包括類似於人皮膚的觸覺傳感器,類似人手的靈巧手操作末端,和人類相比還欠缺很多。比如在手機裝配線上,工人可以熟練地進行精細的工業裝配,但人形機器人還完成不了這些任務。

陶永也表示,從硬件上來說,高能量密度小體積的關節、低成本的傳感器等仍需提升。軟件方面,要實現人形機器人在草地、沙地、崎嶇路面的穩定行走,目前有基於步態的虛擬仿真訓練平台進展較快,但仍然需要不斷完善。

他說,目前人形機器人價格偏高,未來,隨著硬件價格和軟件研發成本降低,應用場景日漸成熟,人形機器人有望批量化生產,價格下降。

李廣宇表示,「大腦」部分得益於大模型的發展,比「小腦」和「本體(肢體)」更成熟一點,主要負責人機交互和日常任務的規劃拆解。「小腦」負責具體執行,目前業內正在嘗試不同技術路線的方向,還需要一定的探索。

「本體(肢體)」包括上肢、下肢和傳感器三個方面。在上肢方面,多關節、多自由度的機械臂發展得相對成熟,但上肢末端靈巧手的精細操作需要快速迭代。通過近些年四足機器人的發展,下肢研發的進展比較快。傳感器方面,視覺傳感器比較成熟,末端的觸覺傳感器在不斷迭代當中。未來,人形機器人將走多模態傳感器融合的路線,所以不同種類的傳感器都需快速發展。

問題6

人形機器人要實現成熟應用還面臨哪些挑戰?

方斌說,人形機器人整體運動的敏捷性仍有所欠缺,在通用場景下執行任務的操作能力有待提升。人工智能和本體的系統集成能力還需要進一步發展。

要增加人形機器人運動的感知能力,通過深度強化學習增加抗干擾性,使人工智能算法和機器人本體的結構控制耦合得更緊密。

李廣宇表示,具身智能的數據比較稀缺,是製約產業發展的一個關鍵因素。目前,北京具身智能機器人創新中心正牽頭建設人形機器人世界上規模最大、信息最稠密、最通用的高質量具身智能數據集。為推動行業加快開展,創新中心還公佈了「百台天工計劃」,將向重點科研機構與高校提供超百台「天工」系列機器人,共同探索機器人在各種細分場景中如何更好落地。

小朋友和有陪伴功能的人形機器人對話。新京報記者 李木易 攝小朋友和有陪伴功能的人形機器人對話。新京報記者 李木易 攝

問題7

人形機器人的終極應用場景包括哪些?多久可以實現?

陶永認為,人形機器人正處於核心技術快速突破階段。在未來10年里,人形機器人有望在惡劣和特殊環境下,代替人類進行值守、巡邏和作業。同時,在關鍵技術突破的情況下,人形機器人可能在智能工廠進行巡檢、加工、檢測。另外,它們或將應用在教育中,在大學中成為實驗平台。在更遠的未來,人形機器人也有可能進入公共場所或者家庭,進行陪護。

方斌認為,人形機器人作為通用的具身智能本體,未來就像人類職業分工一樣,可以應用於不同場景,有的做醫生,有的當廚師,有的在生產線上做工人,有的做家政護理等。在家庭應用方面,由於老人、兒童對人形機器人的安全性要求更高,它有可能率先在中青年家庭中應用清潔打掃功能。

問題8

科幻片中非常逼真的仿生人形機器人何時才能實現?有哪些關鍵技術要突破?

陶永說,這一場景還比較遙遠,比如仿生機器人手眼協同能力還需要提升,做飯、疊衣服、裝配零件,這些日常操作對人來說很容易,但對機器人來說,涉及視覺、手臂末端觸覺力、運動控制協調等,都要仿人的智能化程度來實現,中間有很多關鍵技術需要突破。

比如仿生人形機器人的面部表情,如果做不好會給人帶來恐怖的感覺,電子皮膚也要像人類皮膚一樣有感知、交互功能,這些都需要一點點攻克。未來,仿生人形機器人有望在展覽、科普場館中率先使用。

新京報記者 張璐

編輯 白爽 校對 楊許麗