對話冠軍天工CTO唐劍:具身智能的ChatGPT時刻還沒有到

4月19日,雨後的北京分外清涼,人形機器人半程馬拉松吸引眾多目光。當天10時11分左右,首個人形機器人半程馬拉松迎來首位撞線「選手」——天工Ultra,用時2小時40分42秒。

天工Ultra身高180cm,體重55kg,具備開源開放性和兼容擴展性,可以靈活擴展軟、硬件等功能模塊,已具備帶有視覺感知的泛化移動能力,能輕鬆應對溝壑、大高度差等複雜地形。

北京人形機器人創新中心首席技術官(CTO)唐劍。受訪者供圖北京人形機器人創新中心首席技術官(CTO)唐劍。受訪者供圖

天工Ultra由北京人形機器人創新中心研發。北京人形機器人創新中心首席技術官(CTO)唐劍談及天工奪冠表示,「天工整體表現是非常符合預期的,主要是指它的整體速度以及完成時間。也不用避諱,大家都看到天工中途有一次摔跤,那是因為電池失效,這也是偶爾會出現的故障」。

唐劍介紹,這次比賽主要是對機器人的硬件以及軟件的運動算法,或者說機器人的「小腦」 穩定性、可靠性的一次極限的測試。天工機器人的「小腦」也是國地共建具身智能機器人創新中心「慧思開物」平台的一部分,測試是一個長期的過程。

唐劍認為,目前具身智能的ChatGPT時刻還沒有到,需要對機器人模型的架構能力升級,進行顛覆式的升級。年中機器人自主導航將有突破,明年人形機器人馬拉松將不需要領跑員。希望人形機器人走入工業、商業、生活場景,能夠7X24小時不間斷穩定地工作。

4月19日,首個人形機器人半程馬拉松,天工Ultra首個衝線。新京報記者 李木易 攝4月19日,首個人形機器人半程馬拉松,天工Ultra首個衝線。新京報記者 李木易 攝

表現符合預期

新京報貝殼財經:本次天工Ultra的表現是否符合預期?

唐劍:天工整體表現還是非常不錯的,主要是指它的整體速度以及完成時間。大家看到天工中途有一次摔跤,那是因為電池沒電了,換電後很快便恢復了奔跑狀態。本次全程只用了同一台機器人便完成了整個半程馬拉松比賽。

新京報貝殼財經:電池更換次數能更少?

唐劍:我們特別希望一台機器人完成全程,電池換了三次,一塊電池大概能跑六七公里。我們對電池容量、電量的選擇斟酌再三,做了很多測試,現在用的是15安的電池,如果加大加倍,更換電次數會減少一倍,但會增加機器人的重量,可能影響速度以及步態。目前是平衡各方面因素最終做一個最優的選擇。

新京報貝殼財經:賽場上天工Ultra如何完成比賽?

唐劍:我們的機器人前面是有一位領跑者,這是無線跟隨技術,是一種半自主的,不用遙控器方式。領跑者是一位運動員,身上有UWB標籤,機器人身上有無線的發射器,負責發射無線信號並且回收,然後利用算法與領跑者保持相對固定的距離和角度,實現運動。然後後面兩個人員主要是起到保護作用。

新京報貝殼財經:為完成本次比賽做了哪些準備?

唐劍:天工在備賽過程中做了大量訓練和測試,還要去做極限測試,並針對各種複雜地形進行測試,以及還有跟隨算法的測試。

為了奪冠軟硬兼施

新京報貝殼財經:天工奪冠主要原因是什麼?優勢有哪些?

唐劍:在硬件方面,首先為天工的「本體」做了輕量化和低慣量的設計,儘量減重,同時把踝關節以及膝關節儘量往上提升,讓腿部的慣量比較低,腿部跑起來比較輕盈;其次,對一些關節模組的導熱設計做了優化,讓它能很快達到熱平衡,而不是讓關節的溫度持續上升,因為上升到一定溫度,這個關節會失效,這樣機器人會摔倒;第三,在腳底做了一些緩衝的設計,儘可能減少對關節膜、對腳底板以及關節模組的磨損。更重要的是,天工的腿比其他賽隊的機器人要長,跑得比較快。

在軟件方面,運控算法做了很多優化。一是要在步頻、步幅、步態上做非常平衡的最優選擇。二是奔跑的算法用了最先進的強化模擬學習。強化模擬學習是要模仿人類,試采人類運動員跑步的數據,讓它儘可能接近運動員。因為人類進化了千年,跑步跑得快一定是有它的道理,我們把採集到的人的數據導入到強化學習的架構中。

新京報貝殼財經:本次比賽展現了哪些技術優勢?

唐劍:這次比賽主要是對機器人的硬件以及軟件的運動算法,或者說機器人的「小腦」 穩定性、可靠性的一次極限的測試。天工機器人的「小腦」也是北京人形機器人創新中心「慧思開物」平台的一部分,測試是一個長期的過程。

今年3月12日,我們發佈「慧思開物」的平台,這是一個一腦多能、一腦多機的通用具身智能平台,這個軟件平台最主要功能是支持其他機器人應用開發商以及系統集成商基於該平台開發應用,平台上有非常強大的AI的能力。

AI的強化學習屬於實戰派,算法開始可能是個小白,放到實際環境中不斷試錯,起初可能會摔倒,跑得很慢,跌跌撞撞。然後它在訓練過程中不斷地試錯,越來越強。強化學習的最大優勢是泛化能力比較強。實戰派遇到什麼情況都可以應付。在奔跑過程中,可能會遇到轉彎、上坡、下坡以及坑窪地滑等等,都有比較好的應對。

具身智能的ChatGPT時刻還沒有到

新京報貝殼財經:機器人如何泛化?

唐劍:泛化能力與大模型的泛化能力有類似的地方,一是數據,但數據的增多也不一定能完全解決。現在大模型已經展現出比較強大的泛化能力了,但是機器人的操作和語言,與語言大模型不同。目前具身智能很大程度上照搬了語言大模型。機器人模型的結構和架構,可能也需要比較顛覆式的突破和進展,可能不只是數據的堆疊和積累。可以認為是目前具身智能的ChatGPT時刻還沒有到。

新京報貝殼財經:機器人對物理世界的認知還是有限?

唐劍:是的。泛化能力有兩方面,一是大腦的規劃能力,這有非常大的難點,要學習物理的規律。看到物品後需要大腦規劃如何操作,這個比較難,要比較強大的泛化能力。

還有手部操作也要比較強大的泛化能力,進入家庭生活場景,光照、桌子、窗簾等紋理都不一樣,如何操作是難點,比方杯子類型豐富多樣,是否有模型可無差別拿起杯子,可能不單單是數據的積累,可能需要對模型的架構能力升級,甚至是顛覆式的升級,這可能比較重要。

希望機器人能夠7X24小時不間斷穩定地工作

新京報貝殼財經:後續技術如何迭代?

唐劍:我們會非常關注產業化的落地,第一階段先開始在工業和泛工業場景做一些巡檢類及簡單的操作類的工作。第二階段會在商業的場景提供商業服務,完成打包、掃碼等相對比較複雜的操作。第三階段會走入生活和家庭,去扮演像保姆、管家等角色。

最終希望人形機器人走入工業、商業、生活場景,能夠7X24小時不間斷穩定地工作,這是參加這次比賽的重要目的,我們會持續迭代不斷提升。同時也有一系列的研發計劃,會去佔領具身智能技術製高點。

新京報貝殼財經:具體有哪些技術需要迭代?

唐劍:比如像這次馬拉松比賽,大家可能覺得自主導航是很成熟的技術,但也不盡然。自主導航在自動駕駛上是開發了非常多年,相對比較成熟。但人形機器人全身的關節很多,控制完全不是一個層次,控制複雜度是幾何級數的增長。

人形機器人的自主導航在產業界沒有比較標準的參考性設計,自動駕駛的算法也絕對不可能直接應用到機器人上。比如路徑規劃的算法,可能可以借鑒自動駕駛的算法,但機器人能非常完美遵循規劃軌跡其實極其難,這個是非常大的難點。我們目前正在攻關這個難點。

已小批量生產 很快會具備自主導航能力

新京報貝殼財經:這個機器人已經實現量產了嗎?

唐劍:我們會有天工2.0機器人很快實現小批量生產,並且開始逐步投入一些場景的應用。

新京報貝殼財經:2.0是Ultra版本嗎?

唐劍:不是的,Ultra版本是運動型的機器人,最明顯特徵腿比較長,主要是為提升運動性能。天工2.0也有不同的版本,有七軸機械臂帶五指靈巧手的,能更好支持上肢具身智能相關的操作。

新京報貝殼財經:明年是否還會參加機器人馬拉松?是否還需要領跑員與陪護員?

唐劍:我們很快會具備自主導航能力,現在已經在研發,很快就能展示出全自主的導航。這樣天工將不再需要人類引導參加馬拉松,明年的機器人馬拉松有望看到無人引導的天工在奔跑。

新京報貝殼財經記者 陳維城

編輯 徐倩

校對 王心