智平方合夥人張鵬:具身大模型驅動機器人進入通用智能

智平方合夥人張鵬。新京報記者 王子誠 攝智平方合夥人張鵬。新京報記者 王子誠 攝

新京報貝殼財經訊(記者羅亦丹)5月13日,由新京報貝殼財經、北京經濟技術開發區管委會主辦的「人形機器人」高端閉門研討會在北京亦莊·機器人大世界舉行。智平方合夥人張鵬在會上表示,最近舉行的機器人馬拉松比賽對整個行業提出了挑戰,在現實的挑戰中檢驗機器人的硬件、軟件、系統、算法是非常有必要且有好處的,「我們看到天工非常完美地跑完了半馬,這對整個產業鏈來說都是很振奮的消息。」

張鵬認為,當前真正需要去做的事情是讓機器人不斷地適應各種環境,讓它知道在不同的場景和任務里怎樣持續地學習和工作。

「目前大家談到VLA(視覺—語言—動作模型),說得通俗一點,就是機器人通過各種傳感器能夠與物理世界交互,它可以通過VLA模型,知道我在哪兒、周圍有什麼、我需要做什麼,再通過模型轉化成機器人的規劃和動作。這是現在整個學術界、產業界通過VLA要解決的問題。」張鵬說,「VLA的應用還面臨幾個挑戰,一是空間智能,二是全域全身控制,三是軟硬件的垂直整合。」

張鵬表示,智平方從成立開始,就致力於用大模型端到端的範式來打造機器人系統,率先突破了端到端VLA模型的核心難題——空間智能,並在行業中首次通過VLA實現機器人的全域感知與全身控制,使機器人既能理解常識,也能完成更多樣的具體任務。在具身機器人上,這種大規模的互聯網數據、仿真數據,以及在真實應用場景里採集回來的數據都很重要,所有數據彙聚在一起,才能完成在VLA在具身機器人上面的應用。而具身大模型驅動機器人進入通用智能。

「我們不指望機器人在今年和明年就進入用戶家中,但是我們可以從半結構化的場景開始,逐漸過渡到非結構化場景,這就是智平方在推動商業化過程中的路徑,先從工業服務、公共服務開始,再逐步過渡到家庭和康養,不斷深入應用。」張鵬說。

校對 柳寶慶 穆祥桐