對話王田苗:具身智能發展期待出現機器人通用基礎大模型

具身智能近日引發了學界和產業界的討論。在2024中關村論壇年會「互聯網3.0:未來互聯網產業發展論壇」上,北航機器人研究所名譽所長、中關村智友研究院院長王田苗表示,具身智能時代來臨,機器人從過去以「硬核」為主,正加速向大腦與小腦「智能軟化」發展,期待通過機器人大模型研發,加快提高機器人智能化水平和對不同場景的適應性。

具身智能這一概念,最早是在1950年由圖靈提出的,然而真正引起廣泛重視卻是由於近年來AI大模型的發展與應用。王田苗認為,具身智能就是實現思考、感知、行動三個空間有機智能融合的機器或系統,既具有人機交互與自然語言理解的能力,同時又可以通過感知、認知、決策與時變環境及對象進行實時校準互動,協助人完成相應的決策與行動任務。

王田苗說,最近五年發生了很多跟具身智能相關的重大科技事件。大模型實現了語義邏輯推理,使機器人執行複雜任務成為可能;人形機器人的結構、電機驅動、視覺感知有了重大的突破,使其有望在製造業、商業、危險作業、家庭養老等領域發揮作用;同時,腦機接口技術通過對腦電信號進行編解碼,有望助力殘疾人實現對外部設備的控制。

北航機器人研究所名譽所長、中關村智友研究院院長王田苗。主辦方供圖北航機器人研究所名譽所長、中關村智友研究院院長王田苗。主辦方供圖

「這三件事都已經走到了具身智能的門口,正在敲擊著具身智能的大門。」他說,在未來智能時代的十年間,三大革命性的智能終端將分別是AR/VR頭顯、無人駕駛汽車及通用機器人。

他認為,大模型不應該只停留在對話上,應該通過機器人或者具身智能與物理世界結合起來。如果機器人能夠從語義和邏輯上深度理解搬運、傳動帶以及它們所運載的物品,就意味著機器人可能通過任務啟發,自動編程並執行。

在接受新京報記者採訪時,王田苗表示,在基礎研究方面,具身智能發展期待出現機器人通用基礎大模型。

新京報:2024年3月17日,OpenAI與人形機器人初創公司Figure合作推出了Figure 01機器人,其展示的理解、判斷、行動和自我評估能力引發關注。目前,全球和我國具身智能研發處於什麼階段?

王田苗:我個人覺得正處於一個夯實基礎和即將迎來落地爆發的時代,很多問題都在探索與突破之中。比如語言文本性模型中,隨著參數的持續增加,其語義邏輯推理能力也將相應提高。但目前還沒有出現這樣的機器人通用基礎大模型。另外,感知、決策、行動需要通過智能實體來實現,這也是目前全球正研究的問題。在應用場景上,具身智能將可能在物流分揀、醫療、農業、工業、養老等領域實現漸進式落地。

人們期待著利用大模型、腦機接口、通用機器人等加快具身智能在工業生產、危險作業和家庭中的應用。目前來看,我國的優勢有望在這三方面特別突出。一方面,我國生產機器人核心部件的性能、質量和供應鏈規模在全球佔有優勢。另外,具身智能的訓練需要大量的數據,我國有豐富且規模龐大的場景,有利於獲得更優質、海量、豐富的數據。

具身智能有大模型和小模型,在小模型的控制、平衡和算法上,我國和國外處於同一水平。但我們在有些地方也存在一些差距,比如從0到1的原創性仍有待提升,另外我們的大模型數據質量尚未達到理想水平。

新京報:要實現成熟的應用,AI和機器人方面,分別還有哪些關鍵技術需要突破?

王田苗:一是要在基礎研究方面,借助語言文本大模型探索和研究機器人的通用基礎大模型,如果這個問題解決了,實際上就解決了機器人的大腦問題。

「一腦多機」是指一個有豐富知識的模型能夠在若幹個機器人身上應用,這不僅減少了工程師的工作量,而且提高了任務完成效率。還有一個詞語叫「一腦多形」,即在不同環境下,一個特定的任務可以靈活地由不同類型的機器人執行,比如機械臂、輪式、足式、人形機器人都可以執行。未來隨著一系列基礎問題突破後,具身智能將有望在商務、工業和家庭的場景中得到廣泛應用。

同時,具身智能的涵蓋範圍廣泛,其中上遊的核心部件尤為關鍵,高密度、高扭矩、高爆發力、高動態性的核心部件,如新材料、人造皮膚、人工肌肉等。

另外,具身智能的發展一定要和場景任務來結合。一個通用的具身智能體比如人形機器人,它的成熟還非常漫長。所以首先要把任務場景確定下來,再結合小腦或者與特定大模型結合起來,解決勞動能力問題。最後,具身智能還涉及安全、電源電池、數據訓練等。

新京報:具身智能的發展未來是否會加速「機器人取代人類」?

王田苗:從我個人感覺可能會替代部分任務,但不會完全替代人類。首先會替代比較繁瑣、重覆、單調、危險的任務。因為從社會發展角度來理解,人是需要有工作的,所以具身智能應該作為人類的工具,去替代人類做不願意幹的工作,提高生產效率。

新京報:未來的應用前景如何?市場規模有多大?

王田苗:全球範圍都掀起了具身智能特別是人形機器人關鍵技術研發的浪潮,我國也正在加速形成有競爭優勢的供應鏈,未來隨著其成本下降50%,國外人形機器人有望從25萬美元/台下降到15萬美元/台,中國人形機器人有望率先降到30萬人民幣/台。

2035年,全球人形機器人出貨量有望達到70萬-300萬台套,並在救災搶險、特殊傳染病處置、汽車製造等場景下發揮重要作用。

新京報記者 張璐

編輯 陳靜 校對 李立軍