波士頓動力機器人創始人：基於大語言模型的人形機器人任務能力相比人類有差距｜2024T-EDGE

12月6日-7日，2024 T-EDGE創新大會暨鈦媒體財經年會在北京市大興區舉辦。2024 T-EDGE創新大會暨鈦媒體財經年會以「ALL-in on Globalization ，ALL-in on AI」為主題，彙聚全球科技和商業領導者，共同探討人工智能對全球各行業的巨大影響，以及企業全球化增長新格局新趨勢。作為鈦媒體集團每年年終舉辦的科技和財經領域的頂級盛會，T-EDGE一直代表了鈦媒體在科技與經濟賽前分析性，以及推動國際創新交流上的高質量追求。

7日上午T-EDGE 全球AI論壇：All-in On AI會議上，人工智能研究所執行董事、波士頓動力機器人創始人Marc Raibert（馬克·雷伯特）以「The Future of Dynamic Intelligent Robots（動態智能機器人未來）」為主題，圍繞 AI、機器人和波士頓動力業務等相關話題進行演講。

雷伯特表示，AI 正在加速機器人技術發展，近兩年，中國、美國、歐洲都有非常多的相關的技術進展。在他看來，機器人未來有兩種「智力（智能）」：一是身體如何運作的動態智能，通過感官控制機器人本體，運動的時候保持正常的機能；二是認知智能，使用語言實現「腦中所想」。

「如今正是涉足機器人領域的絕佳時機，」然而，雷伯特也強調，相對於人類所做的任務，AI大語言模型（LLM）與人形機器人能做的任務之間，仍然會有非常大的差距。「因此，我真的很期待，縮小基於語言的認知智能，和我們動態智能之間的差距。」

據悉，今年75歲的雷伯特，是Boston Dynamics（波士頓動力機器人）創始人。在此之前，他曾任麻省理工學院計算機科學和電子工程系教授，以及卡內基·梅隆大學計算機科學和機器人學副教授。在卡內基·梅隆大學，雷伯特創立了一間研究動力機器人科學根據的實驗室，並研發出第一款能自己平衡的跳躍機器人。

雷伯特指出，目前最快的機器人由波士頓動力製造，每小時高達20英里，其正在開發三種機器人，有Spot機器人、Stretch倉儲機器人以及Atlas人形機器人。

「我們對機器人進行優化並使用強化學習，使其運行速度提高了約2.5倍。通過精準數據移植至機器人當中，速度提升到約為每秒5.3m。」雷伯特認為，開發機器人首先需要「平衡」，兩輪雙足的「倒退」、爬坡、扔到空中等動作非常關鍵，所以開發機器人硬件和軟件都是同等的重要，而AI能夠幫助它來檢測地形、障礙，能夠讓機器人來決定需要做出什麼樣的動作。

如今，雷伯特已成立人工智能研究所，使命是成為機器人技術領域的巴爾實驗室。「我想借此機會說，我對機器人技術的興奮主要不是因為出售它們賺了很多錢，而是要接受挑戰，讓這些機器人具有行為能力，智能開始達到人類的水平，就像攀登珠穆朗瑪峰一樣，會遇到很多挑戰。」雷伯特稱。

對於火熱的中國人形機器人發展，雷伯特是堅定的「懷疑派」。在他看來，雙足人形機器人需要以實用方式進行落地，這是發展之道。

「人形機器人中使用強化學習，讓機器人能夠更好的進行導航和控制，我也非常期待在這方面硬件上能有更多的進展。」雷伯特強調，我們需要用科學的方式來看待機器人融入現實世界。

以下是Marc Raibert在鈦媒體2024T-EDGE上的演講實錄，經鈦媒體AGI整理：

我非常高興來到這裏，感謝您們邀請我做這次演講。到目前為止，這是一次非常有趣的會議，我期待著今天聽到有關各種 AI Project 的信息。

我喜歡機器人。我是一個終生的機器人。如今正是涉足機器人領域的絕佳時機，世界各地正在發生很多事情，無論是中國、美國還是歐洲。正在進行的工作令人驚奇，我覺得這個領域已經取得了長足的進步。我們已經取得了很大的進步。我們還有一些進展。

我想到AI時，想到的是兩種智能：

一是身體如何運作的智能（動態智能），如何平衡自己。比如，我站在這裏保持身體直立，因為我的大腦在通過感官控制自己的身體。動力智能在幫助我來運動的時候保持正常的機能，如判斷其他人，周圍的物體如何運動，來決定自己如何運動。這是機器人技術的重要組成部分，也是人類和動物工作方式的重要組成部分。

但還有另一種智能，可能在座的大多數人都更瞭解，那就是認知智能。我們在頭腦中進行思考「腦中所想」，我們認為它是在我們的頭腦中使用語言。你們所有聽我講話的人都在利用你們的認知智能來理解我在說什麼。

今晚我要坐飛機。我製定了一個計劃，規定我必須離開的時間，以便及時到達機場辦理登機手續。我們使用我們的認知智能來製定這樣的計劃。

在今天的演講中，我將首先談論我們波士頓動力公司過去多年來所做的主要關注運動智力的工作。然後我會談談我剛剛成立的一個新組織，稱為人工智能研究所，該組織仍在研究運動智能，但將其與認知智能相結合，以便我們可以使機器人在現實世界中更智能，更容易交互，更實用。

當我開始時，我真的對動物能做的令人驚奇的事情很感興趣。看看這隻山羊的運動能力。它有它的一生，它在這裏服務，這隻獵豹正在為它的生命而奔跑，希望能得到一頓飯，並觀察獵豹身體中的所有能量、順從性和動態行為。它正在追趕的這隻瞪羚。

人類也有很強的運動能力。這是我2歲半的孫子，他也在展示著他自己的動力智能，他有自己的認知體系，在我的後院來做些運動，這令人驚喜。

我們可以看到，所有的動物以及人類能夠做到的所有的這些事情，在波士頓動力我們也希望能夠給機器人動力智能，這是幾年前，現在我們設計這樣有著動力智能、動力控制的機器人，它有平衡感，它能夠自我導航，它能夠在冰面上行動，而且不受到周圍的干擾。

在波士頓動力公司，我們在賦予機器人運動智能方面取得了一些進展。這是幾年前的事，現在已經快 20 年前了，我們開發了一種獨立的四足機器人，它具有動態控制功能，因此可以對其環境中的干擾做出反應。它具有平衡感和推進力。它可以做一些導航。在這裏，機器人在冰冷的表面上行走。它能夠捕捉到自己並平衡自己以應對幹擾。我們建造了一系列使用這些技術的機器人。所有這些影片都在 YouTube 上。我不知道你是否可以在這裏輕鬆訪問 YouTube，但我確信一定有。該機器人未被驅動。它實際上是在使用視覺系統跟蹤人類領袖，即使它在叢林中穿行。

你可能會問，為什麼我們對腿如此感興趣？在這種有6或8寸厚積雪的地形中，腿可以提供靈活性，但您仍然可以爬山。據我所知，這是有史以來最快的有腿機器人。它的時速幾乎達到 20 英里，並且控制過程中充滿了動力。開發控制系統來管理機器人移動時身體的所有能量，這對我們來說真的很令人興奮。現在，這就是波士頓動力公司的工作歷史。

但如今，該公司正在開發 3 種機器人：一種名為 Spot 的四足機器人，一種名為 Stretch 的倉庫機器人，以及一種名為 Atlas 的人形機器人。

我將向您介紹每個項目的一些最新情況。

這是石油鑽井平台上的現場機器人。世界各地大約有 2,000 台此類設備被用來在這樣的設施中進行工業檢查，而人工完成這些工作通常成本高昂且不方便。

首先，這種機器人能夠利用傳感器和腿在地形中上下樓，然後它可以對設備進行測量，以確定設備是否按照預期的方式工作或者是否需要注意，我相信您以前已經看過其中一些內容，所以我將跳過。正如我所說，大約有 2000 個現場機器人，主要分佈在美國和歐洲，但也有一些分佈在亞洲。我不知道中國是否有這樣的公司，但作為一個機器人專家，可能有一件令人驚奇的事情，現在有幾家公司以製造四足機器人為業務。

問題不在於我是否應該在設施中擁有一個有腿的機器人？而是我應該購買哪一個？哪一個擁有我想要的功能？（宇樹）機器人是一家中國公司的產品。Swiss-Mile是一家瑞士公司，儘管他們使用的是平台，但他們自己製造機器人，而其他兩個是美國四頭肌。

正如我所說，對於一名機器人專家來說，這是一個激動人心的時刻。這是一款專門設計用於從卡車上卸下箱子的機器人，全球每年處理大約1 萬億個箱子。那不是100萬，不是10億，而是1萬億。

這是一項艱苦的工作，夏天炎熱，冬天寒冷，大多數從事這項工作的人並不覺得這一切有多愉快。這個機器人有一個傳感系統、一個視覺系統，所以它可以看到盒子並決定下一步要選擇哪個進行處理。

該機器人正處於早期部署階段。它被用於世界各地的許多大型倉庫等。它正在投入生產，很快就會被更多人使用。

現在，波士頓動力公司的最新一個機器人是 Atlas。我想如果你對人工智能感興趣，你一定見過Atlas。

Atlas是一個液壓驅動的機器人，它配備了電池電源和計算功能，並且正在執行這些大型運動任務。最近我們開始開發真正先進的平衡能力，可以與人類的平衡能力相媲美。我還沒說這是平等的。我們已經非常接近能夠平衡了。

當然，如果你一直注意Atlas一直在和其他機器人一起跳舞，這是一件有趣的事情。我想我會借此機會說，我對機器人技術的興奮主要不是因為出售它們賺了很多錢，儘管我的一家公司正在出售它們並且我們已經賺了一些錢。這實際上是要接受挑戰，讓這些機器人具有行為能力，智能開始達到人類的水平，就像攀登珠穆朗瑪峰一樣，這是一個真正的挑戰。

這就是我參與其中的原因。我喜歡嘗試找出如何解決阻止這些機器人完成越來越多有趣任務的問題。舞蹈就是一個例子。最近，我們在讓 Atlas 機器人能夠完全自主地完成任務方面取得了很大進展。在這種情況下，機器人被告知要移動這些部件，因此它會發出指令。

但執行都是通過控制系統的交互來完成的，導航、傳感器等。它正在做兩隻手的操縱，所有這些任務對於在工業中使用這樣的機器人都很重要，儘管獲得控制和自主權一直是一個巨大的挑戰，這些任務類似於組裝汽車中使用的任務，它們被稱為「測序」（sequencing）。我們對 Atlas 在執行此類自主任務方面的成熟感到非常興奮。

就在最近，我們重新設計了 Atlas，使其成為全電動的，而之前的車型則採用液壓系統，這在某些方面非常先進且有趣。但出於實用目的，這個機器人有很多能力。這還沒有完全發揮作用，但我們已經開始讓機器人能夠自主地執行任務，對零件進行排序。它還沒有使用雙手操作。很快這就會發生。我們可以在工廠等地方使用它。

現在，這個機器人擁有了一種特殊的能力，它的一些關節可以一路走來走去。所以，我們只要想想舞蹈的可能性。一旦你讓這個機器人跳舞，我真的很期待。

現在，人形機器人的想法是一個複雜的想法，我認為人們對人形生物的含義缺乏理解。

事實上，我們的機器人有兩條胳膊和兩條腿，有時還領先，但這並不能真正讓它變得像人類一樣。一般來說，這些機器人不具備人類的智力。他們必須被告知很多關於他們在做什麼的信息。他們甚至不具備人類的身體能力。他們不具備使人類成為人類的所有其他東西，道德、野心，我們對家人的愛。

因此，也許在隨後的圓桌會議上，我們可以討論這到底意味著什麼，以及為什麼我們目前如此關注人形機器人？

現在，我有興趣為大家帶來的另一種機器人智能，是認知智能。

我三年前創辦了這個（人工智能研究所）組織。它已經存在了兩年了，在ChatGPT之前就構建了。確實，像大型語言模型和生成模型這樣的程序提供的認知智能將使機器人變得更加聰明。這些基於語言的模型可以做的事情與物理機器人的物理性和我們所做的任務之間仍然存在很大差距，我們用手操縱、導航等等。

我們認為，在這些以語言為基礎的模型和人形機器人能做的任務之間，或者人能做的任務之間，仍然會有非常大的差距，因此，我真的很期待，縮小基於語言的認知智能和我們已經領先的身體運動智能之間的差距。

我要告訴你我們兩年前成立的一個新研究所，人工智能研究所位於馬莎諸塞州劍橋市，緊鄰波士頓高科技區，靠近麻省理工學院和其他公司。我們的使命是成為機器人技術領域的巴爾實驗室。

這就是我們正在解決的問題類型。現在要得到一個機器人，要在工廠里完成一項任務，你必須有一整個房間充滿了非常熟練的程序員，非常努力地理解任務，對機器人進行編程，即使它是一個正在執行的自主機器人，我們也會想讓機器人像人類一樣工作。那就是帶他們觀察其他人，完成任務，理解他們所看到的。然後自己做。

這是在職培訓。今天，這仍然是科幻小說，但我們有一個小組正在努力縮小語言類型智能與執行此類任務所涉及的物理之間的差距，像這樣的任務或做理解做的事情的機會不一定要在工業活動中，它可以是家庭廚房，就像您的廚房一樣，孩子們可以通過觀看父母來學習如何做飯。

同時，我們還有另一個小組正在使用機器學習來嘗試推進人形和腿式機器人可以做的事情。他們已經取得了很大的進步。這就是波士頓動力的細胞機器人（robot that Boston dynamics cells）。我們對機器人的入門級別進行了特殊訪問，並使用強化學習，使其運行速度提高了約2.5倍。通過讓機器人使用大規模模擬來收集有關其行為的數據，然後將其移植到機器人，速度約為每秒 5.3 米。

我們一直在使用這些相同的技術來做一些其他奇怪的事情，比如讓機器人能夠三足行走。這意味著您可以騰出一條腿來進行操作。比如，在這裏，它使用一隻手臂和騰出的腿開始進行操作。

這是對單一人形機器人的模擬，我們開始使用強化學習來開發控制技術來完成許多不同類型的地形、導航和其他任務。我真的很期待看到它在機器人的硬件上發揮作用。

在這個例子中，這是一個非常強壯和熟練的人類可以做到的事情，但目前沒有人形機器人可以像它一樣完成這項運動任務，我真的很高興看到我們能做什麼。我們一直在將這些技術應用於波士頓動力機器人。我不會說它工作得很好。但它開始表現出有趣的表現。同樣，所有這些事情都是通過使用大規模模擬來完成的，在獲得足夠的數據來執行這樣的操作之前，可能需要進行 1600 萬次模擬。我們很快就會對此類任務進行模擬到真實的移植。

這是另一個項目，我們稱為「Ultra Mobile Vehicle」（類似於山地單車機器人）。現在人類可以使用單車，他們不僅使用單車本身，而且用他們的身體來投擲體重，然後拖著單車跟在他們後面。他們使用視覺系統能夠看到環境中的障礙物和障礙物，然後製定計劃利用這一點並獲得真正有趣的移動性。該影片展示了機器人中某些功能的逐步開發。我們一開始只是製造一個可以自我平衡的機器人。

我們告訴它機器人應該去的總體方向，但控制系統正在自我平衡。在這裏，我們使用學習技術能夠將東西備份起來，這在單車上是非常困難的，需要非凡的技巧。因此，看到這項技能開始超越人類是令人興奮的。然後我們開始考慮讓機器人能夠拋擲自身重量以使其越過障礙。所以我們增加了機械設計。

我應該說的一件事是，我們相信開發硬件和軟件同樣重要。這是該機器人的簡化版本。在地形上跳躍時，必鬚髮出轟鳴聲才能簡化它。

但就在過去幾週，我們已經擺脫了束縛，現在我們有了一個可以自平衡的東西，可以發揮它的重量。下一步將是為其配備視覺系統。它有一個非常基本的人工智能規劃系統，這樣它就可以處理地形中的物體和障礙物，製定計劃並做我之前向你展示的那種事情。

最後，我只想指出，我們還有一個小組，即道德和政策小組。很顯然，大家對機器人有很多感情。我不知道你們對機器人有什麼看法，還有關於工作保障、生產力、安全之類的問題。我們有一個小組研究這些問題，試圖瞭解機器人如何適應世界，人們對機器人的態度。我認為需要真正以科學的方式瞭解機器人，人們對此瞭解程度相對較少，這個小組的使命就是研究這些問題。

正如我所說，我熱愛機器人。到目前為止，這是一個偉大的領域，我真的很高興看到接下來會發生什麼。感謝大家的聆聽。

（本文正選於鈦媒體App，作者｜林誌佳，編輯｜胡潤峰）