「星動紀元」發佈端到端原生機器人大模型ERA-42，首個五指靈巧手、可完成百餘種任務｜最前線

作者｜黃楠

編輯｜袁斯來

硬氪獲悉，星動紀元近日發佈端到端原生機器人大模型ERA-42，其與自研的五指靈巧手星動XHAND1相結合，首次實現僅憑一個具身大模型，即可驅動五指靈巧手運用多種工具，完成超過100項複雜精細的操作任務；包括拿起螺釘並用鑽緊固、用錘子敲打釘子、扶正水杯並倒水等。

基於ERA-42，星動XHAND1能用不同工具完成多種靈巧操作新任務

在通用性和靈巧操作能力方面，ERA-42無需任何預編程技能，具備強泛化與自適應能力，基於少量數據收集，可在不到2小時即可學會新任務，並持續快速學習更多新技能。

基於ERA-42，星動XHAND1可完成100多種精細化、智能化的五指靈巧手操作任務

星動紀元指出，具身大模型作為開啟通用具身智能體的密鑰，需要具備以下三個要素。第一，統一一個模型泛化多種任務和環境；通過構建一個統一的原生模型，融合視覺、語言、觸覺和身體姿態等全模態信息，實現對不同任務和環境的泛化能力。

第二是端到端，從接收全模態數據，到生成最終輸出如決策、動作等，通過一個簡潔的神經網絡鏈路完成。該過程無需人為設計特徵、預編程或干預處理步驟，使得具身智能體能夠實時適應不同任務和環境，顯著提升靈活性與開發效率。

第三是Scaling up（規模化），允許模型通過持續的數據積累實現自我完善，使得具身大模型在數據量指數級增長的同時，不僅提升性能，還能在未知任務中展現卓越的自適應和泛化能力。例如Physical Intelligence （簡稱PI）發佈的π0模型就具備上述要素，是典型的真正意義上的端到端具身大模型。

基於端到端算法，星動紀元採用了大規模影片數據學習策略，涵蓋無標註的影片數據、公開各類形態機器人的數據、人類活動數據以及遙操作數據等，在上述數據使用基礎上學習行動結果，可有效降低數據收集成本。