中國00後耶魯博士生休學創業,開發了一款能洗衣服、做漢堡的人形機器人

文|王沁 

編輯|邱曉芬、蘇建勳

雖然常青藤學生休學創業的故事已經不是新鮮事,但這次,休學創業已經輪到00後了,還是位發過頂刊頂會、直博耶魯的中國學霸——AI大模型與具身智能賽場的火熱,已經頗有種「再不創業就老了」的緊迫感。

楊豐瑜Fred Yang,江蘇人,00後,全獎直博耶魯,是具身智能公司UniX AI(優理捷高技公司)的創始人,該公司開發了一款能洗衣服、做漢堡、洗盤子的家庭服務機器人。

楊豐瑜Fred Yang,人形機器人公司UniX AI創始人楊豐瑜Fred Yang,人形機器人公司UniX AI創始人

雖然說這麼年輕就創業,但休學創業對楊豐瑜並不是出於衝動。首先,他高中時就想創業,本科時就有一些「小打小鬧」的創業項目。其次,他稱自己發的論文數量已經足夠博士畢業了,休學並不是一個風險的決定。而且,他一直在積累創業資源,從本科時就開始在國內積累具身智能相關領域的學術界人脈,創業後在國內四處尋訪機器人業內資深人士組建團隊。

現在,他創辦的UniX AI公司邀請到了上海交通大學特聘教授、機器人頂會IROS2025大會總主席王賀升作為首席科學家。

雖然已經發過國際頂刊論文、獲得北美計算機協會傑出本高高學家稱號,但作為初回國內創業的年輕面孔,楊豐瑜Fred Yang最開始招人時也常常碰壁。最開始搭建團隊,邀請一些比自己年紀大二十歲的資深專家加入時,需要三顧茅廬,甚至一次聊超過8小時。

目前,UniX AI開發的輪式+雙臂人形機器人,作為家庭服務機器人,可以自動識別你亂扔在家裡各個角落的衣服,自動撿起並拿去洗衣機洗,還能在你吃完飯後給你收盤子、洗碗,還能清潔地板。

UniX AI機器人可以夾豆腐UniX AI機器人可以夾豆腐

對於家庭場景來說,機器人手部的操作能力很關鍵。UniX AI自研的三指夾爪,可以夾圓珠筆、夾豆腐。UniX AI稱,其首批100台人形機器人將於九月量產。

以下是《智能湧現》與具身智能公司UniX AI創始人楊豐瑜Fred Yang的對話。

智能湧現:對於人形機器人,目前業界並沒有統一的定義,不同的公司的技術路徑也不一樣,有些公司一開始就做雙足的人形機器人,有些公司做類人形,比如像你們公司的輪式+雙臂形式。你是怎麼看待不同的技術路徑?

楊豐瑜Fred Yang:這個市場足夠大,不同的公司紮根在不同場景。大家都是根據應用場景,反過來設計自己的機械結構與整體的軟件和硬件方案。現在階段,每一種技術方案都不難找到一種應用場景。我覺得沒有對與錯,大家都是從需求角度出發來考慮。

智能湧現:你們為什麼選擇用輪式+雙臂的構型?

楊豐瑜Fred Yang:首先說雙臂,在家庭場景,最重要的是手部的操作能力。家庭空間里很多東西的空間高度,都是為了人設計的。我們的仿生人形臂有7個自由度(可以理解為手臂有7個關節),可以做很多類人操作。

關於輪式,考慮到移動精度和安全性,我們首先選擇輪式進入家庭場景。大家還是根據不同的使用場景來反向設計自己的硬件方案。

UniX AI機器人的操作能力UniX AI機器人的操作能力

智能湧現:你們目前是硬件和軟件同時在做嗎?

楊豐瑜Fred Yang:我們的核心邏輯是從場景出發。硬件和軟件對我們來說同等重要。

智能湧現:一般做具身智能的公司,在大腦、小腦和硬件本體之間會有公司自己的側重點,你們會有自己的側重發力點嗎?

楊豐瑜Fred Yang:我們軟件硬件都做,但如果從大腦、小腦和硬件三個裡講側重點,我們更多偏重在硬件和小腦層面。

硬件是算法的基礎,軟硬件高度耦合,硬件要跟著場景走。舉個例子,在家庭場景中,我們自己設計的三指夾爪有兩個模式(三指模式和兩指模式),三指可以旋轉變成兩指,用來夾細小的圓珠筆,甚至夾豆腐等。

另外,現階段打牢小腦的基礎也很重要。對於大家都關注的「可泛化」問題,泛化的過程可分為三個階段:從單一任務的有限場景,到單一任務的開放場景,再到開放任務的開放場景。

(註:比如從只能在某一種家庭環境下做洗衣服這種單一任務,到能在不同空間環境的家庭環境下洗衣服,再到不同空間環境下做洗衣服、做飯、輔導孩子等多種任務)

現在行業內大家都還在從第一階段到第二階段努力,這個階段主要考驗的是小腦能力。如果到後面做開放場景(第三階段),本質上是在大腦層面做plan(任務規劃),但現在首要任務是在小腦層面打牢基礎,首先解決操作層面的東西。

UniX AI人形機器人抓取衣服UniX AI人形機器人抓取衣服

智能湧現:你的一個研究成果是觸覺多模態大模型 UniTouch,到底什麼是視觸覺、什麼是觸覺大模型?視觸覺對於推動人形機器人的技術有怎樣的意義?

楊豐瑜Fred Yang:觸覺在機器人操作體系里,甚至人的操作體系里,都非常重要。從人的角度來說,觸覺是最本能的感知模態,通過和物理世界真實交互獲得反饋。舉個小例子,從包里找鑰匙,一般來說,人是不會依靠視覺,主要依靠觸覺來完成。

從機器人的角度來說,受到機械結構和傳感器選型的限制,很多時候單獨依靠視覺是遠遠不夠的。打個比方,讓機器人抓瓶蓋,瓶蓋非常小,機械臂抓上去時,已經被機械臂本身遮擋了。

這個時候,只能依靠觸覺反饋來完成最後的抓取和驗證。這種情況在可形變物體操作上尤為突出。當接觸可形變物體時,物體形狀發生改變,視覺先驗能提供的信息就非常有限,必須依靠非常局部,但是高敏感度的觸覺信息來感知和完成任務。

同時,觸覺提供的其他信息,視覺沒法提供,比如力量。視覺可以提供機器人抓取位置,無法告知抓取力度。單純的力傳感器也有局限,比如捏碎一個杯子前,從力的角度講看不出任何變化,哪怕杯壁已經出現細微裂縫。但這時,觸覺傳感器能夠捕捉到細微裂縫,能夠判斷出接下來繼續操作是否會捏碎。

我之前發了一篇論文,做了全球第一個觸覺多模態大模型,把觸覺信息和視覺信息、其他語言模態信息交融在一起。每個模態都有自身的局限性,視覺也有自身的局限性,但是加入了觸覺信息後,每個模態之間能夠互補。

目前不少友商也在做觸覺,但他們還是集中在硬件層面,比如說觸覺傳感器。但UniX AI要面向家庭用戶,硬件必須有3-5年的壽命,現階段很多高精度的觸覺傳感器在壽命方面還沒有辦法滿足商用需求。

UniX AI機器人打開洗衣機UniX AI機器人打開洗衣機

智能湧現:你們首批100台人形機器人將從九月開始陸續量產,這個數字對於人形機器人廠商來說是比較大的,Unix AI是如何做到的?供應鏈如何管理?

楊豐瑜Fred Yang:量產主要集中在供應鏈方面。我們有從平治、海爾出來的一些供應鏈專家,他們有供應鏈方面的製造和成本把控的經驗。還有來自傳統機器人、消費電子、汽車行業、航空航天行業的一批富有量產經驗的供應鏈成員。

智能湧現:你是如何搭建團隊的?

楊豐瑜Fred Yang:機器人這個領域,不是只靠一個技術棧就能打通,需要硬件、軟件整體配合,也需要多元化的團隊背景。整個具身智能行業非常新,我們的算法團隊非常年輕,基本上是海內外做機器人或人工智能的博士、博士後。

硬件方面,我們目前先切入了家庭場景,安全性肯定是最重要的因素。我們團隊有來自家庭服務機器人的成員,來做不同家庭的複雜環境的避障任務,比如繞線、懸空障礙物等。具身智能相關的硬件,包括人形機器人的手臂、腿方面,我們也有能力過硬的科學家,作為硬件開發負責人。

智能湧現:你很年輕,是00後,這麼大的團隊需要很強的操盤能力,你是怎麼招人的?

楊豐瑜Fred Yang:最開始招人確實困難。我本科在密西根大學,博士在耶魯,在國外的具身智能圈子有知名度,所以我很快找到了國外一些做算法的朋友;但是機器人要做軟硬結合,回到國內,大家不熟悉我們,我也碰了很多壁。每一個重要成員加入之前,我都跟他們聊了非常久,對於人才來說,要有「三顧茅廬」的精神。

智能湧現:人形機器人落地其實不簡單,目前大部分都還處在賣給科研院所的階段,擴大規模其實挺難,你們說直接一步到位to c,而且是消費級,今年量產100台,這是怎麼做到的?

楊豐瑜Fred Yang:輪式人形機器人的量產沒有雙足人形機器人那麼難。現在大家對於人形機器人的定義其實有分歧。對於雙足人形機器人,我覺得還有一段路要走,還沒有完全ready推向市場,因為安全性上有一些問題還沒有解決。但在家庭里最重要的是手部的操作能力,所以我們第一代推出的是輪式+雙臂的機器人,輪式是比較成熟的技術。

產品的迭代速度很重要。第一代就做出精品有難度,我們先快速出一版比較穩定可靠的、性價比較高的機器人,大面積鋪向市場,再迅速反復迭代。我們內部一直講,三代出精品。

我們初期的100台主要是種子用戶,願意做「第一個吃螃蟹的人」。

UniX AI機器人擦桌子UniX AI機器人擦桌子

智能湧現:你們現在已經有TO C的客戶?是早期就有聯繫嗎?

楊豐瑜Fred Yang:一開始的個人用戶,主要是我們身邊的一些朋友、科技界的一些朋友,還有對前沿產品非常感興趣的科技發燒友,類似於特斯拉剛剛推出的時候,願意購買的目標人群,也是喜歡進行科技嚐鮮的階層。我們也會做一些focus  group(焦點小組訪談),瞭解目標群體的具體需求。

智能湧現:家庭場景下的通用人形機器人,相比於垂直場景下的機器人(如商業服務、倉儲物流、安防巡檢等)來說,落地要難很多,對機器人的泛化能力要求高很多。你們的資料說UniX AI 人形機器人同時具備洗衣服、用餐助理、清潔、輔導孩子功課等功能,落地情況如何?

楊豐瑜Fred Yang:人形機器人的終局,當然是希望機器人什麼事情都能幹,但飯要一口一口吃,事情要一件一件做。在家庭場景,也是一步一步(落地的),從單一任務的有限場景,到單一任務的開放場景,最後才到開放任務的開放場景。

我們產品目前已經有若幹成熟的場景點,比如洗衣服、餐後幫忙收盤子洗碗、3D清潔功能等。以洗衣服功能為例,你可以把衣服扔在各種不同的地方,機器人Wanda第一步會尋物,自主構建一張三維地圖;第二步是抓取衣服,Wanda擁有的UniX AI自研夾爪能夠通用地抓取柔性物體,第三步是使用洗衣機。

可泛化地使用洗衣機(對於不同種類的洗衣機,機器人都能操作)其實不難,我們可以調用不同的小模型來完成這個任務。

智能湧現:為什麼選擇回國創業?有沒有想過在美國創業?

楊豐瑜Fred Yang:我不把自己定義為回國創業或者在美國創業,我們在美國和中國都有團隊,只是大家利用不同的區位優勢。美國有頂尖的算法團隊,國內有結構、硬件方面的同伴,我們在深圳也有團隊,在上海也設立了研發中心,有很多同事在那裡工作。