他山科技創始人馬揚:觸覺傳感芯片是機器人必經之路
三位從未做過芯片的老兵,正在絞盡腦汁金塊觸覺傳感芯片。
作者丨吳華秀
編輯丨陳彩嫻
「我們都沒做過芯片,但我們覺得這事必須要做出來。」
2016年,第一波機器人浪潮翻湧而來,馬揚發現,觸覺傳感器是一片被忽視的藍海。
對機器人而言,觸覺傳感器能讓機器人像人一樣,通過觸覺感知物體形態、材質、壓力等信息。機器人一旦要執行具體任務,不可避免要與物體接觸,觸覺在此時起到重要作用。
既然觸覺傳感器如此重要,馬揚與另外兩位聯合創人孫滕諶和楊五強一合計,三人一同躬身入局,劍指當時鮮有人涉獵的人工智能觸覺傳感芯片。
然而,自研芯片並不簡單,更何況是一顆要放入機器人指尖的觸覺傳感芯片,這對芯片性能、體積都有嚴苛的要求。此外,馬揚三人此前並沒有做芯片的經驗,甚至都沒做過底層硬件。
顯然,這註定是條坎坷的道路。
自2017年末成立,到2022年初成功流片,他山科技整整用了四五年時間,歷經萬般險阻,終於做出首款人工智能觸覺傳感芯片。
這一芯片搭載了他山團隊基於R-SpiNNaker分佈式類腦架構下的AI觸覺傳感技術,得以在微小平面上探測多維空間觸感。此外,還能從採集到的混合信號中單獨提取特定變量,可分析處理不同的物理信號,打破了傳統觸覺傳感器的局限。
雖然產品研發上取得了突破,但過往五六年的艱辛也曾讓馬揚心灰意冷,甚至在第二波浪潮將臨之際,他也一度不相信機器人能真的起來。
直到去年,馬揚發現確實有了新變化,「整個機器人行業,無論是資本的湧入,還是研發的投入,都有了新高度。與此同時,國家對機器人的定位也不一樣了。」
新變量的攪動,讓馬揚重燃熱情與信心,又一次帶領團隊義無反顧投入進第二次機器人浪潮。
前不久,在世界機器人大會上,他山科技聯同多家機器人廠商,展示了靈巧手、機械臂和視觸融合等解決方案。
他山科技不僅在技術上持續創新突破,也在產業落地上頻頻佈局,堅持技術與市場雙輪驅動。
以機器人為終局的他山科技,重點部署觸覺傳感器、電子皮膚等領域。此外,秉持著兩條腿走路的態度,馬揚還將目光望向了汽車、家電、消費電子等多個場景,成功拿下了平治、寶馬等多家主機廠供應商資質,並與比亞迪在多個項目上達成量產。
如今,他山科技已推出了多款觸覺傳感芯片,並步入正軌,也有望在明年實現盈虧平衡。
一路披荊斬棘的他山科技,正在一步步越過山丘。上週,馬揚向AI科技評論細數了他山科技的發展,並圍繞觸覺傳感芯片解答了我們的困惑。
期間,馬揚雖然較少談及機器人信仰與情懷,更多討論的是實實在在的技術和路線。但談話中,我們能感受到馬揚對機器人發展的樂觀與嚮往。
以下是 AI 科技評論與馬揚的訪談實錄,作者進行了不改變原意的編輯整理:
1
「這事早晚都要做」
AI科技評論:為什麼取名作他山科技,有什麼含義嗎?
馬揚:剛成立時,我們與投資人談,說的第一件事就是先把硬件做出來。做芯片相當於將二氧化矽變成一個更值錢的東西,於是想到了詩經里「他山之石可以攻玉。」
他山不同的芯片也是用不同石首名字來命名,最早的芯片就叫紅寶石,叫Ruby;第二顆叫紅水晶;第三顆用在消費級上,相對用量更大一些、便宜點,我們就叫雨花石。
AI科技評論:是什麼契機讓你們決定進入觸覺傳感領域?
馬揚:2016、2017年正好是機器人行業前一波比較火的一個浪潮,我們看到波士頓動力做出了行走功能不錯的機器人,國內優必選、達闥也是最早的一波頭部公司。在我們看來,這些公司偏屬移動派,更多強調移動能力,能通過屏幕與人進行語音互動。
我們當時覺得,未來機器人更重要的事情肯定是對目標任務的執行,基於這一角度,觸覺能力就比較重要。實際上,在公司成立前10年左右的時間,我們在算法層面做了不少觸覺任務端的訓練,也取得了一些不錯的成績。
在那個時間點,我們發現如果要在機器人手端做執行,最大的壁壘是如何將芯片小型化,以便能放入指尖。當時市面上沒有任何一顆芯片能做到,我們也是一時衝動,想著要不我們就先把這顆芯片做出來,於是成立了他山科技。
AI科技評論:第一波浪潮里認為機器人在任務執行這塊會有發展潛力?
馬揚:2016、2017年那波機器人公司,很多做的是非商業化項目,主要是進行語音和視覺交互的輪式機器人。當時我們覺得機器人在任務執行上非常欠缺,如果真正讓機器人商業化落地,走進家庭,任務執行是必須要去做的事。
回頭看這幾年最好的兩個方向,一個是智能駕駛,將人從戶外空間 a 移動到 b,完成物理空間的執行;另一個是機器人,更多是幫助人類完成室內環境的移動任務。無論是洗碗炒菜,還是整理物品,這些都離不開觸覺、指尖的執行能力,這是我們當時比較篤定的一個方向。
AI科技評論:加入這波浪潮時,當時的挑戰是什麼?
馬揚:當時整個市場上,還沒有人很深刻地去思考機器人的執行問題,而我們主要從機器人的廣義層面來思考執行。廣義上的機器人,包括工廠里的機械臂,都是自動閉環。所謂自動閉環,舉個例子,工廠機械臂執行任務時,目標是針對固定物體進行移動,這一執行動作是明確的動作,因此大部分機械臂在實際操作時並不需要添加感知,只需設定好一個重覆性的動作即可。當然,有一部分可能會加一些視覺,比如當物體位置有所變化時,一個基礎的3D視覺能實現空間定位,然後機器人再執行下一步命令。
但這會存在一個實際問題,即執行的動作得是已經學習過的,或目標物體的各種特性很明確,甚至說目標物體必須是一個剛性物體,才能完成這樣的執行。我們當時和其他廠商溝通,發現大家想做的其實是泛化抓取,也就是執行泛化任務。那時候要是能把桌上不同的幾個物體抓起來,就很不錯了。
我們那波最早進入機器人產業的人其實都有點過於樂觀了,當時覺得真正走進家庭也就三五年,最多不超過 10 年,但現在也過去了七八年。回望那個時間點,其實還缺很多東西,尤其是用人工智能做學習時,機器人的一些硬件條件、基礎要求還很難達到。
AI科技評論:您提到第一波浪潮中缺了不少東西,具體是少了哪些?現在都補上來了嗎?
馬揚:那時候我感覺機器人離人還很遠,更多是做出一個像人形的機器人,能給人看就不錯了。就像一個工業品,最終實現需要三步,第一步是想出來,第二步是做出來,第三步是用起來。我感覺第一波浪潮更多是介於第一和第二階段的中間,很多東西都還是一個idea,在「想出來」和「做出來」中間還是差了很多東西。在當下這一時間點上,大部分是第二步過渡向第三步,大家已經在做小批量商用,這也是為何這波參與進來的人更多。
AI科技評論:所以當時是直接將目標瞄準向泛化執行?
馬揚:這是比較具體的一個目標,我們更大的目標就是為機器人提供可在邊緣段執行作業任務的觸覺能力。
AI科技評論:你們是只做芯片這一塊嗎?
馬揚:並不是。我們最早要做的事情,其實是機器人整個觸覺的解決方案。換言之,我們做的是整個皮膚端的解決能力,其中最主要的是指尖傳感器。
當時有一家美國公司指尖傳感器做的能力效果和技術指標還行,但國內售價高達2萬至3萬美金。所以我們當時定下了一個主要的任務目標——先把指尖傳感器做好。
2
觸覺既要強感知,也要重執行
AI科技評論:指尖傳感器的技術要求高,主要門檻在哪裡?
馬揚:對指尖傳感器而言,其核心需求是既要實現感知,又要實現抓取,這也是觸覺與其他感知不同之處。
在整個感知領域,視覺與聽覺這兩部分已經做得比較成熟,不僅與人的能力不相上下,甚至能超越人的能力。為什麼它們能比觸覺做得更快?因為對這部分感知來說,只是對客觀世界的一個圖像化,或是脈衝化的一個反應。再基於過往十年多人工智能的深度學習,我們已經擁有了一套成熟的算法,基於此,視覺與聽覺能達到並超越人的能力。
觸覺相對比較難的一點是除了感知外還要做執行,甚至可以說,更重要的是做執行。機器人要想完成一個執行的目標,首先要通過視覺的引導,「物體在哪裡?」;當接近物體時,此時感知轉移到觸覺上。觸碰物體時,要感知物體的材質、形狀、三維力,將物體整個拿起來作交接時,還需要感知物體內部重心的變化。整個過程中,觸覺端要完成從感知到執行的全閉環。
我舉個例子,比如拿起一杯水,如果杯子是柔性材質,那麼在抓取和拿起的過程中,杯子的重心和形狀會一直不斷地發生變化。當人做這一件事時,不同指尖在抓取姿勢和力度的控制上都相應會有所調整。這對於機器人也是如此,需要不斷進行調整和閉環。
AI科技評論:目前觸覺技術的發展情況如何?
馬揚:對觸覺而言,主要是兩個問題。
第一個問題,在前端上要有更快的反應速度。例如,六十赫茲頻率,對視覺而言已經算是高頻,對於人眼已經足夠。但對於觸覺端,六十赫茲或一百赫茲還遠遠不夠。要想達到人類的能力,基本上要達到毫秒級,即千赫茲。
此外,觸覺傳感器的數量更多。無論是觸覺還是聽覺,對機器人而言一個視覺或聽覺傳感器就夠了。但觸覺涉及到最後目標任務的執行,必然需要多個傳感器一起做,比如抓取一杯水,得要有五個傳感器在五個不同的指尖來協同完成。
每一個指尖傳感器,也是由多個傳感單元來協同完成。不同於視覺、聽覺只需一個芯片就可解決所有的數據問題,由於觸覺感知端可能是幾十個甚至上百個傳感器共同工作,其中所產生的數據僅靠一個芯片難以為繼,所以我們採用分佈式多芯片系統,以便在前端低延時、低功耗狀態下能實現快速邊緣處理。
這就好比,當我們摸了一個很燙的東西,手會本能地快速躲避。此時動作並不需過腦,完全是靠手部前端的解決能力和神經元,因此就需要在邊緣端實現從感知到執行的自主全閉環。
第二個問題,觸覺由於感知維度不同,涉及物體的材質、形狀、表面乾濕度、三維力、反向力、切向力的情況,且是分佈式傳感器,要解析多維的觸覺數據,就需要在算法端上從基本的感知結構上去解決問題。
這也是為何對機器人來講,視覺與聽覺已經達到了一定的商業化程度,而觸覺相對來說還比較慢的原因。
AI科技評論:指尖傳感器會產生大量數據,一般如何處理數據?
馬揚:數據的處理有兩點。數據在單個傳感器上完成時,我們會強調在單個芯片上快速從感知到執行全程數據處理的能力。第二,當我們執行抓取動作時,中間的快速反應需要在前端的硬件上完成,即邊緣端要有分佈式的數據處理能力。
2016、2017年以前,我們基本上也是基於深度學習或卷積的算法去做數據處理,採用的也是市面上主流的芯片。但是做下來後,我們發現整個體積和反應時間達不到應用端的需求,這也是我們自己要去做芯片的原因。
AI科技評論:相當於是在 SNN 結構這一塊找到了突破口?
馬揚:對,不過與其說是找到一個突破口,不如說是為 SNN 結構找到了一個比較好的應用方向。大家原來都會有一個疑惑,就是 SNN 結構很好,但要用在哪裡呢?我想,我們找到了一些答案。
AI科技評論:觸覺感知方案上為什麼會選擇電容感知這一方向?
馬揚:聯創孫滕諶與楊五強是77屆清華自動化系同學。孫滕諶發明了平面電容與曲面電容技術,楊五強在曼徹斯特大學任教時一直在研究電容測量技術。可以說,我們在電容技術這塊積累了非常強的know-how。
90年代末時,楊五強的一項技術 ECT 在工業端得到了廣泛的應用。我們將搭載電容的傳感單元裝在石油管道外側,可實時探測管道橫截面上油與水的成分,還能直接做出內部物體材質的成像。這說明,電容技術能很好識別物體材質。
這樣的應用放在10年前,在我們開始做抓取學習時非常有用。好比,抓一個塑料瓶還是抓一個玻璃瓶?用多大的力抓取?人抓取任何物體時的底層邏輯是,用儘可能小的壓力不讓物體在手中滑動。電容技術能在抓取過程中提供除視覺端外的觸覺信息,以便幫助我們在抓取端獲取信息。
我們後來又改進了傳感端的結構,採用多對的電容傳感器,再加以力的識別結構,可以很好地做三維力的學習。並且,我們在算法上可以把這兩層做一個很好的分級,既能解決前面部分,又能解決後面部分,讓兩部分數據不產生耦合,這其實非常有難度。
四五年前,包括現在都有很多選擇了電容這一路線的團隊。通過單一傳感器對多維觸覺數據做解耦,在這一塊我們可以說我們是做得最好的。
AI科技評論:目前市面上還有哪些路線方案?
馬揚:觸覺傳感器目前路線方案較多,我們看現在不同的路線都是可行的,其他路線包括視觸覺路線、電子霍爾路線,還有壓電壓感材料等。
在我們看來,機器人的不同部位對觸覺的需求不太一樣,採用的路線也會有所差異。比如,軀幹更多強調的是可替代化,對單點要有足夠的感知能力,整體成本要足夠低。像壓阻、壓電材料成本已經很低了,就很適合大面積佈置在機器人身體上。只不過對於機器人而言,電子皮膚得是點陣式,一個點壞了,能快速替換掉。
對於指尖傳感器而言,電容感知是業內普遍認可的一個方案。雖然也有其他方案路線,但在我們看來都有些不足。比如,有的只是一個中間方案,實際感知維度是達不到的;還有的可能更適合做展示、做POC、做樣件。從最終路線的實現來看,我們會認為電容是一個非常合適的解決方案。
AI科技評論:電容感知方案得到了行業認可,目前是主流方案嗎?
馬揚:從指尖傳感器對廠家的出貨量上看,我覺得已經是一個主流方案了。其次,近些年來,我們每年參加 IPRA 會議都會與業內人溝通交流,大家也會認為要實現人形,從目前幾種路線來看是最可行的一個方案。
AI科技評論:觸覺傳感器再進一步發展,要突破的關鍵點有哪些?
馬揚:第一個是在傳感端,整個傳感器的結構上大家並沒有走在同一個路線上,a有a的路線,b說b的路線,這就造成傳感器端在商業化上的速度相對來講是比較慢的。
今年,指尖傳感器我們已經可以做到1萬顆及以上的批量了,在行業里我們應該算多了。但我也很難篤定地說我們的穩定性已經非常好了。如果沒有一個幾十萬,甚至更多的批量,要說自己的穩定性非常好,可能都是一句比較空的話。
第二個問題是由第一個問題衍生出來的,大家現在在觸覺端缺少一個可執行的標準。大家可以用不同思路做感知,但是感知完後關於力的一些基礎數據,在解碼端可以用同一種方式做解碼和存儲,這有利於大家快速地做下一代產品迭代。因為不管是誰的數據,如果我們大家可以用起來,不過在短期內也不太好解決。
再往長遠看,後面還有一個小壁壘,我們現在還沒講觸覺與視覺相融合。從抓取執行的動作來看,視覺先做完再交給觸覺,觸覺執行完再還給視覺,不斷反復進行這一過程。人在這一過程中,是用模糊計算做視觸融合,在不同時間里的視觸佔比會有所變化,對此人是有自己非常精妙的一套機制,但對機器人而言這怎麼設定呢?這會是未來要思考的問題。
此外,我們比較強調先在手端做私有網絡訓練,然後再把手端數據給到腦端,由腦與手的數據相結合,再去做後面的訓練,以具備更好的水平。但目前怎麼做這種協調的訓練,也是比較難解決的一個問題。
3
未來是機器人的世界
AI科技評論:今年WRC展會上也看到了不少觸覺傳感器相關廠商,現在傳感器市場情況如何?
馬揚:這次展會上看到做手的廠商是最多的,不只是傳統靈巧手廠商,還有一些頭部機器人廠商也在做手,包括一些觸覺傳感器廠商也加入。
現在傳感器走到了一個節點上,主要是兩條路徑。一個是傳統行業里的傳感器,有電容屏、觸摸屏等應用,整個市場規模也比較大。另一個方向,就是從傳統材料切進整個人形機器人做觸覺感知,但大家對未來的瞄點不同,技術路徑不同,而這個市場還在慢慢起來,朝著更大的商用方向。目前現在做得出色的還相對較少,未來一兩年可能會有一次比較大的洗牌。
AI科技評論:您親曆了兩次機器人浪潮,您覺得這兩次浪潮的變化在哪裡?
馬揚:我覺得第一波其實相對要虛一點,而第二波明顯在落地上會更清晰一些。
第一波沒有很多商業化的東西。當時大家更多就是做出來一個樣子,主要也是為了展示技術能力,以更好融資來進行下一步。從我們的感受來看,第一波我們還在找方向,也沒有什麼競爭對手。其實,如果沒有競爭對手,就像走夜路一樣,走兩步就得檢查走得對不對。
我希望從第二波開始,這會是真正的一個趨勢,而不只是一個浪潮這樣。尤其是去年年底開始談論具身智能,具身智能也涵蓋不同的感知,其中觸覺得到了更多的重視。我們也看到了更多友商、合作夥伴的加入。這相當於是把我們要做的事情具象化了,商業化也變得更現實了。
AI科技評論:對於人形機器人的發展,您是樂觀的嗎?
馬揚:我還是很樂觀的。很多人在討論,人形落地還要多少年?我覺得這個事情並不是從 0 到 1 的一蹴而就,而是中間會有很多過渡階段。比如我們之前談論無人駕駛,雖然到現在也沒有實現純粹無人駕駛,但是智能駕駛在汽車應用上起到了越來越重要的作用, 商業化方面已經做得非常好了。
那麼機器人其實也是一樣的。我們作為消費者,其實現在還不需要一個能和人同等聰明的機器人——既能幫我做事,又能給我提供情緒價值,這是一個很遠的事情。
但是從發展路徑上看,首先在一些專用場合,比如物流、清潔、養老等都是比較落地的方向,需求顯著。而且,人對機器人的容忍度並不像我們想的那麼難以接受。好比智能駕駛汽車一開始也會有一些弱智表現,但只要能給人提供便利,人還是能包容汽車的一些小失誤。所以我們會覺得,機器人的市場實在是太大了,你只要能做出一些小小的進步,大家就能共同推動行業一步步發展。
看今年的情況,我覺得大家都很務實。現在大家都很少談雙足了,基本上都會認為可以先做一個輪式,先解決室內平地問題。我們也看到很多廠商已經可以把成本控制到一兩萬左右,在這基礎上我們能夠訓練出一些執行能力的話,我想在未來兩年裡應該很快會有落地。
AI科技評論:您對通用機器人的想像是什麼?
馬揚:我希望未來的通用機器人能擁有與人相類似的能力,不僅是物理空間的移動操作能力,也包括情感能力。
我為什麼會這麼想呢?我們在研究觸覺感知時,中間經常要觀察和學習人是如何感知的。人特別有意思,人獲取的信息是靠脈衝和神經元,這獲取的信息非常模糊,而且都是衝擊信號,沒有具體信號。具體信號只集中在有限的感知上,如視覺和聽覺,其他的都得要充分去調動大腦才能獲取一些信息。
現在機器人的信息獲取能力已經超過了人。在最終情感的實現上,人其實是通過不斷積累的神經元訓練所得,那麼機器人也可以通過不斷喂數據的方式獲得與人相類似的情感溝通能力。
現在機器人數據量已經足夠大,但它的維度還沒有像人這麼多,所以我們希望能夠在觸覺端解決更高維度的問題。我們下一步其實也在做多模態的前端訓練,我們希望把聽覺、視覺,甚至嗅覺的脈衝信號都加進去,在前端做更多的私有訓練。