造手機的vivo,進軍機器人了

機器之心報導

作者:澤南

構建機器人的「眼睛」和「大腦」,vivo 其實早有準備。

下一場科技浪潮已經開始了。

剛過去不久的「AI 超級碗」英偉達 GTC 大會上,黃仁勳把「物理 AI」放在了 AI 發展的最高點上,引發了人們的又一輪討論。

老黃說,AI 的下一個發展方向就是機器人。

老黃說,AI 的下一個發展方向就是機器人。

所謂物理世界的 AI,就是在現在爆發的生成式 AI 的基礎上進一步升級,使其能夠理解物理世界的空間關係和交互行為,進而構建出新一代的機器人。

這樣的機器人能感知、會規劃,可以快速學習,具備此前無法想像的能力。最近一兩年 AI 技術的快速發展,正在讓設想逐漸成為現實。機器人技術的進展肉眼可見,比如最近,波士頓動力就和宇樹科技就較上了勁。

也有更加「接地氣」的機器人,比如 1X 就表示自己的雙足機器人一直在家庭環境中經歷測試,可以完成掃地、擦桌子之類的家務。

從這些公司發佈的 demo 上看,機器人的運動能力、功能性已經非常接近於實用化,未來似乎距離我們不遠了。

縱觀整個科技領域,投身機器人的創業公司正不斷湧現,科技公司也在紛紛加碼。不過在這個未來方向上,究竟是什麼樣的機器人會成為主流?它們會來自哪些公司?我們還看不出端倪。

最近,情況又有了新變化:手機大廠也要加入戰局。

目標家庭機器人,vivo 官宣入場

本週的博鼇亞洲論壇 2025 年年會現場,vivo 宣佈成立「vivo 機器人 Lab」 ,正式進軍機器人行業。

vivo 執行副總裁、首席運營官、vivo 中央研究院院長胡柏山在博鼇論壇上進行了演講。

vivo 執行副總裁、首席運營官、vivo 中央研究院院長胡柏山在博鼇論壇上進行了演講。

vivo 希望依託自身在 AI 大模型與影像領域的積累,疊加自研混合現實頭顯積累的實時空間計算能力,著重研究孵化機器人的「大腦」和「眼睛」,讓機器人可以「看得懂場景,聽得懂需求,給得了回應」。

目前正在博鼇論壇現場展示的「vivo 混合現實頭顯」 就是 vivo 機器視覺能力的一個階段性成果,在下個月即將發佈的 X200 Ultra 上,也會集成 vivo 在影像領域最新技術突破。

vivo 為自身製定的目標是聚焦消費級市場,打造面向個人和家庭場景的機器人產品,讓技術走出實驗室,走進用戶的真實生活,回歸場景,解決痛點。

vivo 執行副總裁胡柏山表示:「機器人是手機行業的未來,將成為聯接物理世界和數字世界的橋樑。不久前,我們成立了機器人 Lab,佈局機器人賽道。在新的發展階段,為聯接物理世界與數字世界,vivo 致力於創造極致的機器人產品。」

為實現這一願景,vivo 已經開始招攬人才,我們在公司的招聘網站上能看到機器人首席科學家的需求。

vivo 還在招聘高級技術規劃專家等機器人相關職位,招聘條件相當豐厚,開出的年薪達到了百萬。

從現在開始,vivo 預計要花費三到五年造出實現體驗閉環的原型機,隨後會在更遠的未來推出家庭機器人商用產品。未來,vivo 將與產業夥伴一道「讓機器人走進千家萬戶」。可以想像,機器人會應用在家庭服務、養老、醫療健康、教育等多個領域。

造機器人,手機大廠的獨特優勢

vivo 進軍機器人領域的戰略蓄力已久。雖然從造機到造看起來跨界很遠,但從更高的角度來看,這也可以說是順勢而為。

毫無疑問,這會是一次對前沿技術應用的重要探索,但並不意味著從零開始:智能手機其實已經是如今技術水平含量最高的消費級產品,如今 AI 技術的很多應用也是以手機作為載體。vivo 認為手機可以聯接 AI 與物理世界,正是生成式 AI 技術的發展方向。

依託手機業務積累的 AI 算法(藍心大模型)、影像空間感知技術(MR 視覺)及用戶需求洞察能力,vivo 已具備了機器人領域核心的「大腦 + 感知」技術。通過手機生態積累的規模化數據與應用場景經驗,這套能力可以快速適配新一代機器人的需求。 

博鼇論壇上,vivo 展示的混合現實頭顯。

博鼇論壇上,vivo 展示的混合現實頭顯。

與此同時,vivo 一直以來的思路是只做自己最擅長的部分,這就能夠充分發揮產業鏈夥伴的能力。

vivo 還具備「人無我有」的兩方面優勢:

眾所周知,vivo 長期深耕移動影像領域,構建了一套業內領先的視覺感知系統,可以構成機器人智能化的核心技術基礎

在鑽研手機影像能力的過程中,vivo 自研了 VCS 仿生光譜技術、微雲台防抖、超大底傳感器等光學硬件,可實現高精度的視覺捕捉能力,幫助機器人實現精準、高效的環境感知。結合夜景降噪、運動防抖(EIS)、HDR 等技術,其方案可以實現複雜環境下視覺信息的高效穩定處理。

與此同時,這套 AI 驅動的視覺感知還可以提升到實時視覺理解的程度。融合圖像識別算法與多模態大模型,vivo 可賦予機器人實時理解環境、人類意圖與任務指令的能力。

在此之上,基於已在手機數字影像以及開發混合現實頭顯過程中得到應用的 3D 視覺、SLAM 空間計算等技術,vivo 可以快速建立起機器人的空間感知與環境建模能力,實現精準的定位、導航和避障,並為 AI 模型構建出立體感知與空間交互能力。

基於自研影像芯片,vivo 還提供低功耗、高性能的視覺邊緣計算能力,可以幫助機器人降低雲端算力的依賴,提升自主運行、交互時的效率。

我們知道,因為設備端算力存在上限,未來機器人等 AI 應用的核心挑戰之一在於端雲結合以及數據的高效互通,vivo 作為手機廠商還有構建設備互聯的絕對優勢

在博鼇的展台上,vivo 展示了 6G 通信與感知一體化 + 數據面技術原型機。利用通信系統在傳輸用戶數據的同時,它可以實現對物體感知的能力,覆蓋健康監控、低空經濟、障礙物感知等場景。同時,帶有隱私和安全屬性的數據可利用數據面技術在通信網絡內部安全傳輸。

vivo 還應用 AI 技術解決了信道多變帶來的應用體驗下降的問題,並預告了下一代旗艦手機將會接入全球標準的衛星通信技術。

根據國際標準化組織目前的規劃,6G 大概會在 2028 年完成標準製定,2030 年前後實現全球商用。一系列新能力和場景將會被很快引入,包括通信與感知的一體化、算力與 AI 的端側 + 雲端集成,機器人等智能設備勢必將會變得更加聰明、更加小型化。

綜上所述,vivo 應用在手機等設備端的一系列技術,將會成為其投身機器人領域的優勢。

把目光再放到更遠,從產業上下遊的角度看,vivo 已背靠一套高度整合的產業鏈。手機產業覆蓋了芯片、屏幕、精密製造等核心環節,規模化的生產一直在推動上下遊技術迭代。在投身機器人領域之後,vivo 這樣的大廠也能充分與產業鏈合作,在做好 AI 能力、感知技術的同時,專注於用戶場景。

正如胡柏山所言,科技公司的責任是通過科學技術和創新能力,不斷解決未來的社會問題。此次發佈官宣專注於「家庭機器人」,證明了 vivo 在新的賽道上仍然會著力於解決用戶實際需求。這是 vivo 一直在踐行的道路,並且已在過去不斷被證明是對的。

在新一代機器人的開發過程中,數據和訓練是人們面臨的重要挑戰。當 vivo 入局機器人之後,其覆蓋全球,數量已達到 5 億的智能設備用戶將為機器人場景落地提供試驗場。

這或許會成為機器人領域格局發生變化的開始。

機器人領域,正在重估

物理 AI 的爆火,讓我們不得開始重估機器人領域。

根據中國信通院發佈的《人形機器人產業發展研究報告(2024 年)》估計,到 2028 年我國機器人整機市場規模約在 20 至 50 億元,2035 年規模會達到約 500 億元,到 2045 年後,在用人形機器人將超過 1 億台,整機市場規模可達到約 10 萬億元級別。

英偉達 CEO 黃仁勳此前也曾表示,到 2030 年全球至少將會出現 5000 萬勞動力的短缺,機器人將會是一個價值 10 萬億美元的產業。 

在這其中,消費級機器人無疑將佔據很大比例。vivo 的入局,勢必將再次掀起機器人賽道更為激烈的競爭。

我們可以期待,實用化的消費級機器人會很快浮出水面。