如祺出行跑進智駕深水區 「數據閉環」為技術迭代提供更優解

允中 發自 凹非寺

量子位 | 公眾號 QbitAI

隨著汽車進入「AI驅動」的時代,不止各大品牌新車拚智能,出行平台也在佈局面向智駕產業的「自動駕駛工具鏈」

這是今年在廣州車展中展示的一個特別現象。

上週舉行的廣州車展上,國內「Robotaxi第一股」如祺出行發佈了基於其自動駕駛運營優勢和自動駕駛數據解決方案構建的「數據閉環飛輪」。

其中包括了眾源地圖技術路線,4D標註工具及平台等方面的細節。

當大部分的出行平台還在路上「跑車」,如祺出行已經跑出了Robotaxi、跑進了自動駕駛的深水區——數據驅動。

這是國內第一次有出行公司對外發佈數據閉環解決方案。

為什麼一個出行公司,要去打造自動駕駛的「數據閉環」?

低成本、高質量數據是自動駕駛競爭核心

自動駕駛中的數據閉環,是指算法研發由case-driven轉向data-driven的核心步驟。

自動駕駛和數據閉環結合在一起成為一大解決方案,主要原因是自動駕駛的算法和模塊是數據驅動的——自動駕駛工程已經被認可是一個解決數據分佈「長尾問題」的任務,時而出現的corner case(極端情況)是對數據驅動的算法模型進行升級的根源之一。其次,源源不斷的數據需要有合理有效的方法去利用。

過去幾年,自動駕駛數據閉環已從過去「從無到有」,發展到現在及未來「從有到精」。

在全球,不少車企、自動駕駛技術及人工智能公司,在針對智駕解決方案時,都有針對數據閉環的設計。比如:

Tesla

下圖是Tesla的Autopilot數據引擎框架:確認模型誤差、數據標註和清洗、模型訓練和重新部署。

Waymo

相較於 Tesla,GoogleWaymo的數據閉環平台引入了數據挖掘、主動學習、自動標註等模塊,但基本的框架相差無幾。獲得數據來源後,通過數據標註獲得數據真值,其中涉及到數據篩選、挖掘和主動學習,模型優化完成測試後,進行發佈或部署。

英偉達

英偉達在自動駕駛開發建立的機器學習平台MAGLEV,是基於閉環的模型迭代:其中有smart的數據選擇、數據標註、模型搜索、訓練、評估、調試和部署。

如祺出行

如祺出行的數據閉環,則是「嵌入」在包括智駕流程內。基於出行服務運營的基礎,數據閉環覆蓋了智駕領域從數據採集、標註、存儲、管理到應用全流程,包括眾源地圖解決方案、4D標註工具等技術及解決方案,涉及環境感知、路線規劃、行為決策、控制等各個領域,是智駕技術工具鏈的核心環節。

行業內普遍認為,完備的閉環模型需要大規模、高質量、多場景的數據,高算力、高效率、相對低成本的算法模型,趨向自動化的數據標註與處理水平,高速率、低成本的傳輸速率與存儲模式,再加上合規性的要求,數據質量和規模直接影響到了車的智力水平。如何高效低成本的獲得高質量的數據集成為了自動駕駛企業的核心競爭力。

出行平台憑什麼做好「數據閉環」?

如祺出行正在切入的數據閉環,一個很重要的優勢在於其作為出行平台、基於運營優勢實現的「低成本及規模化數據」的優勢,以及未來對於合規數據應用的預期。

假如技術路徑及合規路徑都「跑通」,基於高質量及低成本規模化數據優勢,出行平台的自動駕駛數據解決方案將可能成為車企、自動駕駛技術公司的「必爭之地」。

2024廣州車展上,如祺出行CEO蔣華稱,出行平台切入數據閉環的重要優勢是基於其運營優勢實現的「低成本規模化數據」。

當全球自動駕駛技術公司發展挺過了上半場之後,發現在L4級自動駕駛商業化過程中,需要和車企合作,還要和出行服務平台合作。

當自動駕駛進入「端到端和大模型」時代,技術互補和生態合作正變得越發重要。通過比較地平線、如祺出行、文遠知行、黑芝麻智能等近期上市的智駕科技公司招股書可見,除了像特斯拉的「單打獨鬥」模式外,自動駕駛在國內有了車企、出行平台及技術公司的生態「加持」,其商業化落地進程在全球具備領先競爭力。

其中,在出行平台方面,滴滴市佔率為國內第一,如祺出行在大灣區用戶滲透率超過45%,它們都已有自動駕駛技術商業化落地場景及路測數據。更為重要的是,這些國內最早涉獵自動駕駛賽道的出行公司,已有了在Robotaxi商業化落地的經驗和成果。

Robotaxi是L4級別自動駕駛商業化落地的最好選擇。由於端到端大模型的上車,自動駕駛技術正從規則驅動轉向數據驅動。L4 Robotaxi離不開數據閉環能力,數據與算力將成為企業新的核心競爭力和壁壘。

對於自動駕駛企業來說,要想在各種競爭中嶄露頭角,當下最重要的是提升規模化水平。

一方面,提升運營車輛的數量,盡快實現規模經濟,有望早日實現盈虧平衡。車輛的採購成本、維修成本、運營管理成本等會隨著規模擴大而降低,這對於業務的可持續發展至關重要。另一方面,規模化也有利於提升服務質量。Robotaxi有賴於大量數據訓練,更多的車輛和更長的運營總時長,意味著更多的數據來源,有利於提高自動駕駛的智能化水平,並且優化調度算法,進一步提高運營效率。

以如祺出行為例。根據公開信息,截至2024年10月,如祺接入運營的Robotaxi已超過280輛,自營Robotaxi車隊規模超過50輛,服務已運營累計超過30000小時,覆蓋1800餘個站點,完成近900000公萊恩全運營里程。如祺也是目前Robotaxi唯一進駐南沙、前海、橫琴等三個粵港澳重大合作平台提供服務的出行平台。

在如祺這套自動駕駛數據解決方案中,眾源地圖技術將地圖更新的重心從傳統的中心化繪製方式轉移到了車輛感知的分佈式上傳,車輛在行駛過程中收集道路信息並上傳至雲端,在雲端完成地圖繪製,實現低成本、高實時性、輕量級、高度自動化。

同時,如祺眾源地圖技術還首次探索基於歷史預測結果的在線矢量地圖構建方案,能夠高效利用歷史信息解決遮擋問題,並提升檢測精度。該項研究成果已被全球計算機視覺及機器學習領域知名學術會議WACV 2025直接接收,具體包括首次使用歷史幀預測表徵進行時序建模、首次提出雙模式訓練策略、將訓練階段的輔助一對多匹配機制優化為group-wise版本等。

而在數據標註方面,如祺出行稱,已形成穩定、高效的生產能力,月標註產能在50萬幀以上,其4D標註解決方案則是在傳統3D靜態標註的基礎上增加了時間維度,通過雲端大模型實現路面要素高度自動化標註,擁有目標跟蹤標註、疊幀時序標註等一系列效率工具,較傳統靜態標註可以節省60%的人工標註成本。

相關分析指,全球Robotaxi服務有望在2026年左右實現商業化,中國預計將成為全球最大的Robotaxi服務市場,市場規模預計在2025年達到2億美元,2030年達到390億美元,約佔全球Robotaxi服務市場份額的一半以上。根據 《智能汽車行業專題報告》預測,自運營與聚合型模式或為Robotaxi中長期競爭力玩家。

誰在用這些出行平台的數據解決方案?

自動駕駛數據閉環驅動商業閉環已成為行業共識

但一個有趣的現像是,同樣是自動駕駛賽道上的科技公司,出行平台的「數據閉環」業務,對車企和自動駕駛技術公司來說似乎不是敵人,而是「朋友」。

翻閱如祺出行的主要股東結構發現,廣汽集團、滴滴自動駕駛、文遠知行、小馬智行等是其主要股東。

對車企來說,自動駕駛能力將重新構築車企競爭壁壘,數據和算力將成為核心競爭要素,頭部車企或供應商能掌握更多更優的「數據」,以及更強更快的「算力」,而優秀的智駕能力有望加強銷量轉化。同時在開展安全、高效的Robotaxi業務時,車企需要出行平台「協助」打造數據閉環工具鏈,打造能夠滿足端到端大模型的自動駕駛工具鏈。

2024年6月,廣汽集團成為全國首批獲準開展L3自動駕駛上路通行試點的車企之一,如祺出行作為該試點智能網聯汽車使用主體,也是全國首批獲準試點的出行科技平台。

小鵬汽車董事長何小鵬曾經提到,基於「端到端」大模型積累的原始數據,進而構建的閉環能力、體系能力,是真正決定一家車企能否在AI競爭淘汰賽中存活的關鍵。

此外行業內觀點普遍認為,從特斯拉的路徑看來,Robotaxi的推出將有望加強L4自動駕駛的商業變現能力,反哺自動駕駛技術路線實現規模化的路測數據。

Momenta CEO曹旭東此前在接受採訪時曾表示,L4 Robotaxi要實現10倍人類的安全性,要解決數百萬個長尾問題,依靠規則控制很難實現這個目標,一定要數據驅動,數據驅動是可以自動化地解決絕大部分的問題。

需要的數據量非常驚人,至少需要千億公里的數據,家用車乘用車一年的里程大概一萬公里,千億公里需要一千萬輛車跑一年的時間,才能夠達到千億公里的里程,而且這是實現規模化L4的必要條件。」曹旭東說。

關於未來在推進Robotaxi商業化路徑,市場預期行業將逐步形成由「車企+自動駕駛企業+運營商」形成的三方合作模式——

自動駕駛企業提供Robotaxi的軟硬件解決方案,OEM負責整車的量產,而運營商則提供服務場景、高質量數據服務

自動駕駛數據閉環方案將成為中國新能源汽車發展的標配,而孰優孰劣,市場銷量將給出最終的評判。

*本文系量子位獲授權刊載,觀點僅為作者所有。