21 解讀|百億大模型浪潮背後:蔚小理的智駕組織哲學

大家都在瞄準端到端,用自己的方式奮力奔跑。

2023年,TeslaFSD(Full Self-Driving,全無人駕駛)迎來重磅更新。在V12版本中,Tesla成為率先在智能駕駛引入端到端架構的車企。 

Tesla掀起端到端風暴,小鵬、理想、蔚來等車企也在迅速跟進,端到端大模型成為新的技術風口。據中商產業研究院預測,2023年,中國大模型市場規模將達到147億元。

人人都想抓住機會。“當進入一個新的、以Tesla為引領的技術週期下,我們不能以傳統的時間去估算新技術產生的時間。”一位從業10餘年的智駕人士告訴21世紀經濟報導,“別覺得,誰花了多久,我們就得花多久。”

大模型衝刺下,高效的組織是驅動業務運轉的關鍵。

21世紀經濟報導獲悉,蔚來近期對智駕團隊進行了調整。蔚來單獨設立了一個大模型部,專門負責端到端的模型研發;還成立“架構與方案解決部”,總體負責車端的項目交付。總體來說,“核心業務變成了兩塊,一塊是雲,一塊是車。”一位接近蔚來的智駕人士總結。

在上述人士看來,新的智駕組織是一種“小步快跑”的方式,“研發快步往前走的同時,也能有常規的產品交付出來。”

去年年底,理想也為端到端模型單獨成立了一個團隊,放在“算法研發”團隊下,由賈鵬負責。近期理想也在圍繞端到端做封閉研發。

現在理想智能駕駛團隊主要分成兩個團隊——算法研發、量產研發。

算法研發除了要負責端到端模型的研發,也要負責三季度無圖城市NOA的量產。量產研發團隊,主要維護已有車型上搭載的智能駕駛功能,由王佳佳負責。

相較於蔚來、理想的整合思路,小鵬的智能駕駛組織設計部門最多、分工也最精細,與數據相關的部門至少有3個,包括大數據、時空數據、美國平台支撐數據等。

從目前人員設置上來看,小鵬在智能駕駛上的人員相對充足,達3000人的規模,是蔚來的2倍、理想的近4倍。

總體來說,蔚來選擇了“小步快跑”,理想選擇研發和量產兩條線並行,而小鵬則將組織劃分得更為精細。

為了贏得高階智駕的未來,大家都在瞄準端到端,用自己的方式奮力奔跑。

蔚來:研發快跑同時,產品也要交付

21世紀經濟報導從蔚來內部公告及多位信源處獲悉,近期,蔚來成立大模型部、部署架構與方案部、時空信息部,撤銷原來的感知部、規劃與控制部、環境信息部及方案交付部。

  •  大模型部門,主要負責端到端模型的研發工作,由原感知部門和規控部門下的模型部合併而來,負責人為彭超。
  •  部署架構與方案部門,主要負責和車端相關的整體算法研發、架構設計和功能交付,負責人為秦海龍。
  • 時空信息部門,則為原地圖定位部,主要負責車端和雲端的地圖信息相關的算法、模型開發及服務,負責人為袁弘淵。
  • 以上均直接向蔚來汽車副總裁任少卿彙報。

架構調整後,蔚來智駕的核心業務變成了兩塊,一塊是雲,一塊是車,分別由“大模型部”、“部署架構與方案部”負責。

蔚來認為車是一個交付品,但未來更大的算力主要發生在雲端。所以‘車’負責目前的交付,‘雲’則負責創造出一個本身更好的基礎模型,去支援未來車端的迭代。”一位接近蔚來的車企高管稱。

他表示,以前蔚來的風格更偏向用戶、產品導向,技術人員“等著輸入”;調整後,研發資源相對來說更集中,“整體上更加主動一些”。

“我們得找到一個適合自己的、小步快跑的方式”,上述人士總結道,在研發上快步往前走的同時,也能有常規的產品交付出來。

將部門打散、合併,最直觀的表現便是向任少卿彙報的人數變少了,各大部門內的人數變多了

一位知情人士告訴21世紀經濟報導,以前彙報給任少卿的人有“20個左右”,現在“減少了一半”。而他所在的部門經曆拆分、合併,成為“部署架構與方案部門”之後,部門總人數相較於原來“翻了一倍”

蔚來取消原來按照功能模塊劃分的方式,取而代之的是以項目進行劃分,“核心是為了產品化和交付”,一位蔚來高管稱。

調整前,蔚來智駕部門的設置類似於原來L4公司的組織架構,按照感知、地圖、數據、規控等模塊進行分部門管理,再以項目為核心去串聯起各個垂直的算法部門,進行交付。

在這種組織架構下,算法模塊部門是實體組織,項目則是橫向的虛線組織。

調整後,則是以項目為中心將涉及的各方都組合在一起。“相當於將原來的橫向組織進行縱向化”,一位熟悉蔚來的車企員工告訴21世紀經濟報導。

他解釋道,在變革組織架構前,分模塊管理的組織方式在融合上面“進展緩慢”。

以大模型部為例。

新成立的大模型部,主要由原來的感知部門和之前做規控算法模型的部門組成。原來感知和規控都是模塊化的狀態,感知模型中沒有規控模型的底層算法,“感知模型不知道如何將信息更好地上車”,而合併之後,能夠讓感知模型上車這件事提速。

將各個模塊的人以項目為核心組織到一起的好處便是做事的阻力更小了

以記憶泊車功能為例。

舉個例子,在原來的架構下,如果要做記憶泊車這個功能,需要橫向拉通多個算法部門,包括感知、規控、標定、測試等多個部門,對各部門的協作效率要求很高。而現在記憶泊車則作為“部署架構與方案部”下屬的三級部門存在。

“原來推進項目要從各個部門找人做事,阻力相對多一些,現在研發資源相對來說會更充裕一些,思想上、整體行動上會更加主動,合作效率也要更高。”一位車企智駕部門的高管稱。

以產品化、交付為核心合併組織,蔚來在進行一種新的組織實驗。在這種組織實驗下,原有的模塊概念在被模糊,取而代之的是項目概念

以前的架構下,感知、規控、地圖定位等是功能部門,有感知工程師、決策工程師等。但是新的架構下,這些稱呼都不存在了,取而代之的是項目稱呼,如泊車工程師、行車工程師、主動安全工程師。

“架構調整之後,立馬適應這種項目稱呼會很難,因為思想上有慣性。但大家在慢慢習慣。”蔚來員工稱。

理想:算法研發和量產研發,兩條腿並行

在感知決策一體化的自動駕駛模型UniAD得到學術界的認可之後,理想、蔚來都在同期開始探索大模型上車,招聘相關的人員。

21世紀經濟報導曾瞭解到,去年7月、8月蔚來一直在市場上尋找大模型負責人,想從公司整體層面把大模型做成一個中台,去賦能各個相關的智能化團隊,如智能座艙、智能駕駛等。

和蔚來思路不同,理想的想法是分開做——在具體的智能化環節上分別匹配大模型

2023年6月家庭科技日上,理想推出了座艙大模型Mind GPT。而至於將大模型應用於智能駕駛功能上,理想的思路是在感知、決策、規控、數據閉環等各個模塊應用大模型。當時並未直接成立大模型團隊。

去年8月,理想給智能駕駛各個環節招聘大模型相關的人才,“要求應聘者必須要有相關的大模型項目經驗。這樣的候選人很難找。”一位服務理想招聘工作的獵頭曾向21世紀經濟報導感歎道。

2個月之後的國慶節,理想一口氣在官方招聘平台放出了50個智能駕駛相關崗位,其中有5個崗位和大模型相關。在佈局大模型的同時,理想也在做基於高精地圖的“城高一體化”(城市NOA和高速NOA的無縫銜接)以及無圖版本城市NOA的量產落地。

2023年年底,理想對智能駕駛團隊進行了一次組織架構調整,在這次調整中,理想將大模型重新組成一個團隊,放在前端算法研發團隊之下,整體負責端到端架構的研發、上車。

調整前,理想智能駕駛的組織架構和蔚來類似,都是根據自動駕駛各個環節,如感知、決策、系統、規控、數據閉環、量產等模塊去進行人員架構的排布。

  • 感知團隊由當年5月加入、阿里雲背景的常黎(化名)負責,數據閉環團隊則由英偉達、IBM背景的賈鵬負責,量產研發則由博世背景的王佳佳負責。

而調整後,理想的智能駕駛團隊主要分成兩大塊:

  • 一塊是算法研發團隊,由賈鵬管理,主要負責前端算法的研發,包括無圖NOA研發、端到端模型的上車,原感知負責人常黎向賈鵬彙報;
  • 一塊則是量產研發團隊,依然由王佳佳負責,主要負責老款車型上基於高精地圖的高速NOA的維護,儘可能優化算法在落地過程中出現的問題。

今年5月,理想將無圖版本的城市NOA向千名用戶推送,6月推送了萬人內測版本。“進步很大,雖然有些極端場景(corner case)要進行處理,但已經很不錯了。”一位最近試駕了萬人內測版本的業內人士告訴21世紀經濟報導。

理想汽車CEO李想在6月初表示,會在今年三季度推無圖版的城市NOA,最晚會在明年年初推送端到端+VLM視覺模型+仿真模型(世界模型)的智能駕駛體系。據21世紀經濟報導獲悉,目前理想汽車正在做端到端架構的封閉開發。

要達成這樣的成績並不容易,畢竟理想自研智能駕駛的時間比蔚來、小鵬晚了3年。

“去年理想的智駕中台不如蔚來,今年開始慢慢趕上華為了。現在理想兩三個月就能做一次更新,感覺幾個月幹了別人好幾年的活。”一位前蔚來智能駕駛員工這樣感歎道。

小鵬:團隊3000人,分工精細

全球率先將“端到端智駕大模型”量產上車的是Tesla,而在國內,小鵬是首家量產上車端到端智駕大模型的車企。

投入早、投入重、組織架構較為穩定,是小鵬領先其他新勢力的“三大法寶”。2017年9月,小鵬便開始自研智能駕駛軟件算法,分別領先華為和理想1年8個月、3年5個月。小鵬2024年智能研發投入將在35億元,每年算力投入超過7億元,新招募人員4000人。

在蔚小理中,小鵬智駕的組織設計部門最多,分工最精細。

21世紀經濟報導從知情人士處獲悉,小鵬自動駕駛中心由10餘個部門組成,包括產品研發部、架構、元件、系統開發部、整車項目、測試、仿真、大數據、時空數據、人工智能組、項目質量管理等,覆蓋雲端算法、車端到工程落地,負責人是李力耘,團隊約由3000人組成。

“做得越精細,產出就越精細。”上述知情人士總結。

要想AI智駕汽車自主學習、模仿人類的駕駛經驗,離不開海量的數據投喂。在小鵬智駕團隊中,直接與數據相關的部門至少有3個,包括大數據、時空數據、美國平台支撐數據等,分工很精細。

在產出效果上,不同於完全一體化,小鵬的端到端大模型由神經網絡XNet(眼睛)、規控大模型XPlanner(小腦)和 AI大語言模型XBrain(大腦)三個部分構成,能夠提升智能駕駛的各項性能指標:

  • XNet 的感知距離提升2倍,能看清1.8個足球場面積,識別目標物50餘個;
  • XBrain 能認識待轉區、潮汐車道,還能讀路牌文字,推測交通參與者意圖;
  • XPlanner在複雜場景也越來越像老司機,頓挫、卡死、安全接管都減少將近50%。

“端到端智駕大模型體系下不是只有神經網絡,實際上目前也沒有任何一個玩家將整個體系完全AI化。”小鵬汽車CEO何小鵬解釋稱。

分工精細的另一面是橫向拉通成本高。小鵬智駕團隊的解決方法之一是成立專項。專項,就是把難解決的問題單拎出來,召集相關的產品、測試、研發人員組成小組,一起釐清主要矛盾,集中資源解決問題。

在北京開發無圖智駕系統時,小鵬的智駕團隊成立了幾十個專項,白天測試,晚上開技術討論會。第二天一早,研發人員會給出新的軟件版本,測試工程師繼續對軟件變更點進行複測,直到穩定。

端到端的優勢是能加速城區 NOA 等高階智能駕駛功能的落地。

今年1月,小鵬XNGP已落地243座城市,提前半年完成目標。5月,何小鵬進一步透露,到2024年第三季度,小鵬汽車的目標是“全國都能開,每條路都能開”,2025年實現城區智駕比肩高速的智駕體驗。

(21世紀經濟報導記者鄭植文對本文亦有貢獻。)