小鵬汽車展示AI實力:雲端大模型+知識蒸餾,解鎖自動駕駛的未來

小鵬來「交卷」了。

2024年,在1024科技日上,小鵬汽車副總裁、自動駕駛負責人李力耘博士表示,自動駕駛新一輪競爭正在雲端展開。

他認為從智駕競爭的終局來看,佈局雲端大模型才是制勝關鍵。而小鵬汽車早在預研端到端大模型的階段,就篤定要先構建一個強大的「雲端大模型」。

最近,小鵬拿出了他們最新的進展。4月14日技術分享會上,小鵬分享了其在AI大模型方面的最新進展,並正式提出了「世界基座模型」的概念 。

與部分同行側重於在車輛端直接應用VLA模型的發展路徑不同,小鵬汽車的策略是,首先在雲端訓練一個更大規模的基座模型,然後通過知識蒸餾的方法,將模型所學習到的駕駛能力傳遞到車輛端 。小鵬汽車方面認為,這種方法旨在突破車輛端計算資源對模型複雜度和性能的限制,從而提升自動駕駛系統的整體能力 。

「雲端基座模型」是小鵬汽車AI戰略中的一項關鍵技術,那麼,它具體指什麼?它將如何影響智駕的未來發展?

推出雲端基座模型

2024年,端到端大模型成為智能駕駛領域備受關注的技術方向。針對端到端模型的實現路徑,目前行業內主要有三種路徑:

  • 小模型堆疊:小鵬曾經考慮,在每一個模塊中都引入AI模型,再通過一些規則和算法,讓每個模塊的AI模型有機結合起來。「但這樣的方法仍然需要很多規則時代的工程師去定製接口,進行拚接和串聯。」李力耘說道。
  • 車端大模型:自下而上地在車端去構建網絡來解決問題的方法,但是眾所周知,車端算力是有限的,車端大模型也有著「見效快,但上限低」的缺點。
  • 雲端大模型這也是小鵬目前採用的方案。李力耘稱,只有突破硬件的限制,真正的探索能力的上限才是智駕的制勝關鍵——雲端大模型往往比車端模型有著幾十甚至百倍的參數可以去消耗。

當前,部分主流車企傾向於採用在車輛端部署大模型的技術路線。在很多場景下車端的端到端模型,確實已經能夠提供類似老司機一樣的體驗,但小鵬為什麼仍然要投入巨大的資源去做雲端的基座模型呢?

小鵬汽車認為,車輛端算力限制了模型的大小和可處理的數據量。為了探索自動駕駛能力的上限,需要突破車端芯片算力的限制,利用更大規模的模型和海量數據,以更簡潔有效的方式實現車輛的智能化。而云端大模型就是最好的選擇。

小鵬汽車的這一策略與特斯拉、OpenAI等AI領域企業的某些發展思路存在共通之處。據李力耘透露,過去一年,小鵬汽車的研發團隊已開發了參數量分別為20億、70億和720億的基座模型,並正在推進720億參數的世界基座模型的研發。這一參數規模顯著高於主流VLA模型。

受限於當前主流車端芯片的算力,車端模型的參數規模通常在1億到5億之間,而業界關注的VLA模型,其參數規模約為20億。這是因為自動駕駛模型需要綜合處理視覺信息、進行推理並輸出動作指令,因此是一個複雜的大型模型。

小鵬汽車的世界基座模型,其核心並不側重於語言大模型(LLM)本身,而更強調通過多模態傳感器數據的融合和對齊,使模型具備推理能力、思維能力和鏈式思維能力(CoT)。通過這種方式,模型能夠對複雜場景進行邏輯推理,並將推理結果轉化為對車輛的控制指令。

為了開發小鵬世界基座模型,小鵬汽車打造了一座「雲端模型工廠」,工廠「車間」涵蓋基座模型預訓練和後訓練(強化學習訓練)、模型蒸餾、車端模型預訓練到部署上車的完整生產鏈路。

小鵬汽車在雲端訓練大規模的基座模型,並採用後訓練的強化學習、模型蒸餾等技術,生成更大規模的車端模型,該模型被稱為XVLA,並部署到車端 。

簡而言之,小鵬汽車的策略是在雲端訓練一個大規模的預訓練模型,通過強化學習使其成為一個高性能的「教師」模型,然後通過知識蒸餾,將學習到的能力傳遞給車端的「學生」模型。

在人工智能領域,算力與數據和算法、模型同等重要。為了支持基座模型的研發,小鵬汽車已建成一個萬卡規模的智能計算集群,算力達到10 EFLOPS,集群運行效率保持在較高水平。

小鵬汽車世界基座模型負責人劉博士介紹,目前,用於訓練基座模型的影片數據量已達到2000萬clips,並計劃在今年內將數據量提升至2億clips。 每個clips可以理解成大約一分鐘的小電影。

智駕Scaling Law還有很大紅利

小鵬是Scaling Law的忠實信徒。雖然最近很多AI前沿工作說Scaling Law、預訓練遇到了瓶頸。但從算力、數據量來看,自動駕駛的Scaling Law還有很大紅利。

關於數據方面,儘管互聯網優質數據大概600-700T之後會出現瓶頸,但由於智能駕駛領域的大部分企業從2024年才逐步轉向端到端模型,因此,自動駕駛領域仍有大量高質量駕駛數據。

此外,無論是車輛端還是雲端的計算能力,以及模型的參數規模,預計都將持續增長,這為自動駕駛領域的規模法則提供了進一步發展的空間。

目前來看,小鵬已經取得回報。據瞭解,小鵬團隊首次驗證了規模法則在自動駕駛領域持續生效,小鵬世界基座模型負責人劉博士表示:「過去一年,我們做了大量實驗,在10億、30億、70億、720億參數的模型上都看到了明顯的規模法則效應:參數規模越大,模型的能力越強。同樣的模型大小,訓練數據量越大,模型的能力也會越強。」

同時,小鵬汽車已經進行了「基座大模型控車」的實車測試,並在後裝算力的車輛端,使用小尺寸基座模型實現了車輛控制。小鵬汽車方面表示,雖然這仍處於早期測試階段,但基座模型已經展現出了一定的駕駛能力 。

小鵬汽車的目標是在今年下半年推動L3級自動駕駛進入商業化初期,並計劃在2026年探索L4級自動駕駛 。

小鵬汽車在AI驅動自動駕駛的道路上,正以其獨特的「雲端大模型+知識蒸餾」的技術路線,邁入一個全新的發展階段。從對Scaling Law的堅持,到「雲端模型工廠」的構建,再到「世界基座模型」的發佈,小鵬汽車展現了其在AI技術領域的持續投入和賽前分析佈局。