21對話|商湯絕影CEO王曉剛:端到端的決戰,戰場在雲端
21世紀經濟報導記者 鄭植文 上海報導
11月27日,商湯科技旗下的智能汽車平台商湯絕影舉辦2024“絕影實力AI DAY”,當日商湯絕影全面展示了「駕-艙-雲」三位一體的通用人工智能(AGI)產品體系與戰略佈局,還宣佈牽手奇瑞大卓智能、東風汽車展開全方位深度戰略合作。
自從Tesla在北美推送FSD V12版本後,點燃了大多數中國車企和智駕供應商對端到端大模型的熱情。在AI DAY上,商湯絕影也展示了基於J6E、J6M、Orin等不同算力平台打造的全場景高階智駕、端到端智駕等絕影量產智駕產品體系。據悉,基於J6平台的智駕方案預計2025年第二季度將量產交付,而量產端到端智駕方案則預計會在明年年底量產落地。
端到端智駕技術為行業帶來了範式革新,逐漸取代模塊化的規則,成為智駕技術的進化方向。但隨之而來的是對高質量數據的需求呈指數級的增長,而高質量數據的關鍵在於真實。受限於高階智駕的量產規模、算力資源,目前大多數車企和智駕公司都面臨相同的問題,即高質量駕駛數據的獲取難度大、效率低、成本高。
“智駕高端局的競爭不只是車端模型的比拚,端到端的決戰,戰場在雲端。”商湯絕影CEO、商湯科技聯合創始人、首席科學家王曉剛表示,隨著端到端時代的到來,數據成為最核心的競爭力,“誰離數據最近,誰的數據基礎設施最強,誰能把這些數據基礎設施鋪到主機廠,誰在未來發展和競爭當中就有主動權。”
為此,商湯絕影發佈「開悟」世界模型,能夠理解真實世界的物理規則、交通規則,生成的視頻數據也更加逼真。通過多模態大模型,「開悟」世界模型可以支援多樣化的自動駕駛場景及Corner case(極端情況)的可控生成。目前商湯絕影基於1024類場景,能夠泛化出更多的平行世界,打造了千萬級的生成場景庫,預計2025年對行業開放。
世界模型最基礎也是最核心的能力是生成高質量視頻數據,因此也成為車企占領智駕高地的新風向。今年7月,蔚來在科技日活動上也宣佈蔚來世界模型(NWM)正式發佈,它能夠在100毫秒內推演出216種可能發生的場景,並尋找到最優決策。
但在王曉剛看來,選擇全棧自研路線的主機廠可能難以承受基礎設施的持續投入,“像大模型,商湯在這方面累計投入超過100個億,後面還會持續在這方面投入。所以說大家要找到自己的定位,形成比較有效的合作,而不是惡性競爭和取代的關係,這樣的話才能夠達到共贏共生,長久持續的發展。”
然而All in大模型的商湯科技也面臨著巨額虧損,2018年至2023年,商湯科技的淨虧損分別為34.28億元、49.63億元、121.6億元、171.4億元、60.45億元和64.4億元,而以智駕為重點業務的商湯絕影仍然是需要長期燒錢的板塊,2024年上半年,絕影智能汽車業務收入為1.68億元,同比增長100.4%,但目前商湯絕影量產上車的情況要稍顯落後於其他頭部Tier 1。
對於盈利預期和合作規劃,王曉剛表示,未來自動駕駛實現盈虧平衡還需要有三年左右的時間,這取決於自動駕駛的量,要有足夠多的量,百萬級的量去支撐業務的發展。“另外,比較重要的是合作的模式,能夠以更高性價比的方式去完成交付,實際上還包括新技術和新產品的開發。”
當日,王曉剛就大模型對智駕技術的變革、行業競爭與生態等問題接受了21世紀經濟報導在內的媒體採訪,以下是採訪實錄(經摘編):
數據決定主動權
Q:去年智駕圈子裡面傳出頭部四家“地大華魔”這樣的說法,這個格局形成背後的深層次原因是什麼?商湯絕影在智駕供應商行業里給自己的定位是什麼?
王曉剛:過去自動駕駛交付模式還是標準化的交付模式,“地大華魔”有各自的優勢和特點,只能說今天當端到端到來的時候,最大的價值就是在於數據。
以前大家關注的是,誰的算法比較先進或者有沒有芯片,能不能進行垂直的整合,這四家可能多多少少都有類似的特點。但是接下來端到端最核心的點,不一定是軟硬一體或者進行垂直整合,而是數據,誰離數據最近,誰的數據基礎設施最強,誰能把這些數據基礎設施鋪到主機廠,誰在未來發展和競爭當中就有主動權。今天畢竟還是技術驅動的行業,當技術發生變革的時候,這裡面生產力核心要素就會發生變化,這也意味著給市場上競爭的態勢帶來新的變化。
Q:關於端到端,數據非常重要,但是對於原始數據的積累,因為不可能一開始就有很多優質的數據,現在大家又在進行數據的交易,你如何看待數據交易的趨勢?
王曉剛:更準確來說,數據並不是最關鍵的,而是數據的基礎設施和數據管線是最重要的,因為有效的數據是隨著算法的變化而變化的,永遠不可能去存儲最原始的數據,因為無論是通訊,還是存儲成本都太高了。那麼算法和模型變的時候,提取數據的方式就會發生變化。只要有這樣一套有效的數據生產的管線隨時隨地都可以有新的數據高效地引進來。
Q:國內除了自動駕駛供應商,還有主機廠比如蔚小理、小米這些新勢力也在投入智駕,絕影如何能夠實現突破?
王曉剛:這裡面比較重要的是要有一個可持續發展的邏輯,今天雖然競爭很激烈,實際上智能化、自動駕駛的投入還是巨大的;同時看到一個問題,大家很多是重複性的投入,這就在於基礎的設施數據,大家沒有進行對齊,今天之所以會出現成本高的問題,在於機制上大家合作的模式。
有些新勢力全棧自研,像大模型,商湯在這方面累計投入超過100個億,後面還會持續在這方面投入,任何一家公司如果在基礎設施方面持續投入的話也是難以承受的。這就是為什麼說大家要找到自己的定位,形成比較有效的合作,而不是惡性競爭和取代的關係,這樣才能夠達到共贏共生,長久持續的發展。
Q:現在比較堅定地選擇純視覺方案的,除了Tesla,就是極越跟小鵬,在封閉路段上純視覺確實是沒有問題的,但是在城區明顯還是比有激光雷達的差了不少,在你看來,純視覺和帶激光雷達的方案今後會是怎樣的發展態勢?
王曉剛:關於純視覺和激光雷達,這是由現階段所積累的數據體量所決定的,視覺我覺得還是有更高的天花板,但這裡面需要有更多的數據,這也是為什麼我們要把基礎設施建立好,這樣才能夠有比較長久的發展。
盈虧平衡還需要三年左右
Q:絕影作為新型Tier-1是如何與客戶研發部門協同的?雙方各自的技術邊界是什麼?具體到本次絕影和大卓的合作,兩者是如何分工的?
王曉剛:傳統的是模塊化分工,Tier-1負責集成,作為整體黑盒標準化的交付,但是未來在端到端自動駕駛到來的時候,更多是要依賴數據的驅動,數據就在主機廠手裡,所以誰能夠更接近數據,誰就能夠在未來發展過程當中佔據主動。
以前模塊化的分工,將來就不太存在了,因為端到端一個模型把原來的模塊統一在一起,它的協作和分工模式就會發生比較重要的變化。比如我們跟主機廠和自研團隊的協同,重要的是我們能夠提供基礎算力和數據平台化能力,包括工具鏈,我們要能夠去對齊數據生產的標準和算法的架構,如果這些東西對不齊的話,在不同車型上採集的數據是沒有辦法進行兼容的。
這些東西做好之後,相當於我們給數據石油搭了一個非常堅實的、高質量的數據生產管線,有價值高質量的數據就會從這個“油田”裡面源源不斷地輸出出來,最後為它的產品形成提供很強的動力。
在產品層面,大家採取的模式就是比較靈活的模式,像類似奇瑞這樣的主機廠,量產車的數量非常多,每年車型也非常多,整個交付的任務是非常繁重的。這種情況下,如果我們跟主機廠自研團隊在數據、工具鏈、算法架構上對齊以後,當涉及具體交付車型的時候,大家就會比較靈活,有的時候你可以多做一點,有的時候我來多做一點。
今天我們可以看到智能駕駛整體上離盈利還有一定的距離,也就是說,在交付過程當中,如果大家各方面資源和數據工具鏈沒有對齊,往往會造成重複的投入,誰將來能夠提升效率,有高性價比的交付,誰就能夠走得更遠,所以我們跟大卓的合作就是基於這樣的認知,也是按這種方式進行推進的。
Q:剛才提到智能駕駛距離盈利還有一段距離,從你的判斷,這個距離大概會有多長?絕影在海外市場方面怎麼考慮?
王曉剛:未來自動駕駛實現盈虧平衡還需要有三年左右的時間,這裡面取決於自動駕駛的量,要有足夠多的量,百萬級的量去支撐業務的發展。另外,比較重要的是合作的模式,能夠以更高性價比的方式去完成交付,實際上還包括新技術和新產品的開發。
另外,海外方面比較重要的是隨著中國車企出海,當然我覺得座艙可能會走得更快一些,駕駛裡面可能還要涉及不同區域適配的工作,這是一個大趨勢,國內能夠培養出產品的競爭力,將來能夠取得盈利,還是希望全球市場上有更多的空間,而且利潤空間可能還會更高一些。
Q:國內的車企,特別是新勢力智駕第一梯隊,他們出於競爭的需求,很多在採取高階智駕免費的策略或者以變相的形式向用戶贈送幾年使用權來推廣他們的智駕,你對目前這種商業模式可持續性怎麼看?你希望的商業模式是怎樣的?在目前情況之下車企和智駕供應商之間利益分配,你有什麼思考嗎?
王曉剛:整體來說,今天汽車的發展很多事情看著還不夠合理,很多事情也是不可持續的。我們當然希望市場能夠回到正軌,所以不光是智駕本身的問題,是整個行業的問題。
另外比較重要的是要避免同質化的競爭,還是要做出既有用戶價值,還有特色的功能產品。從產品設計、技術發展路線上來說,找到自己獨特的路線和價值,這個才能實現可持續的發展。
在智駕裡面,除了端到端自動駕駛,還需要做到艙駕融合,有些新的體驗,另外,我們還跟車企有深入的合作,共創一些產品體驗上的差異化,從而節省這些成本和投入。如果每個車企大家都是採用不同的配置標準,回傳數據也都不一致的話,最終實際上是沒有辦法讓它實現可持續發展的。
Q:從財報來看汽車業務是近兩年增長比較快的業務,那麼從細分的構成上看,目前智艙和智駕營收或者出貨量佔比上大概是什麼樣的結構?後續資源如何配比?之前商湯在智駕戰略和組織架構方面有些調整,具體是怎麼樣的情況?
王曉剛:從收入上看兩邊是差不多的,如果從出貨量上來看,肯定座艙是高於智駕的。如果從研發投入上來說,現在更多研發投入是在智駕上,因為這裡面本身的技術棧比較深,而且有比較多的資源投入,從長期來說智駕會更多一些。
目前我們的組織架構更加的聚焦,之前項目相對分散一些,今天比較明確的像J6E和J6M的平台,還有端到端自動駕駛,客戶也會更加聚焦,所以做了這方面的調整,主要是因為我們的產品和客戶需求更加清晰了,更加聚焦在量產方面。