真正懂你的智能座艙！打造敏銳洞察、深度思考、高效執行的“多模態場景大腦”

圖說：商湯絕影首次亮相北京車展採訪對象供圖（下同）

2024北京國際汽車展覽會正在舉辦中，上海人工智能企業商湯絕影攜系列原生態大模型及相關產品矩陣首次亮相北京車展。

作為首個提出感知決策一體化自動駕駛通用模型的公司，商湯絕影在本屆車展上首次向公眾展示了面向量產的端到端自動駕駛解決方案UniAD的道路測試表現，同時還帶來了以多模態場景大腦為核心的AI大模型座艙產品矩陣以及全新座艙3D交互演示，全景展示了通用人工智能技術驅動的靈活自適應、深度個性化、安全可信賴、有人文關懷的未來出行全新體驗。

商湯科技聯合創始人、首席科學家、絕影智能汽車事業群總裁王曉剛表示，未來汽車智能化的競爭，本質上是通用人工智能技術融合應用的比拚。

“像人一樣開車”

商湯及其聯合實驗室在2022年底提出了行業首個感知決策一體化自動駕駛通用模型UniAD，並在次年榮獲國際計算機視覺與模式識別會議（CVPR）最佳論文。

此次北京車展上，商湯絕影以UniAD自動駕駛解決方案的實車測試成果展現了中國端到端智駕的實力。在無高精地圖條件下，僅依靠視覺感知，無論是複雜城市道路還是無中線的鄉村道路上，車輛能高效準確地完成包括大角度左轉上橋、避讓占道車輛及施工區域、繞行跑步行人等一系列高難度操作，做到“像人一樣開車”。

圖說：搭載UniAD方案的車輛可真正做到“像人一樣開車”

當前，行業需要真正的端到端自動駕駛方案——基於規則的智駕方案“天花板”已開始顯現。隨著城區成為智駕落地的主戰場，場景計算的複雜度呈指數級增長。大量的人力資源投入也只是增加有限的規則，無法應對數量無限的複雜場景和長尾路況。端到端技術的出現開闢了一條全新的道路，開始推動自動駕駛範式從鋪設大量人力轉變為持續算力投入和高質量數據輸入。

據悉，UniAD端到端方案有更高的能力上限，強大的學習和思考能力讓它能夠像人一樣開車；數據驅動的端到端模型泛化能力強、迭代效率快，可以幫助車企低成本快速開城；純視覺感知的無圖方案，進一步降低系統的軟硬件成本，助力智駕普及，實現全國都能開。

圖說：新一代自動駕駛大模型：可感知、可交互、可信賴

提供真正懂你的智能座艙

前幾天，商湯科技發佈了全新升級的“日日新5.0”大模型。基於端雲結合的架構，商湯端側大模型大幅超越同量級大模型，越級比肩7B、13B大模型，更適合車端部署。

基於多模態大模型、大語言模型、文生圖模型等能力組合，商湯絕影構建了以多模態場景大腦為核心的一系列全景感知、主動關懷且富有創造力的大模型座艙產品。

通過應用場景和用戶需求驅動，多模態場景大腦讓智能汽車可以高效準確地全景感知和深度理解用戶需求和周圍環境，並以場景大腦為核心打通不同應用，將離散的單點功能聚合在一起，從而為用戶提供更多深度個性化的主動關懷和服務。

基於地理位置推薦符合用戶喜好的餐廳、介紹用戶感興趣的外部自然景物，並進行優質景點推薦是絕影AI大模型座艙產品的基礎功能。憑藉多模態感知能力，搭載商湯絕影方案的車輛能夠準確感知並識別車外的信息，包括周圍車輛的車型、標誌性建築物等，以語音、圖片或者視頻等方式為艙內人員提供更為準確和全面的內容，幫助用戶瞭解和掌握外部環境信息，打破座艙本身的限制，讓用戶享受更為自由無束縛的出行體驗。

圖說：“旅醫”讓用戶在座艙內就可以獲得專業及個性化的健康管理服務

此外，以多模態場景大腦為核心，商湯絕影還能提供更多基於汽車場景的AI大模型座艙產品。以商湯“大醫”醫療健康大模型為橋樑的“旅醫”，讓用戶在座艙內就可以獲得專業及個性化的健康管理服務，讓出行更安心；而基於AIGC大模型技術的“神筆”，可以把用戶簡單的繪畫線條轉變成具有美感的藝術作品，增添駕乘樂趣。

人機交互的創新也是驅動座艙體驗升維的重要因素，去年Apple Vision Pro的問世展現了3D交互的創新體驗和應用潛力。商湯絕影將3D Gaze高精視線交互和3D 動態手勢交互這兩大全新座艙3D交互演示帶到車展現場，讓觀眾體驗到更符合人類直覺的艙內交互方式，推動座艙交互向更安全、更便利的3D交互升維進化。

據悉，商湯絕影還在進一步探索艙駕融合，實現智能駕駛和智能座艙在硬件、軟件及應用層面的全面融合，提升用戶體驗、降低系統成本，進一步打破艙內外的界限和束縛，湧現更多創新功能。

新民晚報記者郜陽