給AI大模型裝上眼睛:車路雲網絡重構大模型發展?

文 | 極智GeeTech

人工智能從未停止進化,也從未停止給人類帶來驚喜。

從文生文、文生圖到文生影片,從ChatGPT、Dall-E到Sora,生成式AI跨越壁壘、一路狂飆,向人們展示了人工智能時代超越邊界的想像力和爆發力。

當前人工智能的發展具有「大」和「多」的特徵,大模型的參數規模越來越大,文、圖、影片等方面的多模態能力也越來越強,無論是國內還是國外,都經歷了一場有關人工智能的巨變。

大模型的持續進化離不開海量數據的支持,以至於業內將數據形容為推動人工智能發展的「燃料」和「礦產」。不過,人工智能巨頭OpenAI公司聯合創始人兼前首席科學家伊利亞·蘇茨克維爾近日公開警告,「AI的訓練數據如同化石燃料一樣面臨著耗盡的危機」。《自然》雜誌最近也在頭版敲響警鍾——人工智能革命正「吸乾」互聯網數據的海洋。

另一方面,目前科技公司競相追逐的通用大模型,基本都是基於歷史靜態數據訓練,比如全球互聯網上的文字、對話、圖片和影片,先不說其本身數據的真實性,僅僅依賴這些靜態數據訓練的通用大模型對真實世界的理解力本身就值得懷疑。這點已經遭到眾多矽谷科學家的詬病,他們指出,基於現有互聯網數據訓練的大模型,可能訓練出具有片面世界觀的「怪物」。

因此,物理世界的實時數據就顯得更加重要。這也是馬斯克所支持的大模型計劃被看好的原因——基於其遍佈全球的數百萬輛特斯拉汽車收集的真實動態數據,將有助於其訓練出更「高級」的通用人工智能大模型。

AI大模型所面對的困局,或許在中國迎來轉機。隨著車路雲一體化、自動駕駛、具身智能等技術的興起,一些科技公司正大力推動車路雲網絡建設和應用——車路雲網絡本身就是一個物理世界的實時動態數據庫,其規模遠超想像,並時刻都在產生全新的真實數據

這或許會為AI大模型提供連接物理世界與數字世界的全新數據引擎,驅動人工智能持續進化、迭代升級,幫助AI大模型更好地理解真實世界。

下一代大模型的數據新引擎

近日,中國科學院院士梅宏表示:「現在的公交車、出租車、地鐵等各種出行方式的數據,均是由各自獨立的信息系統來彙聚的,形成了一系列的數據孤島。如果要把這些數據彙在一起共享融合,需要實現各系統間的互操作。如果每個機構都做一遍,成本很高,效率也很低。因此,需要構建一套新型基礎設施,從根本上支撐數據在互聯網上的互聯互通,這就是所謂的數據基礎設施,它本質上是互聯網技術體系的一次拓展和延伸。」

聚焦到交通場景,交通是一個非常典型的從感知、認知、到決策、控制的過程。傳統人工智能在裡面目前只呈現碎片化應用,比如識別信號燈、識別違章等。

想要真正解決問題,需要用車路雲這一根線,把車流、道路、交通信號等所有的散點串聯起來,形成更高維度的全局智能,通過對車、路、雲、網等交通關鍵節點開展智能協同,形成對交通態勢的全面、及時、精準的感知、控制與決策。

人們所熟知的人工智能大模型是擁有超大規模參數(通常在十億個以上)、複雜計算結構的機器學習模型,通常能夠處理海量數據,完成各種複雜任務,如自然語言處理、圖像識別等。傳統的通用大模型擅長處理文本、語音、圖像和影片等四類數據,但對車路雲領域來說,準確理解空間坐標、實時動態數據的分析處理、未來物體軌跡預判才是核心。這也進一步強調了車路雲與現有人工智能技術的本質區別。

2024年,是我國全面佈局車路雲一體化的「元年」。

年初,工信部發佈的《關於開展智能網聯汽車「車路雲一體化」應用試點工作的通知》提出,要建設智能化路側基礎設施,實現試點區域5G通信網絡全覆蓋,部署LTE-V2X直連通信路側單元等在內的C-V2X基礎設施。通過新一代移動通信技術將人、車、路、雲一體化,建立系統性數據平台,產業化規模落地應用,就是智能駕駛的「中國方案」。

7月初,工信部公佈了20個城市(聯合體)為「車路雲一體化」應用試點城市。

10月,工信部相關負責人在國新辦新聞發佈會上表示,下一步將深入開展智能網聯汽車準入和上路通行試點、「車路雲一體化」試點,穩妥推進自動駕駛技術產業化。

目前,中國已經形成相對成熟的車路雲一體化建設方案,主要由設備端、通信服務、雲平台、車路雲應用、車路雲安全等部分組成。其中,在政府機構主導的項目推動下,路側基礎設施及平台建設率先開展。

行業發展的生命力在於持續不斷進行實踐創新,通過行業實踐破解關鍵問題,從而推動行業螺旋上升。比如車路雲行業大模型,其在解決車路雲協同中的一些關鍵挑戰方面具備獨特優勢,特別是在複雜環境中提供高級的感知和理解、動態管理交通流量、協調異構交通參與者、實時數據處理和決策等方面。

在複雜的城市環境中,例如在擁擠的街道、複雜的交叉口、惡劣的天氣條件下,傳統大模型由於缺乏對物理世界的感知能力,難以準確感知和理解交通環境。車路雲大模型可以通過使用深度學習算法和大規模訓練數據,準確地識別和理解複雜環境中的各種對象和情境,如行人、單車、其他車輛、道路標誌和臨時路障等。

預測和管理動態變化的交通流量是車路雲協同面臨的一大挑戰,尤其是在高峰時段或特殊事件(如道路施工或大型活動)期間。針對這一點,車路雲大模型可以利用實時數據處理和分析能力,並結合歷史和實時的交通數據,預測交通流量變化和潛在擁堵點,從而幫助優化交通信號控制和車輛路徑規劃。

在車路雲環境中,需要協調不同類型的交通參與者(如不同品牌和型號的車輛、非機動車、行人)的行為,這在傳統交通系統中是一個挑戰。車路雲大模型通過高級的模式識別和預測算法,理解和預測不同交通參與者的行為,有效地協調它們之間的交互,提高出行安全和交通效率。

實時收集、處理和共享大量交通數據,並據此做出快速決策,是交通系統面臨的重要挑戰。車路雲大模型借助強大的計算能力和智能算法,能夠快速處理來自車輛、路側基礎設施和其他傳感器的大量數據,並實時做出準確的決策。隨著城市交通環境和規則的不斷變化,車路雲大模型還具有自我學習和適應的能力,可以根據新的數據和經驗不斷優化自己的算法和策略,以應對不斷變化的交通環境。

得「通感算」者得天下?

作為未來智能城市的底層系統,車路雲一體化通過集成AI數字道路基站、衛星通信和定位、各類傳感器、無人機、機器人等關鍵基礎設施,構建起一個無縫交互、高效協同的網絡系統,為用戶提供高精度、實時數據服務。

從車路雲一體化的發展路徑看,主要經歷了四個階段。

第一階段是信息交互協同。主要實現車輛與道路的信息交互與共享;

第二階段是協同感知。在信息交互協同的基礎上,進一步利用車載和路側的感知設備,對道路交通環境進行實時高精度的感知定位,從而為自動駕駛提供更全面、更準確的環境信息;

第三階段是協同決策控制。在協同感知的基礎上,進一步實現道路對車輛、交通的決策控制;

第四階段是車路雲一體化。通過融合智能網聯車輛、路側設施及雲端平台,提供更全面、準確的交通環境感知,並協同交通場景各參與要素進行高效的全局智能決策。

在車路雲網絡的加持下,道路通行能力得以提升,智能駕駛將變得更加安全。當下的自動駕駛汽車,仍無法在追求極致安全與道路效率兩者之間形成優雅的平衡。當每一輛車都成為智能體的時候,它們各自的決策發生衝突時會形成一種算法博弈。如果兩輛車都決定加速,就可能發生碰撞;如果同時減速,效率又會降低;另外還會遇到車輛在路口的相互博弈,導致車輛停在路中間,又會引發交通擁堵。

車路雲網絡作為交通中統一的關係協調方,其價值正在於通過全局智能決策,成為協調各交通要素之間關係的樞紐,通過借助大模型、深度學習等人工智能技術幫助各方做出更好決策,從而構建起良性的交通關係,保障交通的通行效率和安全性。

蘑菇車聯創始人兼CEO朱磊認為,車路雲一體化的本質是構建一套「通感算」網絡,通過對實體世界進行實時數字化,為智能設備提供實時數據服務。這一網絡現階段主要為交通和車輛服務,但未來其應用範圍將擴展至無人機、機器人等一系列智能體,形成一個實時的、城市級的數字孿生系統。

想像一下,通信網絡彷彿是神經,算力系統如同大腦,感知相當於感官,三者深度打通,通感算網絡彷彿變成了一個自智化、價值化的系統。

功能層面,通感算網絡是同時具備「物理-數字」空間感知、泛在智能通信與計算能力的網絡。

在通感算網絡中,各類傳感器、智能體通過軟硬件資源的協同與共享,不僅能夠感知物理世界的各種信息,包括位置、速度、姿態、環境等,並將這些實時信息轉化為數字信號進行處理和傳輸,可以應用於自動駕駛、智能製造、智慧城市等領域,還能實現多維感知、協作通信、智能計算功能的深度融合。這種融合可以帶來更高效的信息處理、更低的時延和更高的可靠性。

通過廣泛的連接能力,通感算網絡可以實現人與人、人與物、物與物之間的智能通信。作為龐大的實時數據網絡,通感算網絡可以大規模獲取實體世界的全局數字化信息,為普通汽車、智能汽車、機器人、無人機、低空飛行器等智能設備提供系統級的實時數據服務,這些智能設備可以基於全局數據信息進行實時決策和精準規劃,實現更高效的協作。

在疊加大模型之後,通感算網絡具備了對真實物理世界的理解能力,可以對海量數據進行實時處理和分析,實現智能決策和優化。

為了構建通感算網絡,需要解決一系列技術難題,包括通感算一體化空口技術、網絡化感知技術、智能算力網絡技術等。這些技術的研發和應用將推動通感算網絡的發展,為未來的交通智能化建設提供強有力的支撐。

空天地一體化理想照進現實

除了交通領域,通感算網絡還可以整合地面網絡和非地面網絡,在全球範圍內提供泛在接入,並融合低軌或超低軌衛星、無人機和高空平台站等作為移動終端或節點組成的非地面網絡,形成空天地一體的泛在接入網絡。

通感算網絡獲取的實時物理世界數據還可以用來反哺自動駕駛模型、機器人模型的訓練。比如可以根據不同城市特點,訓練最適合當地駕駛行為的自動駕駛模型;根據不同工作和工種特點,訓練最適合不同工作場景的機器人。

當智能設備規模越來越大,最具合理性的方式一定是儘可能降低對單體設備在計算能力和實時感知能力方面的依賴,通過整個網絡來承載巨量的數據處理和計算分析。

比如針對自動駕駛感知受限問題,通感算網絡利用數字道路基站,以及攝像頭和毫米波雷達等感知設備,對路面情況進行感知並進行影片流的壓縮。並通過車載通信鏈路將壓縮後的圖片或影片上傳至配置了圖像分類識別算法的基站進行處理。

數字道路基站配合路側邊緣計算系統,在原影片的基礎上提取出包含行人、障礙物或路面情況改變的關鍵幀並對這些幀進行分類。基於圖像分類識別算法進行圖像識別處理,再將處理後的結果下發給車輛終端,從而實現通感算賦能自動駕駛車輛的超視距感知能力。

基於通感算一體化提供的成像、地圖構建和環境重構能力,自動駕駛車輛可以在未知的環境中化被動為主動,執行自動導航和路徑規劃等更具決策能力的任務。

通感算網絡讓車輛在進行實時通信交互的同時,也為其開了感知的「天眼」,能夠「看見」更多,「瞭解」更多,「創造」更多。

在智能化的大趨勢下,聰明的車和智慧的路正加速融合。隨著政策持續加碼、技術路徑跑通、商業場景落地,車路雲一體化所面臨的挑戰正被進一步廓清,前景也更加清晰。

市場永遠不缺少投機者,而堅定者更加彌足珍貴。任何一個產業發展的關鍵期,都將考驗參與者的戰略定力,也只有吃透用戶、吃透市場,才能最終在市場真正立足。