智源研究院發佈2025十大AI技術趨勢:具身智能元年到來

1月8日,北京智源人工智能研究院(以下簡稱「智源研究院」)發佈「2025十大AI技術趨勢」。今年的十大AI技術趨勢是智源研究院根據行業技術及應用熱點,給出的年度AI趨勢預測。從基礎設施到產品應用,智源研究院對Scaling Law(尺度定律)、基礎模型、具身智能、超級應用、AI安全等關鍵方向作出預測。針對每個趨勢觀點,報告給出其可成為2025年度趨勢的論證邏輯。

在十大AI技術趨勢發佈會現場,來自清華等高校和企業界的專家,以及智源相關研究中心負責人對每項趨勢進行了深入分析和點評。

智源研究院副院長兼總工程師林詠華發佈「2025十大AI技術趨勢」。新京報貝殼財經記者 羅亦丹/攝智源研究院副院長兼總工程師林詠華發佈「2025十大AI技術趨勢」。新京報貝殼財經記者 羅亦丹/攝

在十大AI技術趨勢的代表案例中,不乏中國自研技術和產品的身影。

在多模態領域,智源研究院發佈完全自研的基於自回歸技術的原生多模態世界模型Emu3,實現了影片、圖像、文本三種模態的統一理解和生成。

在模型應用領域,豆包月活躍用戶數於2024年12月達到了7116萬,成為國內第一、全球第二的AI原生應用。在服務類智能體賽道,螞蟻集團旗下支小寶、螞小財等系列AI管家產品,重塑了AI產品形態。

與此同時,在AI大模型及深度數字化趨勢下,安全科技的價值在放大。智源研究院持續推進AI安全底層關鍵技術研究,同時積極推進AI安全國際合作:2024年3月,發起並承辦我國首個AI安全國際對話高端閉門論壇,與全球AI領袖學者及產業專家聯合簽署《北京AI安全國際共識》。2024年4月,聯合國科技大會發佈了兩項大模型安全標準,其中《大語言模型安全測試方法》由螞蟻集團牽頭。

智源研究院院長王仲遠表示,「當前,我們處在人工智能發展的新拐點,大模型的能力湧現加速通用人工智能時代的到來,原生統一多模態、具身智能、AI for Science,將進一步深化人工智能對世界的感知、理解與推理,連接數字世界與物理世界,驅動科學研究創新突破。智源研究院作為聚焦人工智能領域的新型研發機構,我們希望在這個特殊的時刻以十大趨勢為出發點,為人工智能行業的從業者指明發展方向,攜手共進」。

以下為十大AI技術趨勢的具體介紹:

趨勢一 科學的未來:AI4S驅動科學研究範式變革

大模型引領下的AI4S(AI for Science 人工智能幫助科學發展),已成為推動科學研究範式變革的關鍵力量。2024年,科研人員使用AI的比例快速增加,AI對科學研究方法和流程的變革效應也開始顯現。2025年,多模態大模型將進一步融入科學研究,賦能多維數據的複雜結構挖掘,輔助科研問題的綜合理解與全局分析,為生物醫學、氣象、材料發現、生命模擬、能源等基礎與應用科學的研究開闢新方向。

趨勢二 具身智能元年:具身和本體的協同進化

2025年的具身智能,將繼續從本體擴展到具身腦的敘事主線,我們可以從三方面有更多期待。在行業格局上,近百家的具身初創或將迎來洗牌,廠商數量開始收斂;在技術路線上,端到端模型繼續迭代,小腦大模型的嘗試或有突破;在商業變現上,也必將看到更多的工業場景下的具身智能應用,部分人形機器人迎來量產。

趨勢三 下一個Token預測:統一的多模態大模型實現更高效AI

人工智能的本質在於對人的思維信息過程的模擬。當前的語言大模型、拚接式的多模態大模型,在對人類思維過程的模擬存在天然的局限性。從訓練之初就打通多模態數據,實現端到端輸入和輸出的原生多模態技術路線給出了多模態發展的新可能。基於此,訓練階段即對齊視覺、音頻、3D等模態的數據,實現多模態的統一,構建原生多模態大模型成為多模態大模型進化的重要方向。

趨勢四 Scaling Law擴展:模型泛化從預訓練向後訓練、推理遷移

基於Scaling Law推動基礎模型性能提升的訓練模式「性價比」持續下降,後訓練與特定場景的Scaling Law不斷被探索。強化學習作為發現後訓練、推理階段的Scaling Law的關鍵技術,也將會得到更多的應用和創新使用。

趨勢五 世界模型加速發佈,有望成為多模態大模型的下一階段

更注重「因果」推理的世界模型賦予AI更高級別的認知和更符合邏輯的推理與決策能力,這種能力不僅能推動AI在自動駕駛、機器人控制及智能製造等前沿領域的深度應用,更有望突破傳統的任務邊界,探索人機交互的新可能。

趨勢六 合成數據將成為大模型迭代與應用落地的重要催化劑

高質量數據的短缺將成為大模型進一步Scaling Up(尺度發展)的發展阻礙。合成數據已經成為基礎模型廠商補充數據的首選。合成數據可以降低人工治理和標註的成本,緩解對真實數據的依賴,不再涉及數據隱私問題;提升數據的多樣性,有助於提高模型處理長文本和複雜問題的能力。此外,合成數據可以緩解通用數據被大廠壟斷、專有數據存在獲取成本等問題,促進大模型的應用落地。

趨勢七 推理優化迭代加速,成為AI Native應用落地的必要條件

大模型硬件載體從雲端向手機、PC等端側硬件滲透。在這些資源受限(AI算力、內存等)的設備上,大模型的落地應用會面臨較大的推理側的開銷限制,對部署資源、用戶體驗、經濟成本等均帶來巨大挑戰。算法加速和硬件優化技術持續迭代,雙輪驅動加速AI Native應用落地。

趨勢八 重塑產品應用形態,Agentic AI成為產品落地的重要模式

2025年,更通用、更自主的智能體將重塑產品應用形態,進一步深入工作與生活場景,成為大模型產品落地的重要應用形態。從Chatbot、Copilot到AI Agent、Agentic AI,2023年以來行業對於AI應用形態的理解越發深入。從更強調產品概念的AI Agent,到更強調應用智能程度的Agentic AI,我們在2025年將看到更多智能化程度更高、對業務流程理解更深的多智能體系統在應用側的落地。(記者註:以上英文的含義均與人工智能代理有關)

趨勢九 AI應用熱度漸起,超級應用花落誰家猶未可知

近一年時間,生成式模型在圖像、影片側的處理能力得到大幅提升,疊加推理優化帶來的降本,Agent/RAG框架、應用編排工具等技術的持續發展,為AI超級應用的落地積基樹本。雖然Super APP花落誰家尚未塵埃落定,但從用戶規模、交互頻次、停留時長等維度來看,AI應用熱度持續攀升,已到應用爆發的黎明前夕。

趨勢十 模型能力提升與風險預防並重,AI安全治理體系持續完善

作為複雜系統,大模型的Scaling(尺度)帶來了湧現,但複雜系統特有的湧現結果不可預測,循環反饋等特有屬性也對傳統工程的安全防護機制帶來了挑戰。基礎模型在自主決策上的持續進步帶來了潛在的失控風險,如何引入新的技術監管方法,如何在人工監管上平衡行業發展和風險管控?這對參與AI的各方來說,都是一個值得持續探討的議題。

新京報貝殼財經記者 羅亦丹

編輯 王真真

校對 劉軍