當「算力魔法」不再性感,AI五大新趨勢浮出水面
文 | 極智GeeTech
短短一年時間,兩場GTC大會,台上的黃仁勳依舊穿著熟悉的皮衣,卻多了些磕絆,少了些從容。
上一次GTC大會,正值英偉達如日中天高歌猛進。全球科技公司對生成式AI進行不計回報的瘋狂投入,將英偉達一步步推上神壇,一度成為全世界市值最大的公司。
而當DeepSeek橫空出世,人們突然意識到,單純依賴算力的「暴力美學」已觸及邊際效益的臨界點。與此同時,AI技術的應用瓶頸、成本壓力以及社會需求的變化,正將行業推向一個更複雜、更務實的階段。
如今的算力就像當年的雲計算,正慢慢變成AI時代的公共基礎設施,不可或缺但已給不出更多興奮點,其敘事邏輯也由「算力囤積」向「需求牽引」演變。
一邊是依然信奉「大力出奇蹟」塑造出的模型能力,在大規模數據和算力支撐下不斷衝擊新的性能高度;另一邊是利用工程創新和算法優化精雕出各類AI應用,試圖在算力紅海中開闢一條降本增效的新通路,這種分野在產業實踐中愈發明顯。而這些正浮現的關鍵趨勢將錨定AI未來的價值坐標。
趨勢一:大模型將從「訓練」捲向「推理」
2024年,OpenAI的一系列動作對大語言模型領域產生了深刻影響。9月,OpenAI發佈了首款推理模型o1。
類似於GPT-4等傳統大語言模型,在回答問題時往往依賴於預設的知識庫和訓練模式,直接提供最先浮現的答案。儘管反應迅速,但答案的準確性和合理性常常難以確保,有時甚至會產生錯誤或不合理的回答。
o1在回答問題前,會逐步分析用戶的提示詞(Prompt),通過比對不同的結果來呈現一個最佳回答,從而大幅減少錯誤。這種逐步推理的能力,讓AI能夠應對更複雜的任務,解決許多普通聊天機器人無法勝任的問題。
在深度學習中,「訓練」和「推理」是兩個緊密相關但又有所不同的階段。訓練過程通過調整模型參數來優化模型性能,需要大量的標註數據和計算資源;而推理過程則注重模型的預測能力,需要快速且準確地生成預測結果。
值得注意的是,當一種方法無效時,推理模型甚至會自動嘗試其他方法,這種處理邏輯與人類思考和解決問題的方式頗為相似,極大地提升了模型在處理數學、物理和邏輯等複雜問題時的準確性和可靠性。
比如2024年12月DeepMind推出的實驗性新型網絡瀏覽智能體Mariner,當被要求尋找聖誕餅乾配方並將原料添加到在線購物車時,Mariner遇到了選擇麵粉種類的難題。此時,Mariner在聊天窗口中清晰地闡述了其解決策略,利用瀏覽器的後退功能返回食譜頁面以確認所需的麵粉種類。
這一行為展示了智能體能夠將複雜任務拆解為具體的操作步驟,並通過合理的推理選擇解決問題的行動,對智能體在現實場景中廣泛應用具有重要意義。
在AI推理方面,一個重要趨勢正在浮現——慢速深度推理。與強調實時響應的快速推理不同,慢速深度推理聚焦於更為複雜、需要多步邏輯鏈條的任務,力求在知識複雜度和推理深度上實現突破。

這一趨勢的核心在於,大模型通過「分解-推理-重構」的方式,實現對複雜問題的多層次理解與求解。同時,結合外部知識庫和大模型內部的記憶系統,AI可以通過知識調用與整合,實現更具深度的邏輯推理。
慢速推理雖然響應時間略長,但能夠保證更高的輸出質量,特別適用於對精度要求極高的任務場景。例如,在醫療診斷、金融分析、法律諮詢等行業中,慢速深度推理能夠通過多輪分析和邏輯校驗,為用戶提供精準的解決方案,真正實現AI的「類人思考」。
從技術視角來看,當前AI推理還存在三方面挑戰。
首先,面對海量的輸入與複雜的計算任務,如何在資源有限的情況下實現快速響應和高質量輸出,成為AI推理的核心難題。
其次,不同用戶和企業場景對AI輸出的需求不同,需要模型具備更強的場景適配能力和定製化能力。
第三,相比預訓練階段的高耗能,推理階段更強調輕量化與可部署性,如何降低推理成本、提升資源利用率至關重要。
由於「推理」更強調自主性以及解決複雜問題的能力,因此,從今年乃至未來很長一段時間內,「推理」將成為大語言模型領域的核心議題,AI的競爭規則由此被重寫——從「誰擁有更強的算力」轉向「誰能更聰明地使用算力」,相關研究和應用將持續深化。
趨勢二:後訓練推動AI邁入「精耕時代」
隨著預訓練階段的算力擴張遭遇邊際效益遞減,行業焦點正轉向後訓練優化與實時推理架構創新。以DeepSeek為代表的AI應用的崛起並非算力的終結,而是推動AI進入了「精耕時代」。
大模型訓練通常需要經歷三個階段:預訓練、後訓練、持續訓練。
預訓練就像是一個擁有大量語言知識的「毛坯房」,通過使用海量數據訓練模型,使其掌握通用特徵和知識。後訓練則基於預訓練模型,針對特定任務或數據集進行額外訓練和精細調整,通常涉及微調、人類反饋強化學習(RLHF)、直接偏好優化(DPO)等技術,使其能夠更好地適應諸如回答問題、生成文本、遵循指令等任務。
例如,一個預訓練模型可能在一般的語言理解上表現不錯,但對於專業領域的問題回答可能不夠準確,通過後訓練,它可以在該領域的知識和推理能力上得到顯著提升。
在模型完成預訓練和後訓練後,需要繼續在新數據上進行訓練,以不斷更新和提升模型性能。這一階段可能在模型部署後的任何時間進行,從而適應新數據並保持模型性能的穩定提升。
數據是後訓練的核心要素之一。數據合成技術可以生成新的訓練數據,增加數據的多樣性和數量。例如,通過一些規則和模板,可以生成大量的對話示例、問題與回答對。同時,數據處理也非常關鍵,需要對數據進行清洗,去除噪聲、重覆和錯誤的數據,還會進行質量評估和分類,確保用於訓練的數據是高質量且符合任務需求的。
以Llama 3.1為例,首先,它使用了大量的合成數據和人類偏好數據進行訓練,以提高模型的泛化能力和準確性。其次,它採用了迭代訓練的方法,通過多輪訓練和生成來逐步優化模型性能。最後,它還採用了數據清洗、質量控制和語義去重等手段來確保訓練數據的質量和多樣性。
在具體實踐中,Llama 3.1的後訓練過程包括多個階段。在每個階段中,都需要仔細調整數據比例、優化模型參數,並在多個基準測試上評估模型性能。通過多輪迭代和不斷優化,Llama 3.1最終取得了顯著的性能提升。
在提高模型性能方面,後訓練技術體現在增強模型的適應性、任務專注性、魯棒性以及降低數據依賴等多個方面。這使得後訓練不再是一個可有可無的步驟,而是現代AI系統首要的組成部分,尤其是在追求高效和精準的任務完成能力時。隨著研究的深入,預計後訓練技術將繼續演進,進一步增強模型性能,推動AI應用的廣泛落地。
同時,後訓練對於人類數據的依賴性降低,促使研究者和開發者需要在技術、流程和策略上進行調整,以適應新的挑戰和機遇,未來,隨著自監督學習、數據增強和領域適應等技術的持續進步,我們會看到在更少的人類數據和資源投入下,仍能實現高性能模型的成功案例。
在發展高級推理模型方面,後訓練能力至關重要,這不僅體現在模型性能的提升上,還涉及到模型在複雜理解、動態知識更新和跨域適應等多方面的能力。隨著後訓練技術的不斷完善和應用,預計將為高級推理模型的發展提供更為堅實的基礎,特別是在問題解決和決策支持方面的應用。
趨勢三:多智能體協同將激發AI「群體智能」
隨著大模型的深入研究,多智能體協同已經成為AI研究最熱門的方向之一。
儘管基於大語言模型的ChatGPT、DeepSeek等具有強大的文本理解和生成能力,但它們本質上仍是作為孤立實體運行的,缺乏與其他智能體協作和從社交互動中獲取知識的能力,這種固有限制阻礙了它們從他人的多輪反饋中學習並提高其性能的潛力。
亞當·斯密在《國富論》的開篇提到,「勞動生產力上最大的增進,以及運用勞動時所表現的更大的熟練、技巧和判斷力,都是分工的結果。」
根據分工原則,擁有專業技能和領域知識的單個智能體可以從事特定的任務。一方面,通過分工,智能體處理特定任務的技能不斷精煉;另一方面,將複雜任務分解為多個子任務可以減少在不同流程之間切換的時間。最終,多個智能體之間的有效分工可以完成比沒有特定分工時多得多的工作量,從而大幅提高整個系統的效率和輸出質量。
2025年,AI推理成本的大幅下降為多智能體系統協同提供了經濟基礎。多智能體系統(Multi-Agent System)是由大型語言模型驅動,並以特定方式連接的多個獨立智能體組成的複雜系統。其中的每個智能體都配置有獨立的提示詞、大語言模型以及相應的工具。
該系統的設計旨在促使不同智能體之間實現高效的協同合作,通過這種協同作業模式,為解決複雜問題提供了更為靈活和強大的解決方案。多智能體有不同的交互協作模式,最典型的包括層級結構、集中結構、分散結構、混合結構等。
以Manus為例,其技術架構以多智能體協同為核心,採用分層結構與動態任務調度機制,通過規劃智能體、執行智能體、驗證智能體的協同,實現了從任務理解到成果交付的全流程自動化,大幅提升對複雜任務的處理效率。

規劃智能體負責解析用戶指令並拆解成可執行的子任務,並動態分配至執行智能體進行任務執行,同時監控執行路徑並實時修正;執行智能體負責各個子任務的具體執行,包括代碼生成、數據抓取、分析建模等各類智能體,可以調用各種工具的API接口;驗證智能體通過交叉校驗機制確保結果準確性。三類智能體共同協作完成複雜任務。
系統中的每個智能體都具備一定的自主性,能夠在沒有外界直接干預的情況下,根據自身的目標和所感知到的信息做出決策。它們並非孤立存在,而是通過相互之間的信息共享、任務協作和資源分配等交互方式,共同完成複雜的任務。同時,智能體能夠適應環境的變化,實時調整自己的策略和行為。
以城市交通管理為例,每一輛自動駕駛汽車都可以看作是一個智能體。它們各自感知周圍的路況信息,如車輛密度、道路狀況、信號燈狀態等,然後自主決策行駛速度、路線等。同時,這些車輛之間還會進行信息交互,比如分享前方的路況擁堵信息,從而實現協同駕駛,提高整個城市交通系統的運行效率,減少擁堵。
業內普遍認為2025年是AI智能體爆發元年。Gartner預測,2028年至少15%的日常工作決策將由智能體完成。當前,比較主流的多智能體技術框架包括微軟的AutoGen、MetaGPT、清華的AgentVerse、XAgent、AutoAgent、CrewAI等,這些項目從不同角度提出智能體系統規劃模塊的改進建議,其中包括長短期規劃、規劃輸出格式、用戶提示拓展解釋、反饋迭代機制等,為多智能體高效協作奠定技術基礎。
趨勢四:強化學習不斷衝破推理「天花板」
1947年,艾倫·圖靈在一次演講中提到「我們想要的是一台能夠從經驗中學習的機器」。
2025年,圖靈獎頒給了兩位畢生致力於解決圖靈這一問題的科學家——安德魯·巴托(Andrew Barto)與李察·瑟頓(Richard Sutton)。他們不僅是AlphaGo和ChatGPT技術上的奠基人,亦是機器學習領域的技術先驅。
如果說機器學習是「填鴨式」學習,那強化學習就是「放養式」學習。
傳統的機器學習,就是給模型被喂大量標註好的數據,建立輸入和輸出之間固定的映射關係。而強化學習,是在沒有明確指導的情況下,智能體通過不斷試錯和獎懲機制給出的反饋信號,逐漸調整下一步行動策略,並且循環往複,不斷接近最優策略。

就像一個機器人學走路,不需要人類一直告訴它「這步對,那步錯」,它只要嘗試、摔倒、調整,最終自己就會走路了,甚至走出自己獨特的步態。
顯而易見,強化學習的原理更接近人類的智能,就像每個幼童在跌倒里學會走路,在摸索中學會抓取,在咿呀里捕捉音節,學會語言。
強化學習的高光時刻是2016年AlphaGo的「神之一手」。當時AlphaGo在與李世石的比賽中,第37手落下了一步令所有人類驚訝的白棋,一步棋逆轉敗勢,一舉贏下李世石。
AlphaGo不是靠背棋譜背出來的「神之一手」,而是在無數次自我對弈中,試錯、長遠規劃、優化策略後自主探索出來,這就是強化學習的本質。
而最近爆火的宇樹科技迴旋踢機器人背後也是強化學習的訓練。
強化學習特別擅長處理規則複雜、狀態多變的環境,並在其中找到最優解,比如自動駕駛、機器人控制等。這些正是當下最前沿的AI應用領域,尤其是在大語言模型上,幾乎所有領先的大語言模型都使用了RLHF(基於人類反饋的強化學習)的訓練方法,即讓人類對模型的回答進行評分,模型根據反饋改進。
作為後訓練、推理階段的關鍵技術,強化學習將會得到更多的創新應用。比如機器人領域,通過強化學習,機器人可以自主地適應不同的環境和任務,提高工作效率和安全性。例如,在輔助康復訓練中,機器人可以根據患者的力量和姿勢調整其輔助力度,以幫助患者恢復功能。
自動駕駛領域,強化學習可以幫助自動駕駛汽車學習如何在複雜路況下安全行駛。通過與交通環境的交互,自動駕駛車輛可以不斷優化其駕駛策略,提高駕駛的安全性、舒適性和效率。然而,將強化學習應用於自動駕駛也面臨著一些挑戰,包括如何處理傳感器數據的不確定性、如何解決算法收斂性和穩定性等問題。
儘管強化學習還面臨著一些挑戰,例如學習效率、獎勵函數設計、安全性等問題,但隨著研究的深入,強化學習的應用領域將持續拓展,深度強化學習算法將不斷改進,多智能體強化學習和可解釋性強化學習也將成為重要的研究方向。
趨勢五:物理AI加速消融虛擬與現實邊界
早前,黃仁勳不止一次強調過,「AI的新一波浪潮是物理AI」。
在十年的時間里,AI從感知和計算機視覺,發展到了生成式AI,現在又到了代理AI階段,即具有推理能力的AI,未來將是物理AI時代。

如今大多數AI並不理解物理定律,不以物質世界為基礎,而產生影像、視訊、3D圖形和許多物理現象,需要基於物理並理解物理定律的AI。
物理AI是一種使自主機器(如機器人、自動駕駛汽車等)能夠在真實物理世界中感知、理解和執行複雜操作的技術。
物理AI的提出有其必然性。一方面,基於互聯網上大量文本和圖像數據訓練的生成式AI模型(GPT、Llama等)在生成人類語言和抽像概念方面已經基本滿足需求,但是受其生成規則的限制,對於物理世界的理解有限,因此會出現不符合現實世界規律的「幻覺」。
另一方面,機器無法感知和察覺它們周圍的世界,但借助物理AI,就可以構建和訓練自動駕駛、機器人等各類智能體,並與真實世界進行無縫交互並適應各種環境,有利於提高現實世界應用的可訪問性和功能性。
物理AI能夠理解三維世界的空間關係和物理行為,因此進一步擴展了生成式AI,其通過在AI訓練過程中加入更多真實場景數據,從而實現對物理世界的洞察和理解。通俗地理解,就是AI反饋的內容要符合物理規律。
作為物理AI在交通領域的重要應用之一,依託大模型構建的AI網絡將交通流量、氣象條件、道路狀況、城市環境等物理世界實時數據納入模型訓練,通過整合車輛、道路、雲端等多方數據,可以進行實時分析並為精準決策提供支持,幫助駕駛員和自動駕駛車輛即時優化決策。
同時,通過大模型對攝像頭影片流進行實時處理,可以為交通管理部門提供精準的交通流量分析預測與動態優化、事故預警、交通信號優化等服務。
在機器人應用領域,物理AI賦予機器人更強的環境感知、理解和交互能力。傳統的機器人只能按照預設程序執行任務,而搭載物理AI的機器人則能夠更好地理解周圍環境,並根據物理規律做出相應的反應。它們可以更好地識別物體、預測運動軌跡、並在複雜環境中進行導航和操作。
IDC數據顯示,隨著AI應用持續走深向實,大模型在金融、醫療、教育、零售、能源等多個行業領域實現初步應用。到2025年,全球AI支出將達2270億美元。預計到2030年,AI將為全球經濟貢獻19.9萬億美元,推動全球GDP增長3.5%。而目前,幾乎98%的企業領導者將AI視為其組織的優先事項。
2025年,AI將朝著輕量化設計、強推理能力提升、移動端應用普及的方向快速發展。當行業不再為算力神話狂歡,AI終將回歸本質——成為解決問題的基礎設施。五大趨勢的背後,是一條清晰的進化路徑:從追求規模到注重效率、從單一能力到系統協作、從數字孿生到虛實共生。
未來的AI競爭,將是效率、生態與場景落地的多維博弈。對於市場,這或許是跳出「七巨頭」引力場,重估技術價值的時刻;對於行業,則是一場從「造神」到「務實」的集體覺醒。
「魔法」終會退潮,而真正的工程革命,此刻才剛剛開始。