2025，10個AI展望

「只有當設計那些對普通人類來說簡單但對AI困難的任務變得完全不可能時，你才會知道AGI真正到來了。」

——François Chollet

1. 中國企業加入基礎模型創新，擴展定律重新定義

推理模型從o1到o3的一次階躍，僅用了3個月，而且中間還出現了兩家中國公司，深度求索和阿里推出模型。2025年推理模型的競爭已經提前打響，推理側的訓練和計算，以及更集約的算法，正在重新定義下一代大模型。基礎模型不再只是大規模預訓練系統，而正在演變為動態的、適應性強的、自我優化的智能體。中國企業在算力約束下開闢更集約的技術路線。擴展定律（scaling law）也將重新定義並持續下去。

2. 測試AGI，基準難度增加

各種大模型的測試基準迅速飽和，那些動輒學霸級的數學、科學和編程等科目的得分，有些是數據汙染帶來的。頂尖數學家提出了新的數學基準FrontierMath，讓包括o1在內的大模型數學得分近乎白卷。o3在ARC-AGI的得分達到了87.5。

但是，任何任務只要提供了明確的評價指標，都可以在微調過程中用作獎勵信號，所有的測試基準也終將被迅速解決。ARC-AGI已經決定在2025年推出對AGI更嚴格的標準，而那些迅速飽和的基準版本也將被淘汰。從目前來看，人類擅長的，AI反而更難，基本解決莫拉維克悖論（Moravec’s Paradox），依然被認為是實現AGI的前提。

3. AI加快用於科學發現和企業研發

GPU的並行計算能力，最早是科學研究人員應用於他們的科研工作中的，科研總是要求更多的計算。AI推理能力在編程、數學和科學領域的突破，AI科學家獲得盧保化學獎，以及實例研究初步證明AI顯著提升了企業研發效率，都意味著材料科學、生物科技、創新藥研發等領域，將首先使用短期內成本較高的高級推理應用，更多使用AI加速研發並壓縮漫長而重覆的過程。越來越多的科學家將離不開AI幫助他們閱讀和評議論文、產生新的思想、設計實驗方案、篩選研發目標、模擬實驗過程等；AI也將進一步加快進入工程設計領域。

4. Agent（智能體）更高級精密，多智能體加強協作與互動

在賦予了大模型「先驗」的世界知識之後，AI正在學會感知、檢索、分析、推理、規劃、決策、執行，變成智能體。它能幹活，陪伴和融入人類的場景之中。2025年，一些企業將會像培訓員工一樣構建智能體，讓它們使用工具，在不同的應用和平台之間調用函數與功能，協助或獨立完成任務。智能體之間還會協作，它們改寫軟件和服務。創造價值，AI就是智能體。

5. 推理的高token消耗，支撐算力經濟持續繁榮

按照單個token計的算力成本在迅速下降，但推理的總需求卻以更快的速度增加，其結果是越有價值的推理消耗越大量的token，價格越貴。目前，o3回答一個有難度的問題需要上千美元。但如果AI推理解決有經濟價值的問題，能提升效率並且創造出新的需求，算力經濟將會繼續繁榮下去，AI芯片（GPU、ASIC、FPGA）及各種特色芯片，數據中心、雲計算、數據傳輸，以及新型電力系統的投資將會非常巨大。科技巨頭都將長期追求高性價比的算力，也會持續探索新的算法和量子計算。

6. 捲出AI搜索

微軟的Bing、OpenAI的SearchGPT、獨角獸Perplexity將繼續挑戰搜索霸主Google；垂直領域如法律、金融、教育、醫療等領域的大模型，都可以用作垂直AI搜索；企業AI搜索也將與智能體結合，當這些「有狀態的」（stateful）搜索成為AI時代個人與企業的搜索習慣時，傳統的搜索將被解構。當然，所有這些也都逃不過Google的掌心。也期待中國捲出更好的搜索。

7. 智能體讓AI應用產生差異性，以原生和賦能的方式，在既有平台和新的領域開始產生殺手級應用

如o1解決難度高的問題，Sonnet 3.5用來編程，GPT-4o用來寫文章，Gemini Flash 2.0解決長上下文問題。許多模型/代理具備了殺手級應用的潛質，如Sora，Project Astra，NotebookLM，Siri、Computer Use等，還有多模態AI加持的智能眼鏡、頭顯等，還有豆包。美國的智能體之間有更好的連接及互操作生態，中國的應用仍然會更追求流量。

多模態、跨現實：AGI新興智能體範式：

8. AI企業創新和應用出現中國範式

小型語言模型（SLMs）、智能體和ASIC的協同效應正在引發一場範式轉變，它讓中國企業的算力供應在國內和國際市場上有更多選擇，也產生了更多芯片創新的機會。新範式更有利於中國企業以較高的性價比訓練和微調模型。在推理模型方面，中國AI企業正在努力消弭與美國的代差，2025年會走出自己特色的大模型技術路線。分佈廣泛的高質量數據、相對輕量的推理模型、豐富的實體經濟場景，都更有利於中國產業+AI的創新。

9. 軟件公司新代碼的一半先由AI生成

編程是智能體進展最快的領域，一批估值增長最快的AI初創公司，主要就是構建編程智能體。Google2024年新代碼由AI生成已經達到25%。Claude 3.5 Sonnet模型編程能力已經超過了程序員水平的50%，2025年可望達到90%。OpenAI o3在編程能力的基準測試中已經勝過99.99%的程序員。2025年，寫基礎代碼的工作，將會被AI加速替代。

10. 科技企業開始利用智能體精益運營

在智能體投資方面，有企業開始動用人力預算而不是IT預算。科技巨頭已經開始謀劃基於AI的精益管理，建立AI運營槓桿，納迪拉維杜華判斷微軟總人力成本會下降，而人均成本會上升，同時研究人員的人均GPU配置也會增加；黃仁勳設想英偉達擁有10萬個代理，預計營收增長2～3倍，員工數量只會增加25%。salesforce創始人班尼奧夫提出AI勞動力時代。最聰明的公司都將自己構建智能體充當數字勞動力。智能體將使公司擁有無限勞動力，也可能出現少數（個）人+多智能體的初創公司。

One More Thing：物理AI

在數字領域重構3D，模擬物理世界，是GPU在遊戲世界的初心，也難怪它能製造出一層又一層的神經網絡。人類與萬物的智能，根本上來自物理世界。製造出能與物理世界互動的機器，甚至像人一樣，是人類對技術最根本的渴望。

空間計算、空間智能、空間推理、具身智能……在這些概念之上，模擬和互動物理世界的模型，可以是更好的智能體。無論是通過電腦打遊戲和創作影片、借助手機理解所處的空間，還是使用XR設備如頭顯和眼鏡，探索虛實一體的場景，都將在物理法則之上讓人如臨其境。自動駕駛和人形機器人，也將是人類技術在這個星球上所能製造的最具終極意義的產品。真正的智能，從來都是「具體」的。

本文來自微信公眾號：未盡研究（ID：Weijin_Research），作者：未盡研究

你可能喜歡