2025,10個AI展望
「只有當設計那些對普通人類來說簡單但對AI困難的任務變得完全不可能時,你才會知道AGI真正到來了。」
——François Chollet
1. 中國企業加入基礎模型創新,擴展定律重新定義
推理模型從o1到o3的一次階躍,僅用了3個月,而且中間還出現了兩家中國公司,深度求索和阿里推出模型。2025年推理模型的競爭已經提前打響,推理側的訓練和計算,以及更集約的算法,正在重新定義下一代大模型。基礎模型不再只是大規模預訓練系統,而正在演變為動態的、適應性強的、自我優化的智能體。中國企業在算力約束下開闢更集約的技術路線。擴展定律(scaling law)也將重新定義並持續下去。
2. 測試AGI,基準難度增加
各種大模型的測試基準迅速飽和,那些動輒學霸級的數學、科學和編程等科目的得分,有些是數據汙染帶來的。頂尖數學家提出了新的數學基準FrontierMath,讓包括o1在內的大模型數學得分近乎白卷。o3在ARC-AGI的得分達到了87.5。
但是,任何任務只要提供了明確的評價指標,都可以在微調過程中用作獎勵信號,所有的測試基準也終將被迅速解決。ARC-AGI已經決定在2025年推出對AGI更嚴格的標準,而那些迅速飽和的基準版本也將被淘汰。從目前來看,人類擅長的,AI反而更難,基本解決莫拉維克悖論(Moravec’s Paradox),依然被認為是實現AGI的前提。
3. AI加快用於科學發現和企業研發
GPU的並行計算能力,最早是科學研究人員應用於他們的科研工作中的,科研總是要求更多的計算。AI推理能力在編程、數學和科學領域的突破,AI科學家獲得盧保化學獎,以及實例研究初步證明AI顯著提升了企業研發效率,都意味著材料科學、生物科技、創新藥研發等領域,將首先使用短期內成本較高的高級推理應用,更多使用AI加速研發並壓縮漫長而重覆的過程。越來越多的科學家將離不開AI幫助他們閱讀和評議論文、產生新的思想、設計實驗方案、篩選研發目標、模擬實驗過程等;AI也將進一步加快進入工程設計領域。
4. Agent(智能體)更高級精密,多智能體加強協作與互動
在賦予了大模型「先驗」的世界知識之後,AI正在學會感知、檢索、分析、推理、規劃、決策、執行,變成智能體。它能幹活,陪伴和融入人類的場景之中。2025年,一些企業將會像培訓員工一樣構建智能體,讓它們使用工具,在不同的應用和平台之間調用函數與功能,協助或獨立完成任務。智能體之間還會協作,它們改寫軟件和服務。創造價值,AI就是智能體。
5. 推理的高token消耗,支撐算力經濟持續繁榮
按照單個token計的算力成本在迅速下降,但推理的總需求卻以更快的速度增加,其結果是越有價值的推理消耗越大量的token,價格越貴。目前,o3回答一個有難度的問題需要上千美元。但如果AI推理解決有經濟價值的問題,能提升效率並且創造出新的需求,算力經濟將會繼續繁榮下去,AI芯片(GPU、ASIC、FPGA)及各種特色芯片,數據中心、雲計算、數據傳輸,以及新型電力系統的投資將會非常巨大。科技巨頭都將長期追求高性價比的算力,也會持續探索新的算法和量子計算。
6. 捲出AI搜索
微軟的Bing、OpenAI的SearchGPT、獨角獸Perplexity將繼續挑戰搜索霸主Google;垂直領域如法律、金融、教育、醫療等領域的大模型,都可以用作垂直AI搜索;企業AI搜索也將與智能體結合,當這些「有狀態的」(stateful)搜索成為AI時代個人與企業的搜索習慣時,傳統的搜索將被解構。當然,所有這些也都逃不過Google的掌心。也期待中國捲出更好的搜索。
7. 智能體讓AI應用產生差異性,以原生和賦能的方式,在既有平台和新的領域開始產生殺手級應用
如o1解決難度高的問題,Sonnet 3.5用來編程,GPT-4o用來寫文章,Gemini Flash 2.0解決長上下文問題。許多模型/代理具備了殺手級應用的潛質,如Sora,Project Astra,NotebookLM,Siri、Computer Use等,還有多模態AI加持的智能眼鏡、頭顯等,還有豆包。美國的智能體之間有更好的連接及互操作生態,中國的應用仍然會更追求流量。
多模態、跨現實:AGI新興智能體範式:
8. AI企業創新和應用出現中國範式
小型語言模型(SLMs)、智能體和ASIC的協同效應正在引發一場範式轉變,它讓中國企業的算力供應在國內和國際市場上有更多選擇,也產生了更多芯片創新的機會。新範式更有利於中國企業以較高的性價比訓練和微調模型。在推理模型方面,中國AI企業正在努力消弭與美國的代差,2025年會走出自己特色的大模型技術路線。分佈廣泛的高質量數據、相對輕量的推理模型、豐富的實體經濟場景,都更有利於中國產業+AI的創新。
9. 軟件公司新代碼的一半先由AI生成
編程是智能體進展最快的領域,一批估值增長最快的AI初創公司,主要就是構建編程智能體。Google2024年新代碼由AI生成已經達到25%。Claude 3.5 Sonnet模型編程能力已經超過了程序員水平的50%,2025年可望達到90%。OpenAI o3在編程能力的基準測試中已經勝過99.99%的程序員。2025年,寫基礎代碼的工作,將會被AI加速替代。
10. 科技企業開始利用智能體精益運營
在智能體投資方面,有企業開始動用人力預算而不是IT預算。科技巨頭已經開始謀劃基於AI的精益管理,建立AI運營槓桿,納迪拉維杜華判斷微軟總人力成本會下降,而人均成本會上升,同時研究人員的人均GPU配置也會增加;黃仁勳設想英偉達擁有10萬個代理,預計營收增長2~3倍,員工數量只會增加25%。salesforce創始人班尼奧夫提出AI勞動力時代。最聰明的公司都將自己構建智能體充當數字勞動力。智能體將使公司擁有無限勞動力,也可能出現少數(個)人+多智能體的初創公司。
One More Thing:物理AI
在數字領域重構3D,模擬物理世界,是GPU在遊戲世界的初心,也難怪它能製造出一層又一層的神經網絡。人類與萬物的智能,根本上來自物理世界。製造出能與物理世界互動的機器,甚至像人一樣,是人類對技術最根本的渴望。
空間計算、空間智能、空間推理、具身智能……在這些概念之上,模擬和互動物理世界的模型,可以是更好的智能體。無論是通過電腦打遊戲和創作影片、借助手機理解所處的空間,還是使用XR設備如頭顯和眼鏡,探索虛實一體的場景,都將在物理法則之上讓人如臨其境。自動駕駛和人形機器人,也將是人類技術在這個星球上所能製造的最具終極意義的產品。真正的智能,從來都是「具體」的。
本文來自微信公眾號:未盡研究 (ID:Weijin_Research),作者:未盡研究