科技

2年間AI大模型成本驟降萬倍，商業化應用加速跑｜智譜張帆@MEET2025

12月27日 08:21 新浪網 tech-auto-hilite

編輯部整理自 MEET2025大會

量子位 | 公眾號 QbitAI

對於AGI，大模型六小虎之一的智譜有自己的理解，他們把AGI分為五個等級：

第一級是語言，智譜「已經做得非常不錯了」；
第二級是對複雜問題的求解，可以看到o1水平模型能力出現；
第三級是使用工具，比如自主智能體不但能夠通過API，還可以像人一樣操作手機、PC甚至汽車的界面來獲取信息；
第四級是自我學習；
第五級是超越人類，AI將具備探究科學規律、世界起源等終極問題的能力所以通往AGI之路將是一個清晰和明確的鏈路。

本次量子位MEET 2025智能未來大會上，智譜COO張帆熱情分享了智譜大模型的發展、應用、商業化發展、未來方向，以及企業和個人的科技戰略構建。

為了完整體現張帆的思考，在不改變原意的基礎上，量子位對演講內容進行了編輯整理，希望能給你帶來更多啟發。

MEET 2025智能未來大會是由量子位主辦的行業峰會，20餘位產業代表與會討論。線下參會觀眾1000+，線上直播觀眾320萬+，獲得了主流媒體的廣泛關注與報導。

核心觀點梳理

大模型天然是一個應用導向的技術；
一條曲線是能力上升，一條曲線是成本下降，帶來技術能力快速地落地和應用；
通往AGI之路將是一個清晰和明確的鏈路；
AI開始變成基礎生產要素；
意識到模型的技術效果不及預期不難，難的是找到「怎麼能行」的一條路；
大模型的文本模型成為你的大腦，多模態模型成為你的眼睛，自主智能體模型成為你的雙手
模型場景越來越從淺水區進入到深水區；
不管基座模型是國內的、國外的，開源的、閉源的，合適的才是最好的。

……

以下為張帆演講全文：

2年時光飛逝，鋪開一個迅猛發展的大模型時代

大家好，非常高興今天有機會能夠跟大家做一些分享。

智譜算是在國內最早做大模型商業化的公司，我們在過去的一兩年當中也走了很多彎路，踩了很多坑，有一些成績。今天希望跟大家分享一下我們在商業上面的一些思考，大模型如何跟商業能夠應用起來。

其實我覺得今天大家經常會有一個問題，大模型是不是變慢了？是不是已經到瓶頸了？是不是增長得不夠快了？

我們在開始的時候可以簡單做一個小的回顧，看看過去的兩年間到底發生了什麼。

首先一點，大家可以看到在早期的時候，ChatGPT發佈後只用了兩個月的時間，全球用戶就過億。這是一個前所未有的現象級增速，比人類歷史上所有技術進展速度都要快——電話用了75年才達到這個成就，這是一個直接進入到應用的技術。

它也不像其它很多技術，一般來說，技術往往都是先有一個概念，然後從這個概念出發，不停嘗試讓它一點一點落地，最後落實。

今天的大模型不太一樣，我相信絕大多數的各位都不是先知道了這個概念，而是先知道了某一款應用。所以大模型天然是一個應用導向的技術。

很多分析都提出，生成式AI進入市場的速度遠比互聯網和PC要快，並且在過去兩年間，整個模型帶來了非常大的變化。

模型能力飛速提升

以一個計算基準來看，僅僅2年時間，整個模型的行業水平就從60分漲到了將近90分。通常而言，低分段漲分容易，高分段漲分不容易。但僅僅用了兩年時間，智能就提升了這麼多。

與OpenAI的折現軌跡相比，能看到智譜基本上跟緊上了國際步伐。

再說上下文窗口。我記得去年剛開始做模型商業化的時候，基本標配是4K基本，現在100萬才是基本門檻，甚至很難算是合格的能力。今天很多模型窗口都達到了100萬、200萬字，能裝的東西已經非常多了。

我們也能看到一系列從單一模態到多模態、從文本模型到多模態模型，甚至是自主智能體模型等等的現象出現，模型的能力變得越來越豐富。

這一切僅僅用了2年時間。我們回想移動互聯網時代，iPhone發佈兩年之後，真正的殺手級的應用都還沒有出現。

但是在今天，模型發展已經非常快，從各個方位上都全面得到了提升。

模型成本極速下降

與之相對應的是模型成本的下降，且無論是國內外。

連OpenAI也降低了幾十倍，並且還在持續下降。

國內更是如此。記得去年剛剛開始做商業化的時候，智譜當時還是5毛錢1000個tokens，但今天最低已經到了5分錢100萬個tokens——這是1萬倍。

也就是說，在過去兩年間，這個市場降價降了1萬倍，能力變得比原來更強。

一條曲線是能力上升，一條曲線是成本下降，帶來的是什麼？

帶來技術能力快速地落地和應用，這是背景。

通往AGI共5級階段，路徑清晰，方向明確

這個過程當中，有這樣一個背景。那麼，未來往哪去？大家更常會問，我們今天到了哪一步。

之前OpenAI發佈了對於AGI目標能力的分級，智譜也給出了一些自己的理解。

我覺得這個路徑還是比較清楚的：

第一級是語言。我們已經做得非常不錯了，基本上可以通過圖靈測試。

第二級是對複雜問題的求解。可以看到01這樣的能力出現，讓我們對模型的應用類似從「大腦的系統1」轉化為「系統2」，從簡單直覺的回答，變成了能夠深度性的思考和拆解。

第三級開始使用工具。過去回答覆雜問題的時候，不但需要能直接做深度的思考，還需要能夠跟外界持續地交互獲取信息。我們之前做了很多像Function calling（函數調用），如何在過程中把需求轉化為一個請求，通過API的方式取外部的數據，類似於這樣的方式補充內容。

也有包括像我們自己發佈的自主智能體，不但能夠通過API，還可以像人一樣操作手機、PC甚至汽車的界面，從裡面獲取信息。

第四級是實現自我學習。AGI已經不滿足人們談論和探索的空間了，已經開始討論ASI了。如果把人類的智能作為基準，而技術機器的智能在逐步上升。

隨著人給它標註數據，技術機器智能的曲線值逐步提升，某一天達到了人類的智能這條線，我們該怎麼標數據？它怎麼獲取更多的知識？

今天還有很多談論，已經看到了ASI和Super Alignment的初步進展，我覺得在今天看起來，這幾步還是或多或少都有了一些進展的。

在這裡面，智譜也不斷地探索和豐富模型的能力，從最開始的語言能力，到L2的複雜問題的能力，到工具能力，以及現在正在試圖去解決的第四級別的GLM-zero和GLM-OS等能力。

第五級還沒有非常明確的定義，但是方向在那，是超越人類，AI將具備探究科學規律、世界起源等終極問題的能力。

AI開始變成基礎生產要素，帶來商業底層變化

這一次，大模型不只是帶來了技術上的變革，與以往相比，也帶來了更多在商業上的可能性。

在移動互聯網時代，所有的任務都是獨立的，你需要從很多種算法中挑一種做實驗，解決一個小問題，比如分詞、詞性標註、實體識別等。

那個時候，使用AI的門檻的成本是很高的，所以只有那種高槓桿的業務才能應用，比如搜索引擎、推薦引擎。也就是說，只有那種上千萬、上億的人在應用，且邊際成本幾乎為零的應用，大家才能夠去用AI。那個時候基本上只有互聯網大廠在應用AI。

到2013、2014年神經網絡成熟之後，某種程度上，算法層被統一了，大家不用學各種各樣的算法了。

所以一定程度上門檻有了第一次普惠化，成本也下降。這樣的結果就是AI能力開始進入到產業跟行業。

而今天，從算法到模型，到數據，再到任務，整個大模型幾乎把一切都統一。

再加上有Zero-shot和Few-shot的能力，我們從針對一個任務去訓一個模型，變成可以直接去應用模型了。

它不但帶來了更強大的能力，還讓我們模型的生產成本比原來下降了至少兩個數量級，可能100倍。

原來做一個什麼樣的簡曆抽取，不搞上幾個算法科學家，搞上半年，根本搞不定，但幾百萬經費就出去了；但是今天來講，借助大模型，一個運營的人員，一個產品的人員，哪怕不會編程，基本上可以花上一週就能解決這個複雜的問題，並且效果還不差。

在這樣的背景下，AI開始變成基礎生產要素，這就導致帶來商業底層的很多變化，此外，上層的變化，包括工作方式、組織形式、商業模式甚至每個企業的壁壘，可能都會發生變化。

從智譜模型矩陣發展，看應用AI和AI應用的未來

接下來可以跟大家分享幾個最新的模型方面的進展。

首先，今天的智譜有非常完備的模型矩陣，包括語言模型、代碼模型、多模態模型、超擬人模型，到自主智能體。

語言模型方面，既有可以跑在PC、汽車、手機等設備上的端側的模型，也有開源或商用的模型。這一點代碼大模型也是一樣。

多模態模型方面，各種維度，從文生影片、影片理解、文生圖像、圖像理解等，智譜都有多方面的矩陣，能夠滿足用戶不同需求。再包括智譜還有擬人大模型、心理大模型，以及自主智能體。

這兩天Sora Turbo剛發佈，大家都覺得裡面有很多地方還不夠完美，我覺得這非常正常，因為這是一個很早期的技術。

找到它哪不行，這件事不難，我們大家都可以批評它；很難的是找到怎麼能行的那條路。

其實在GPT-3時代，就有像Jasper這樣的公司，一年有幾千萬美金的ARR。所以能夠找到模型與業務的最大公約數，是我們今天做商業化裡面的一個重要環節。

智譜最早的多模態模型，其實也是最不完善的版本，只是把莫奈的名畫動起來，然後拚了一下，還是會有一些穿幫的地方。但是本質上來講，已經足以幫助旅遊局做一個小宣傳片。

今天用大模型來做這樣一個影片，成本就10塊、20塊，成本極低；但如果用CG來做，沒一兩百萬做不下來。

與此同時，我們看到了未來對於內容生成應用的可能性。

對於一段影片，以前用CV的方式，很難做泛化性理解，今天的大模型在幾乎不訓練的情況下，可以很好地回答影片里的人在幹什麼？有沒有精彩時刻？精彩時刻在多少秒？

還有一些端側模型方面的激戰。之前在高通驍龍峰會上，智譜聯合他們聯合發佈了demo，在8Gen4手機上完全可以驅動一個多模態的模型實現很好的效果。並且，智譜構建了非常完備的端雲一體化的同源解決方案，可以讓用戶在設備端很好地應用大模型的能力。

再比如影片通話，大家可以一邊對話，一邊在影片里跟AI做交流。最早是OpenAI在5月發佈了這個功能，但其實沒有真正讓終端用戶用起來。在今年8月，智譜已經把這個功能全量發佈在智譜清言上了，大家可以去嘗試。

而自主智能體，能夠讓AI自動化幫你完成多達幾十步的，甚至跨應用的複雜任務。大模型的文本模型成為你的大腦，多模態模型成為你的眼睛，自主智能體模型成為你的雙手，不但能夠幫你做思考，還能幫你做執行。

智譜也提供了一整套的方案，可以幫助開發者更輕鬆地訓練一個私有模型，也可以基於模型的能力快速開發一個智能應用，可以幫助大家來解決行業實踐。

大家使用模型的場景越來越多，越來越從淺水區進入到深水區——

2年間，大家的需求從「有一個模型」，到「模型幫忙提升產品指標」，到今天「模型就要帶來業務結果」，從各個方面來看，大家對模型的應用需求和實踐變得越來越務實，確實讓模型已經開始從智力生產變成生產力。

快速講幾個例子：

我們在汽車上可以非常好地重塑智能駕艙體驗；一些非常複雜的垂直領域，比如公積金相關的複雜的問答，或邏輯推理等很多場景里，或企業內部的Chatbot自動化的問數生成Circle的能力，用智譜模型都有做不錯的效果。

最後跟大家探討一下大模型時代，企業或者個人該如何去構建自己的科技戰略。

我覺得這裡面關鍵來講四個要素：

選擇合適的基座，要構建與戰略目標和業務屬性相匹配的組織，基於場景和AI的能力來重新定義數據資產，並且把這些能力無縫融入到業務當中，從而來形成飛輪。

這裡面很多東西需要大家深度思考。

不管基座模型是國內的、國外的，開源的、閉源的，我覺得其實合適的才是最好的，所以這裡面涉及每一個環節的每一個問題，都需要大家自己思考。

我們也希望借助四樣能力，為每個企業構建自己科技戰略新飛輪，隨著每一輪的轉動能夠幫我們沉澱更多的能力，構建更多的壁壘。

謝謝大家！

你可能喜歡