2年間AI大模型成本驟降萬倍,商業化應用加速跑|智譜張帆@MEET2025

編輯部 整理自 MEET2025大會

量子位 | 公眾號 QbitAI

對於AGI,大模型六小虎之一的智譜有自己的理解,他們把AGI分為五個等級:

  • 第一級是語言,智譜「已經做得非常不錯了」;

  • 第二級是對複雜問題的求解,可以看到o1水平模型能力出現;

  • 第三級是使用工具,比如自主智能體不但能夠通過API,還可以像人一樣操作手機、PC甚至汽車的界面來獲取信息;

  • 第四級是自我學習;

  • 第五級是超越人類,AI將具備探究科學規律、世界起源等終極問題的能力所以通往AGI之路將是一個清晰和明確的鏈路。

本次量子位MEET 2025智能未來大會上,智譜COO張帆熱情分享了智譜大模型的發展、應用、商業化發展、未來方向,以及企業和個人的科技戰略構建。

為了完整體現張帆的思考,在不改變原意的基礎上,量子位對演講內容進行了編輯整理,希望能給你帶來更多啟發。

MEET 2025智能未來大會是由量子位主辦的行業峰會,20餘位產業代表與會討論。線下參會觀眾1000+,線上直播觀眾320萬+,獲得了主流媒體的廣泛關注與報導。

核心觀點梳理

  • 大模型天然是一個應用導向的技術;

  • 一條曲線是能力上升,一條曲線是成本下降,帶來技術能力快速地落地和應用;

  • 通往AGI之路將是一個清晰和明確的鏈路;

  • AI開始變成基礎生產要素;

  • 意識到模型的技術效果不及預期不難,難的是找到「怎麼能行」的一條路;

  • 大模型的文本模型成為你的大腦,多模態模型成為你的眼睛,自主智能體模型成為你的雙手

  • 模型場景越來越從淺水區進入到深水區;

  • 不管基座模型是國內的、國外的,開源的、閉源的,合適的才是最好的。

    ……

以下為張帆演講全文:

2年時光飛逝,鋪開一個迅猛發展的大模型時代

大家好,非常高興今天有機會能夠跟大家做一些分享。

智譜算是在國內最早做大模型商業化的公司,我們在過去的一兩年當中也走了很多彎路,踩了很多坑,有一些成績。今天希望跟大家分享一下我們在商業上面的一些思考,大模型如何跟商業能夠應用起來。

其實我覺得今天大家經常會有一個問題,大模型是不是變慢了?是不是已經到瓶頸了?是不是增長得不夠快了?

我們在開始的時候可以簡單做一個小的回顧,看看過去的兩年間到底發生了什麼。

首先一點,大家可以看到在早期的時候,ChatGPT發佈後只用了兩個月的時間,全球用戶就過億。這是一個前所未有的現象級增速,比人類歷史上所有技術進展速度都要快——電話用了75年才達到這個成就,這是一個直接進入到應用的技術。

它也不像其它很多技術,一般來說,技術往往都是先有一個概念,然後從這個概念出發,不停嘗試讓它一點一點落地,最後落實。

今天的大模型不太一樣,我相信絕大多數的各位都不是先知道了這個概念,而是先知道了某一款應用。所以大模型天然是一個應用導向的技術。

很多分析都提出,生成式AI進入市場的速度遠比互聯網和PC要快,並且在過去兩年間,整個模型帶來了非常大的變化。

模型能力飛速提升

以一個計算基準來看,僅僅2年時間,整個模型的行業水平就從60分漲到了將近90分。通常而言,低分段漲分容易,高分段漲分不容易。但僅僅用了兩年時間,智能就提升了這麼多。

與OpenAI的折現軌跡相比,能看到智譜基本上跟緊上了國際步伐。

再說上下文窗口。我記得去年剛開始做模型商業化的時候,基本標配是4K基本,現在100萬才是基本門檻,甚至很難算是合格的能力。今天很多模型窗口都達到了100萬、200萬字,能裝的東西已經非常多了。

我們也能看到一系列從單一模態到多模態、從文本模型到多模態模型,甚至是自主智能體模型等等的現象出現,模型的能力變得越來越豐富。

這一切僅僅用了2年時間。我們回想移動互聯網時代,iPhone發佈兩年之後,真正的殺手級的應用都還沒有出現。

但是在今天,模型發展已經非常快,從各個方位上都全面得到了提升。

模型成本極速下降

與之相對應的是模型成本的下降,且無論是國內外。

連OpenAI也降低了幾十倍,並且還在持續下降。

國內更是如此。記得去年剛剛開始做商業化的時候,智譜當時還是5毛錢1000個tokens,但今天最低已經到了5分錢100萬個tokens——這是1萬倍。

也就是說,在過去兩年間,這個市場降價降了1萬倍,能力變得比原來更強。

一條曲線是能力上升,一條曲線是成本下降,帶來的是什麼?

帶來技術能力快速地落地和應用,這是背景。

通往AGI共5級階段,路徑清晰,方向明確

這個過程當中,有這樣一個背景。那麼,未來往哪去?大家更常會問,我們今天到了哪一步。

之前OpenAI發佈了對於AGI目標能力的分級,智譜也給出了一些自己的理解。

我覺得這個路徑還是比較清楚的:

第一級是語言。我們已經做得非常不錯了,基本上可以通過圖靈測試。

第二級是對複雜問題的求解。可以看到01這樣的能力出現,讓我們對模型的應用類似從「大腦的系統1」轉化為「系統2」,從簡單直覺的回答,變成了能夠深度性的思考和拆解。

第三級開始使用工具。過去回答覆雜問題的時候,不但需要能直接做深度的思考,還需要能夠跟外界持續地交互獲取信息。我們之前做了很多像Function calling(函數調用),如何在過程中把需求轉化為一個請求,通過API的方式取外部的數據,類似於這樣的方式補充內容。

也有包括像我們自己發佈的自主智能體,不但能夠通過API,還可以像人一樣操作手機、PC甚至汽車的界面,從裡面獲取信息。

第四級是實現自我學習。AGI已經不滿足人們談論和探索的空間了,已經開始討論ASI了。如果把人類的智能作為基準,而技術機器的智能在逐步上升。

隨著人給它標註數據,技術機器智能的曲線值逐步提升,某一天達到了人類的智能這條線,我們該怎麼標數據?它怎麼獲取更多的知識?

今天還有很多談論,已經看到了ASI和Super Alignment的初步進展,我覺得在今天看起來,這幾步還是或多或少都有了一些進展的。

在這裡面,智譜也不斷地探索和豐富模型的能力,從最開始的語言能力,到L2的複雜問題的能力,到工具能力,以及現在正在試圖去解決的第四級別的GLM-zero和GLM-OS等能力。

第五級還沒有非常明確的定義,但是方向在那,是超越人類,AI將具備探究科學規律、世界起源等終極問題的能力。

AI開始變成基礎生產要素,帶來商業底層變化

這一次,大模型不只是帶來了技術上的變革,與以往相比,也帶來了更多在商業上的可能性。

在移動互聯網時代,所有的任務都是獨立的,你需要從很多種算法中挑一種做實驗,解決一個小問題,比如分詞、詞性標註、實體識別等。

那個時候,使用AI的門檻的成本是很高的,所以只有那種高槓桿的業務才能應用,比如搜索引擎、推薦引擎。也就是說,只有那種上千萬、上億的人在應用,且邊際成本幾乎為零的應用,大家才能夠去用AI。那個時候基本上只有互聯網大廠在應用AI。

到2013、2014年神經網絡成熟之後,某種程度上,算法層被統一了,大家不用學各種各樣的算法了。

所以一定程度上門檻有了第一次普惠化,成本也下降。這樣的結果就是AI能力開始進入到產業跟行業。

而今天,從算法到模型,到數據,再到任務,整個大模型幾乎把一切都統一。

再加上有Zero-shot和Few-shot的能力,我們從針對一個任務去訓一個模型,變成可以直接去應用模型了。

它不但帶來了更強大的能力,還讓我們模型的生產成本比原來下降了至少兩個數量級,可能100倍。

原來做一個什麼樣的簡曆抽取,不搞上幾個算法科學家,搞上半年,根本搞不定,但幾百萬經費就出去了;但是今天來講,借助大模型,一個運營的人員,一個產品的人員,哪怕不會編程,基本上可以花上一週就能解決這個複雜的問題,並且效果還不差。

在這樣的背景下,AI開始變成基礎生產要素,這就導致帶來商業底層的很多變化,此外,上層的變化,包括工作方式、組織形式、商業模式甚至每個企業的壁壘,可能都會發生變化。

從智譜模型矩陣發展,看應用AI和AI應用的未來

接下來可以跟大家分享幾個最新的模型方面的進展。

首先,今天的智譜有非常完備的模型矩陣,包括語言模型、代碼模型、多模態模型、超擬人模型,到自主智能體。

語言模型方面,既有可以跑在PC、汽車、手機等設備上的端側的模型,也有開源或商用的模型。這一點代碼大模型也是一樣。

多模態模型方面,各種維度,從文生影片、影片理解、文生圖像、圖像理解等,智譜都有多方面的矩陣,能夠滿足用戶不同需求。再包括智譜還有擬人大模型、心理大模型,以及自主智能體。

這兩天Sora Turbo剛發佈,大家都覺得裡面有很多地方還不夠完美,我覺得這非常正常,因為這是一個很早期的技術。

找到它哪不行,這件事不難,我們大家都可以批評它;很難的是找到怎麼能行的那條路。

其實在GPT-3時代,就有像Jasper這樣的公司,一年有幾千萬美金的ARR。所以能夠找到模型與業務的最大公約數,是我們今天做商業化裡面的一個重要環節。

智譜最早的多模態模型,其實也是最不完善的版本,只是把莫奈的名畫動起來,然後拚了一下,還是會有一些穿幫的地方。但是本質上來講,已經足以幫助旅遊局做一個小宣傳片。

今天用大模型來做這樣一個影片,成本就10塊、20塊,成本極低;但如果用CG來做,沒一兩百萬做不下來。

與此同時,我們看到了未來對於內容生成應用的可能性

對於一段影片,以前用CV的方式,很難做泛化性理解,今天的大模型在幾乎不訓練的情況下,可以很好地回答影片里的人在幹什麼?有沒有精彩時刻?精彩時刻在多少秒?

還有一些端側模型方面的激戰。之前在高通驍龍峰會上,智譜聯合他們聯合發佈了demo,在8Gen4手機上完全可以驅動一個多模態的模型實現很好的效果。並且,智譜構建了非常完備的端雲一體化的同源解決方案,可以讓用戶在設備端很好地應用大模型的能力。

再比如影片通話,大家可以一邊對話,一邊在影片里跟AI做交流。最早是OpenAI在5月發佈了這個功能,但其實沒有真正讓終端用戶用起來。在今年8月,智譜已經把這個功能全量發佈在智譜清言上了,大家可以去嘗試。

自主智能體,能夠讓AI自動化幫你完成多達幾十步的,甚至跨應用的複雜任務。大模型的文本模型成為你的大腦,多模態模型成為你的眼睛,自主智能體模型成為你的雙手,不但能夠幫你做思考,還能幫你做執行。

智譜也提供了一整套的方案,可以幫助開發者更輕鬆地訓練一個私有模型,也可以基於模型的能力快速開發一個智能應用,可以幫助大家來解決行業實踐。

大家使用模型的場景越來越多,越來越從淺水區進入到深水區——

2年間,大家的需求從「有一個模型」,到「模型幫忙提升產品指標」,到今天「模型就要帶來業務結果」,從各個方面來看,大家對模型的應用需求和實踐變得越來越務實,確實讓模型已經開始從智力生產變成生產力。

快速講幾個例子:

我們在汽車上可以非常好地重塑智能駕艙體驗;一些非常複雜的垂直領域,比如公積金相關的複雜的問答,或邏輯推理等很多場景里,或企業內部的Chatbot自動化的問數生成Circle的能力,用智譜模型都有做不錯的效果。

最後跟大家探討一下大模型時代,企業或者個人該如何去構建自己的科技戰略。

我覺得這裡面關鍵來講四個要素:

選擇合適的基座,要構建與戰略目標和業務屬性相匹配的組織,基於場景和AI的能力來重新定義數據資產,並且把這些能力無縫融入到業務當中,從而來形成飛輪。

這裡面很多東西需要大家深度思考。

不管基座模型是國內的、國外的,開源的、閉源的,我覺得其實合適的才是最好的,所以這裡面涉及每一個環節的每一個問題,都需要大家自己思考。

我們也希望借助四樣能力,為每個企業構建自己科技戰略新飛輪,隨著每一輪的轉動能夠幫我們沉澱更多的能力,構建更多的壁壘。

謝謝大家!