李彥宏揭開大模型認知誤區:開源解決不了效率問題,大模型之間差距越來越大

白小交 發自 凹非寺

量子位 | 公眾號 QbitAI

大模型之間的差距會越來越大!

李彥宏最新內部講話曝光,一時間引發行業熱議。

畢竟在當前各種大模型橫掃榜單測試集、多項得分超過GPT-4o的現象中,很容易給人一種假象:下一個GPT-4o、下一個OpenAI就要誕生了

為什麼會這麼說?李彥宏進一步解釋道,大模型的天花板很高,現在距離理想情況還相差非常遠,所以模型要不斷快速迭代、更新和升級。

這背後需要能幾年、十幾年如一日地投入,不斷滿足用戶需求,降本增效。

除此之外,他還表示開源模型效率不高,解決不了算力問題,而智能體是大模型最重要的發展方向。

百度一直以來作為大模型應用的先行者,掌舵人李彥宏此次談話無疑也是給行業帶來一份實際意義上的參考。

一起來看看他到底說了什麼。

李彥宏內部談話曝光:三個大模型認知誤區

內部談話中李彥宏提出了三點思考,正好回應了當前正受關注的認知誤區:大模型之間的差距在縮小嗎?大模型技術已經接近天花板了嗎?為什麼說商業化模型更有性價比?

首先,大模型差距不是越來越小,而是越來越大。

一上來,李彥宏就反對了外界對大模型能力差距縮小的看法,認為模型之間的差距仍然顯著,並且會越來越多。他指出,儘管新發佈的模型在測試集上表現良好,但這並不能證明它們與最先進的模型如GPT-4o之間的差距已經縮小。

他解釋說,很多模型在發佈後,通過打榜、猜測試題目、答題技巧,從榜單上看 ,也許模型的能力已經很接近了,「但到實際應用中,實力還是有明顯差距的。」

一方面,模型之間的差距是多維的。模型能力的評估除了包括理解、生成和邏輯推理等多維度,以及相應的成本和推理速度。此外,對測試集的過度擬合可能導致對模型能力的誤解。

如今大模型已經來應用階段,他認為,真正的衡量標準應是模型在實際應用中能否滿足用戶需求和產生價值。因此在百度實際使用過程中,他不允許技術人員去打榜。

另一方面,模型天花板很高。今天能做到的,距離想要實現的效果還很遠,所以模型還需要不斷去迭代更新。只有持續幾年甚至十幾年地投入,才能讓模型滿足用戶需求、滿足場景、滿足提升效率或降低成本等需求。這也是保持競爭力的關鍵

由此李彥宏認為,所謂的領先12個月或者落後18個月沒有那麼重要。哪怕你能保證永遠領先競爭對手6個月,那就贏了

其次,開源模型解決不了商業應用中的效率問題

在講話中,李彥宏強調,開源模型需要用戶自行部署和維護,這導致其GPU使用率低,無法有效分擔推理成本。而閉源模型通過用戶共享資源和分攤研發成本,實現了更高的效率與效果。

目前文心大模型3.5、4.0,GPU使用率都能達到90%多。

正如前面所言,評價一個模型,維度是多方面的,不僅是看到榜單上的多項能力,也要看效果看效率。當大模型加速駛入商業應用之後,在追求高效率和低成本的情況下,開源模型並沒有優勢。

李彥宏明確表示,在大模型時代,算力的高效利用是決定模型成敗的關鍵,而開源模型無法解決這一問題。

最後,智能體是大模型最重要的發展方向,低門檻讓應用轉化變得更加直接和高效。

大模型發展過程主要會經歷哪幾個階段?在內部講話中, 李彥宏給出了明確的答案。

首先是的Copilot階段,輔助人類進行操作;接著是Agent智能體階段,具備自主使用工具和自我進化能力;最後是AI Worker階段,能夠獨立完成多種工作。

其中智能體作為大模型最重要的發展方向,相比於大家都在關注的多模態,尚未形成行業共識。但在百度的產品中,比如文心智能體平台AgentBuilder已經讓智能體的潛力已經開始被認可。

而其中低門檻這一特性,讓從模型到應用的轉化變得簡單,促使大量新智能體在百度平台上被創造。

李彥宏強調,借助百度的用戶基礎和需求,智能體可以更好地滿足市場需求,推動其進一步發展。

百度智能體實踐已進入深水區

總結下來,李彥宏談到的這幾點思考,如果說前兩點,還說的是現在,說的是當下,那麼智能體就代表著未來。而這一切的背景前提,正好同當前大模型發展駛入深水區階段不無關係。

如今隨著基礎模型更新速度放緩,大模型應用逐漸深入產業,企業面臨著更複雜的市場環境和技術挑戰。簡單的技術迭代已不足以滿足市場的多樣化需求。

人們對大模型的期待與看法也隨之改變,模型的參數量以及榜單分數不再作為模型能力的核心指標,開源不開源其實也並不重要。

產業界對AI的需求,已經不僅僅是單純的技術追求,解決實際問題才是衡量大模型的唯一標準。在這一過程中,更多問題和挑戰不容忽視,比如推理與算力的成本問題,以及處理業務效率等。

那麼本身在行業長期且持續投入的百度,面對當前這一命題,自然是給中國眾多大模型提供了一份發展參考。

答案就是智能體

所以這次李彥宏內部談話,其實也不僅僅是關於行業認知,還有來自百度智能體實踐的有力驗證和體現。

在此之前,李彥宏在多次講話中強調,智能體代表了AI時代的未來趨勢。

作為一個幾乎「放之四海而皆準」的大模型應用,智能體不僅門檻低,甚至不需要編程技能,就能讓用戶輕鬆開發出功能強大的應用。李彥宏形象地將智能體比作「AI時代的網站」,預示著它將形成一個數百萬量級的龐大生態。這種廣泛的應用潛力使得智能體成為各行各業的「Super APP」,推動了AI技術的普及和應用。

與之相應的,是百度在智能體領域的佈局顯著。

通過文心智能體平台AgentBuilder,百度已經吸引了20萬開發者和6.3萬企業入駐,並在2023年7月免費開放文心大模型4.0。這一舉措使得開發者在構建智能體時可以靈活選擇適合的模型版本,大大降低了開發的門檻。

並且在短短時間內,百度智能體展現出大模型應用強大的潛力。據百度2024年Q2季度財報,智能體在百度生態的分發量正在快速上升,7月日均分發次數超800萬,較5月翻倍。

熱門智能體包括內容創作、性格測試和日程規劃等,涵蓋教育、法律及B2B等多個行業。百度的智能體生態吸引了1.6萬家商戶參與,形成了用戶、開發者和服務商共贏的局面。

李彥宏強調,智能體的發展不僅依賴於技術創新,更需緊密結合用戶需求。隨著用戶對智能體的需求不斷上升,使得這些智能體能夠快速迭代。而只有智能體生態持續擴展,才能推動AI技術在各個領域的深入應用。

在大模型應用逐漸深入的當下,百度的智能體實踐無疑為行業提供了重要的借鑒和啟示。

大模型熱潮進入洗牌期

今年以來已經明顯感知到的是,隨著大模型技術的不斷髮展和應用的深入,行業正在進入一個新的階段。這個階段的特點是,大模型玩家格局已基本形成:有自研和可持續研發大模型能力的玩家開始向頭部聚集

與此同時,大模型應用和落地開始進入生態建設期

越來越多看好大模型前景的創業者,不再會糾結是不是要自研或者自建大模型的問題,而是更加關注如何利用現有的大模型解決實際的痛點需求和問題。

在這個過程中,智能體作為最小的AI應用實現方式,展現出了巨大的潛力。它低門檻輕量化,能夠快速在行業中鋪開並實現覆蓋,滿足效率和成本兩大需求。隨著基礎模型的不斷增強,智能體應用可以變得更加簡單和廣泛。

這也是李彥宏看好智能體的核心原因所在。

通過李彥宏講話,我們可以看出百度的戰略重點正在發生轉向。卷基礎模型的階段已經過去,現在更加重要的是如何通過智能體構建起豐富多彩的應用生態,讓生態成為百度大模型、文心的護城河。

這意味著,百度將更加重視智能體在應用生態中的價值和意義,通過不斷完善智能體平台和工具,吸引更多開發者和企業加入,共同打造一個繁榮的AI應用生態。

未來,智能體將不僅限於內容創作和日程規劃等基本功能,會拓展到更多專業領域,如醫療、金融和法律服務等,為用戶提供個性化和高效的解決方案。

為了實現這一願景,企業需要持續投入資源進行技術創新與迭代,不斷優化算法和提升用戶體驗。

當然,在這個過程中也會面臨一些重要的課題,比如數據隱私與安全性,智能體的管理和維護等。但是,任何一項技術應用駛入深水區都會面臨這樣那樣的挑戰。

隨著智能體生態的不斷壯大,百度正引領行業走向一個更加智能化和高效的未來,為各行業帶來新的機遇與挑戰。