對話智譜AI張鵬:我如何看待與互聯網大廠的競爭? 丨 科創100人

丨 新浪科技 周文猛

期數:No.60

嘉賓:智譜AI CEO張鵬

對於AI Agent的研發佈局,正成為國內大模型獨角獸企業重點發力的方向。

日舉辦的智譜Agent OpenDay上,智譜AI CEO張鵬宣佈旗下自主任務完成智能體AutoGLM再次升級,支持自主執行超過54步的長步驟操作,也可以跨App執行任務。據悉,目前AutoGLM已開啟大規模內測,將很快面向廣大C端用戶開放。

在與新浪科技科創100人欄目溝通中張鵬直言,“大模型從對話(Chat)走向操作(Act),從生成式AI邁向代理式AI。”進一步指出,“當前大模型已經初步具備了人類與現實物理世界互動的部分能力,Agent將極大地提升使用工具能力,同時開啟對自我學習能力的探索。”

面對激烈的競爭,他直言,這種競爭一半是商業問題,一半是技術策略問題。

“大模型正改變互動方式,讓機器來適應人”

在張鵬看來,大模型不只是Chatbot,其本質在於對世界的“理解”能力以及預測能力。基於這樣的預判,過去兩年,智譜致力於將這種“理解和預測”能力融入各行各業及各種場景,與在場眾多客戶和夥伴進行了大量實踐。

在不斷的探索過程中,張鵬發現,如果將大模型“序列預測”的能力拓展至語言文本之外的圖像視頻,甚至操作序列領域,那AI Agent將成為高效應用的重要形式。“在大模型技術之前,沒有任何方法能實現代替人智能地和機器進行交互,過去的鍵盤、鼠標、多點觸控這樣的物理交互形式,本質上還是讓人來適應機器,如今大模型正在改變這種互動方式,讓機器來適應人。”張鵬表示。

他將大模型發展分為五個階段,分別是:L1語言能力、L2邏輯能力(多模態能力)、L3使用工具的能力、L4自我學習能力、L5探究科學規律。並進一步指出,“發展至今,大模型已初步具備了人類與現實物理世界互動的部分能力,Agent將極大地提升L3使用工具能力,同時開啟對L4自我學習能力的探索。”

基於以上認知,智譜AI對旗下自主任務完成智能體AutoGLM進行了升級,能夠支持自主執行超過54步的長步驟操作,也可以跨App執行任務。此外,智譜還帶來基於PC的自主Agent——GLM-PC,面向會議預定、文檔處理、網頁搜索及遠程指令發送等場景進行開啟內測,致力於讓GLM-PC也能夠像人一樣操作電腦,完成一系列任務。

“一句話操作電腦和手機的時代,即將到來。”張鵬表示。在他看來,大模型正在從對話(Chat)走向操作(Act),從生成式 AI邁向代理式 AI對於這一轉變可能導致的技術棧能力變化,張鵬認為,“生成式 AI和代理式 AI,本質上沒有很大的一個變化,因為還是在用生成式AI在做任務的規劃、理解、執行等過程對於開發人員或者複雜系統的研發而言提出一些新的要求。

對於複雜系統的開發,以及企業內部如何落地這些技術來說如果你需要讓Agent來調動客戶端上人能看懂的東西,希望讓他也能看懂,在開發端這些其實是一些API接口,就是一個新的問題你內部的數字資產服務,能夠讓API好地去調用去執行。”張鵬認為,這也對企業帶出一些新的要求需要他們對內部的這些數字資產進行整理,新時代下這種開發範式調整。

與大廠的大模型競賽,一半技術一半商業

伴隨著生成式AI的快速發展,目前國內包括騰訊、阿里巴巴、字節跳動、百度等在內的互聯網大廠,也競相在AI大模型、Agent生態等方面展開佈局。面對大廠的競爭,智譜如何考慮自己的定位在張鵬看來,與大廠們的競爭,一半是商業的問題,一半是技術策略問題。

從技術上來說,智譜推出的技術和產品,本質是希望能夠幫大家更好地連接,無論連接硬件還是連接應用和服務,可以說是一種工具,能夠讓用戶通過自然語言的方式,更加容易地去組裝各種服務,然後按他自己個人意願去做這件事情“這件事情背後技術的問題是非常困難的要做到有一定智能水平的智能體,它並不是想像中那麼簡單的事情,這是智譜作為一個大模型公司最有自信的地方。”

而在商業角度智譜的思路解決問題”。技術本身的很多特點決定了商業化上的一些路徑和策略,其實大模型是一個非常開放性的技術,它創造的是一個新的範式和新的生態。“我們自己的定位,無論我們提供什麼樣的技術產品,我們更多的是探索新的可能性,新的範式。”張鵬表示。

此外,張鵬還進一步指出,人工智能技術的發展,可能不是一個簡單的單向問題,我們真的想要AI變成一個生產流程表或者一個軟件機器人的話,需要努力的方向是不能有明顯的短板。據他介紹,目前智譜已在芯片、操作系統OS 、模型側和應用App側,對整個AI大模型及其應用的技術棧進行了全面佈局。

在終端層面,智譜已經和榮耀、惠普等手機、PC廠商實現深度合作,在 AIPC、智能助手Agent等領域進行探索。此外,智譜也與高通、英特爾等芯片廠商展開密切協作,聯合調教端側大模型。通過端側芯片性能優化和端雲一體架構,智譜Agent不僅在操作系統OS和應用App上實現用戶體驗變革,還能將其推廣到各類智能設備上,實現基於大模型的互聯互通。

“目前的Agent能力能夠幫助用戶鏈接眾多應用,未來甚至有望鏈接所有設備。”在張鵬看來,理論上隨著Agent能力持續提升,它們將能夠駕馭越來越多的應用程序,適配多樣化的操作系統,並執行日益複雜的自主操作。