對話智譜AI張鵬:我如何看待與互聯網大廠的競爭? 丨 科創100人
文 丨 新浪科技 周文猛
期數:No.60
嘉賓:智譜AI CEO張鵬
對於AI Agent的研發佈局,正成為國內大模型獨角獸企業重點發力的方向。
近日舉辦的智譜Agent OpenDay上,智譜AI CEO張鵬宣佈旗下自主任務完成智能體AutoGLM再次升級,支持自主執行超過54步的長步驟操作,也可以跨App執行任務。據悉,目前AutoGLM已開啟大規模內測,將很快面向廣大C端用戶開放。
在與新浪科技《科創100人》欄目溝通中,張鵬直言,“大模型從對話(Chat)走向操作(Act),從生成式AI邁向代理式AI。”他進一步指出,“當前大模型已經初步具備了人類與現實物理世界互動的部分能力,Agent將極大地提升使用工具能力,同時開啟對自我學習能力的探索。”
面對激烈的競爭,他直言,這種競爭一半是商業問題,另一半才是技術策略問題。
“大模型正改變互動方式,讓機器來適應人”
在張鵬看來,大模型不只是Chatbot,其本質在於對世界的“理解”能力以及預測能力。基於這樣的預判,過去兩年,智譜致力於將這種“理解和預測”能力融入各行各業及各種場景,與在場眾多客戶和夥伴進行了大量實踐。
在不斷的探索過程中,張鵬發現,如果將大模型“序列預測”的能力拓展至語言文本之外的圖像視頻,甚至操作序列領域,那AI Agent將成為高效應用的重要形式。“在大模型技術之前,沒有任何方法能實現代替人智能地和機器進行交互,過去的鍵盤、鼠標、多點觸控這樣的物理交互形式,本質上還是讓人來適應機器,如今大模型正在改變這種互動方式,讓機器來適應人。”張鵬表示。
他將大模型發展分為五個階段,分別是:L1語言能力、L2邏輯能力(多模態能力)、L3使用工具的能力、L4自我學習能力、L5探究科學規律。並進一步指出,“發展至今,大模型已初步具備了人類與現實物理世界互動的部分能力,Agent將極大地提升L3使用工具能力,同時開啟對L4自我學習能力的探索。”
基於以上認知,智譜AI對旗下自主任務完成智能體AutoGLM進行了升級,能夠支持自主執行超過54步的長步驟操作,也可以跨App執行任務。此外,智譜還帶來基於PC的自主Agent——GLM-PC,面向會議預定、文檔處理、網頁搜索及遠程指令發送等場景進行開啟內測,致力於讓GLM-PC也能夠像人一樣操作電腦,完成一系列任務。
“一句話操作電腦和手機的時代,即將到來。”張鵬表示。在他看來,大模型正在從對話(Chat)走向操作(Act),從生成式 AI邁向代理式 AI。對於這一轉變可能導致的技術棧能力變化,張鵬認為,“生成式 AI和代理式 AI,本質上沒有很大的一個變化,因為它還是在用生成式AI在做任務的規劃、理解、執行等過程,但對於開發人員或者複雜系統的研發而言,卻提出了一些新的要求。”
“對於複雜系統的開發,以及企業內部如何落地這些技術來說,如果你需要讓Agent來調動客戶端上人能看懂的東西,希望讓他也能看懂,在開發端這些其實是一些API接口,這就是一個新的問題,你內部的數字資產、服務,能夠讓API很好地去調用去執行。”張鵬認為,這也對企業帶出了一些新的要求,需要他們對內部的這些數字資產進行整理,去適應新時代下的這種開發範式調整。
“與大廠的大模型競賽,一半技術一半商業”
伴隨著生成式AI的快速發展,目前國內包括騰訊、阿里巴巴、字節跳動、百度等在內的互聯網大廠,也競相在AI大模型、Agent生態等方面展開佈局。面對大廠的競爭,智譜如何考慮自己的定位?在張鵬看來,與大廠們的競爭,一半是商業的問題,一半是技術策略的問題。
從技術上來說,智譜推出的技術和產品,本質是希望能夠幫大家更好地去連接,無論連接硬件還是連接應用和服務,它可以說是一種工具,能夠讓用戶通過自然語言的方式,更加容易地去組裝各種服務,然後按他們自己的個人意願去做這件事情。“這件事情背後,技術的問題是非常困難的,要做到有一定智能水平的智能體,它並不是想像中那麼簡單的事情,這是智譜作為一個大模型公司最有自信的地方。”
而在商業的角度,智譜的思路是“解決問題”。技術本身的很多特點,決定了商業化上的一些路徑和策略,其實大模型是一個非常開放性的技術,它創造的是一個新的範式和新的生態。“我們自己的定位是,無論我們提供什麼樣的技術、產品,我們更多的是探索新的可能性,新的範式。”張鵬表示。
此外,張鵬還進一步指出,人工智能技術的發展,可能不是一個簡單的單向問題,我們真的想要AI變成一個生產流程表或者一個軟件機器人的話,需要努力的方向是不能有明顯的短板。據他介紹,目前智譜已在芯片、操作系統OS 、模型側和應用App側,對整個AI大模型及其應用的技術棧進行了全面佈局。
在終端層面,智譜已經和榮耀、惠普等手機、PC廠商實現深度合作,在 AIPC、智能助手Agent等領域進行探索。此外,智譜也與高通、英特爾等芯片廠商展開密切協作,聯合調教端側大模型。通過端側芯片性能優化和端雲一體架構,智譜Agent不僅在操作系統OS和應用App上實現用戶體驗變革,還能將其推廣到各類智能設備上,實現基於大模型的互聯互通。
“目前的Agent能力能夠幫助用戶鏈接眾多應用,未來甚至有望鏈接所有設備。”在張鵬看來,理論上隨著Agent能力持續提升,它們將能夠駕馭越來越多的應用程序,適配多樣化的操作系統,並執行日益複雜的自主操作。