2025年,AI Agent還會是風口嗎?11個問題揭秘智能體技術發展全貌
經過了LLM、RAG、多模態等多輪技術風口的洗禮後,AI智能體的應用現狀究竟如何?Langbase公司最近發佈的調查報告通過11個關鍵問題,為我們提供了一份有價值的現狀切面。
2024年,AI智能體技術無疑是科技界的焦點。
通過對來自100多個國家的3400名開發者進行深入調查,Langbase公司近日發佈的一項報告揭示了智能體開發中的關鍵問題。這項調查的受訪者中,有46%是企業領導層,26%是工程師。
Langbase專注於提供無服務器的AI雲開發體驗。作為一個提供可組合基礎設施的AI平台,他們在2024年一共處理了來自3.6萬開發人員的1840億個token和7.86億個API請求。
提起Langbase這個名字,你也許不太熟悉。 事實上,這家公司非常年輕,2023年剛剛成立。
根據Crunchbase披露的數據,他們剛剛才在9月份進行了pre-seed輪融資,但已經得到了Google、蘋果、OpenAI、微軟等大廠高管們的資金支持。
下面就讓我們一起來看看這家年輕有為的Langbase發佈的這份圖文並茂的報告中究竟提到了哪些內容。
問題1:開發者在使用哪些基座大模型
在這場AI智能體的競賽中,OpenAI的大模型服務佔據了主導地位,但Google正迅速崛起,成為其強勁的競爭對手,Anthropic緊隨其後。
其中,Meta的Llama、Mistral和Cohere雖然影響力較小,但增長形勢不容忽視,顯示出基座大模型市場的激烈競爭。
問題2:不同大模型對應的的具體用途
OpenAI在翻譯任務中被廣泛應用,Anthropic在技術任務中備受青睞,而Google的模型在健康和翻譯領域佔據主導地位。
此外,Meta在科技和科學應用中得到了廣泛使用,Cohere也在多個領域得到重視,包括科學和營銷。
問題3:哪些因素阻礙了你對大模型技術的應用
在模型的擴展和部署中,數據隱私和安全合規性成為主要關注點, 「缺乏監控工具」和「高基礎設施成本」這兩項因素也阻礙了技術的落地應用。
對AI驅動解決方案的抵製或懷疑反映了使用者們的長期顧慮,這表明,模型和技術的提供商們需要更加透明和用戶友好的AI平台。
問題4:哪些因素影響大模型的選擇
在選擇大型語言模型(LLM)時,準確性是最重要的因素,其次是安全性和可定製性,成本的影響相對較小。
問題5:在部署大模型時,你遇到的最大挑戰是什麼?
在生產環境中部署大模型和智能體面臨著種種關鍵挑戰,包括定製困難、質量保證評估方法有限,以及缺乏可重用的基礎設施。
此外,工具碎片化、集成問題和可擴展性等方面的顧慮進一步複雜化了這個過程。
問題6:採用大模型技術時,你的主要目標是什麼?
「自動化」和「簡化」是AI應用的首要任務,使公司在效率和流程簡化方面受益;此外,定製解決方案和提升合作流程等方面的目標,反映了大模型日益增長的靈活性,以及消費者對系統共享訪問的興趣。
問題7:您的公司如何使用大模型智能體?
LLM在軟件開發中得到廣泛應用,尤其在市場營銷、IT運營和文本摘要等方面,客服、人力資源和法律領域的使用興趣也在日益增長。
問題8:那些平台特徵對你至關重要
大多數受訪者都需要多智能體檢索增強生成(RAG)功能以提高上下文信息處理,同時,評估工具對於確保人工智能系統按預期工作也很重要。
問題9,在編排AI流水線時,開發者偏好哪種工具
大多數受訪者更喜歡能提供靈活、基礎原語的開發工具以設計定製AI流水線(pipeline)。預構建的、針對特定問題的解決方案雖然可以直接解決具體問題,但它們的可定製性較低。
問題10:什麼因素影響大模型智能體開發工具的選擇
開發者將AI智能體的版本控制視為開發平台最重要的功能。強大的SDK或庫生態系統以及本地開發環境也受到重視。
問題11:大模型在公司中的應用程度
大多數開發者將 AI 用於實驗和生產。相比之下,實驗用途的比例遠遠大於生產用途,但後者的比例仍在穩步前進的過程中。
隨著AI智能體基礎設施的成熟,越來越多的企業會嘗試開發智能體,而隨著多模態及大模型操作計算環境(例如Claude通過接口在線互動)的發展,智能體在2025年的應用將更加廣泛,甚至不僅僅局限於報告中提到的軟件開發、市場營銷、IT運營和文本摘要等領域。
然而,該調查中揭示的開發者關注的問題,例如更看重準確性、安全性和可定製性,而成本因素影響較小,以及偏好靈活、可定製的AI流水線開發工具,並重視AI智能體版本控制功能。
無論技術怎麼進步,這份調查結果都會對智能體平台及開發者有參考價值。
參考資料:
https://langbase.com/state-of-ai-agents?genai
https://x.com/MrAhmadAwais/status/1866483416981786821
本文來自微信公眾號「新智元」,作者:peter東 祖楊,36氪經授權發佈。