第一個免費可用的智能Agent產品全量上線,中國公司智譜打造,推理模型比肩R1

機器之心報導

作者:蛋醬

國產 AI 領域,從今天起有了既能深度研究又能動手操作的自主智能體產品。

這款神器叫做「AutoGLM 沉思」,來自中國公司智譜。

我們來看一個非常經典的案例:只需要輸出你想討論的話題,AI 就能自動去小紅書、知乎等平台上深度查詢、總結完整報告,並轉化為面向大眾的傳播內容。短短 14 天里,AI 孵化出了一個 5000 多個粉絲的小紅書帳號,還接到了商單。

「起號」,從未如此簡單高效:

3 月 31 日,智譜官宣了新一代 Agent 產品「AutoGLM 沉思」。

相比於此前 OpenAI 的 Deep Research 等產品,「動手能力」是 AutoGLM 沉思最大的亮點之一。它能夠「邊想邊干」,像人類一樣自動操作和瀏覽網頁,這意味著知網、小紅書、公眾號、京東等優質卻不對外開放 API 的信源都能被查看到,同時基於背後基座模型的多模態理解能力,這些網頁上的圖文信息也能被充分利用。

2025 年,大模型技術的演進來到了關鍵的新階段:從單純的語言模型到多模態模型,再到今天,我們終於看到了成熟的自主 Agent 產品,業內稱之為「Agentic AI 時代」。更詳細地說,我們觸手可及的大模型應用已經從「生成式 AI 的單次響應」,真正升級為具備自主推理能力、指揮自身行動和工具調用的智能系統。

「AutoGLM 沉思」的面世,扛起了國產 AI Agent 落地的大旗。且在今天的發佈後,「AutoGLM 沉思」即全量上線,免費開放給每一位用戶。

體驗方式:https://chatglm.cn/(下載「智譜清言」PC 客戶端)

與此同時,我們也看到了智譜這家中國公司在 Agent 領域的領先技術佈局,包括推理、多模態、記憶和工具。值得一提的是,「AutoGLM 沉思」基於的是智譜全棧自研的 Agent 技術,包括新一代推理模型 GLM-Z1-Air 和基座模型 GLM-4-Air-0414,前者性能比肩 DeepSeek-R1,在速度提升最高 8 倍的同時,價格僅需 DeepSeek-R1 的 1/30。

對於智譜來說,2025 年將是以「開源」為主題的一年。所有 Agentic 相關的模型和技術,包括基座模型 GLM-4-Air0414、推理模型 GLM-Z1-Air、沉思模型 Z1-Rumination、智能體框架,都將在 4 月 14 日正式開源。模型會在接下來的兩週內,陸續上線智譜 AI 大模型開放平台(bigmodel.cn),惠及整個技術社區。

首個免費可用、具備強反思能力的 Agent 產品

智譜表示,「AutoGLM 沉思」可以視為自主智能體的「Preview 版本」,可以理解為 DeepResearch 和 Agent 的強強組合。

我們可以從三個方面去評價「AutoGLM 沉思」:

  • 深度思考:能不能模擬人類在面對複雜問題時的推理與決策過程。

  • 感知世界:能不能像人一樣獲取並理解環境信息。

  • 工具使用:能不能像人一樣調用和操作工具,完成複雜任務。

打開智譜清言,說出自己的需求,也就是一段 Prompt,剩下的全部交給 AI:

Prompt:

分析問題:生成式 AI 技術對未來知識生產模式的顛覆性影響

具體要求:

對比傳統學術研究與 AI 輔助研究的範式差異

選取至少 5 個典型領域(如醫學、法學、文學,經濟學,藝術學等)進行深度研究案例分析

字數要求一萬字以上

它能探究開放式問題並根據結果執行操作,能夠模擬人類「深度研究」的過程,從數據檢索、分析到生成報告。

再來一個看看:

Prompt:我要去香港玩 3 天,請幫我設計旅遊攻略,注意每個景點都要從小紅書上查看網民的真實評論。

到這裏,我們都應該看出來「AutoGLM 沉思」的優勢何在了。

「AutoGLM 沉思」在一般 Deep Reseach 的基礎上,疊加了 AutoGLM 操作電腦瀏覽器的環境交互能力,有效促進了模型思考的寬度和深度,自然輸出的內容也就更全面了。這也是第一個 C 端可以使用的擁有強反思能力的 Agent 產品。目前,AutoGLM 沉思的平均思考步驟在 20 步以上,擁有處理複雜問題的能力。

目前上線的是「AutoGLM 沉思」Preview 版本,比較擅長 Research 相關場景。在未來的兩週,產品還將增加更多的 Agent 執行能力。

另一方面,「免費開放」的意義值得重視。以 OpenAI 的 Deep Research 為例,雖然功能上非常吸引人,但被驚豔到的也只是付費 200 美元購買了 Pro 套餐的那一波會員。而「AutoGLM 沉思」選擇「免費」開放給所有用戶,這延續了智譜的傳統,也瞬間打破了海外 AI 公司製定的高昂價格門檻。

「AutoGLM 沉思」背後

智譜在下一盤 Agent 的棋

在百舸爭流的技術大變革時代,模型能力的領先始終是智譜這家公司位於行業內的核心競爭力。在「AutoGLM 沉思」面世之前,智譜圍繞 Agent 的技術佈局已經持續多年。

可以說,這家公司見證、參與、引領了 Agent 技術的幾個重要發展階段:

智譜清言是最早具備 Function Call 能力的大模型應用。早在 2023 年 10 月,智譜就在當時的 ChatGLM3 基座大模型和智譜清言中引入了代碼交互能力,並支持 AgentTuning 技術,讓模型實現了自主規劃任務並調用工具完成任務。

2024 年初,伴隨著 GLM-4 的發佈,智譜清言上線了 GLMs 個性化智能體定製功能。用戶無需編程基礎,即可通過簡單的提示詞指令創建專屬智能體,並通過智能體中心分享和調用。

到了 2024 年底,智譜開放了「AutoGLM」。這是智譜第一個產品化的智能體 Agent,可以做到讓 AI 通過語音直接操縱硬件設備,還能跨不同 App 全局操作。

每一次更新,都伴隨著智譜在相關技術研發的突飛猛進。「AutoGLM 沉思版」的推出,意味著智譜 Agent 產品的又一次重大迭代,背後是更強大的基礎模型、推理、Agent 框架。

在這場發佈活動上,智譜透露了「AutoGLM 沉思」背後的關鍵技術進展:

技術演進路徑:GLM-4 基座模型 → GLM-Z1 推理模型 → GLM-Z1-Rumination 沉思模型 → AutoGLM 模型。

首先是推理模型 GLM-Z1-Air。GLM-Z1-Air 是智譜基於擴展強化學習技術訓練的新一代推理模型,面對複雜、開放問題,能夠進行推理和反思,為 Agent 提供了強大的推理、規劃與反思能力。其效果比肩 DeepSeek-R1,提速 8 倍,價格是 R1 的 1/30,可以在消費級顯卡上運行。

在性能表現上,GLM-Z1-Air 可以與 DeepSeek-R1(671B,激活 37B)媲美。智譜在 AIME 24/25、LiveCodeBench、GPQA 等基準測試中對 GLM-Z1-Air 進行了評估,評估結果顯示 GLM-Z1-Air 展現了較為強大的數理推理能力,為更多複雜任務的解決提供了支持。

GLM-Z1-Air 背後的基座模型是 GLM-4-Air-0414, 以 32B 參數量比肩更大參數量的國內外主流模型。它在預訓練階段加入了更多的推理類數據,並在對齊階段針對智能體能力進行了優化,在工具調用、聯網搜索、代碼等智能體任務上的能力得到大大加強。

在 GLM-Z1 的基礎上,智譜又通過強化學習訓練了沉思模型 GLM-Z1-Rumination,提升了模型結合工具使用完成長程推理能力。

同時,智譜在 MAAS 平台上將免費模型 GLM-4-Flash 的基座版本更新至 GLM-4-Flash-0414,並推出了對應的推理版本 GLM-Z1-Flash,在保留大部分效果的情況下更輕量級、更高速,完全免費調用,以適用於更廣泛的應用場景。

在落地進程方面,智譜也已經有了清晰的規劃:「智譜將專注於在 AGI 和基座模型研發方向,我們未來很長一段時間將專注於 Agentic GLM 相關模型技術的研發上。我們在基座模型上搭建智能體平台,以便幫助我們的生態夥伴調用智譜智能體的能力,打造基於行業、地域和場景的智能體應用。在行業生態方面,我們是模型廠商的佔位,我們希望幫助應用合作夥伴做出成功的大模型應用。在城市生態方面,我們依然是模型廠商的佔位,通過與當地龍頭企業合作來賦能當地產業升級與政務的智能化。」

「傳統的複雜工作流將不複存在」

技術和產品的飛速迭代,將為每一個人帶來什麼?

舉例來說,近日 OpenAI 為 GPT-4o 增加了原生的圖像生成功能,從網民的反饋到機器之心的親身體會,生成效果都可以說是「一騎絕塵」,不管是人物真實性還是內容一致性。對於「文生圖」這一賽道來說,GPT-4o 樹立了一個全新的標杆,讓所有的競爭對手又緊張了一下,也讓這條賽道重新活躍了起來。

更重要的是,它指出了 AI 正在不斷趨近理想中的狀態:「所有傳統的、複雜的工作流都將不再存在。」一句話 P 圖、一句話玩手機、一句話寫報告…… 不管是圖像的生成和持續編輯,還是設備操控,都指向這一終極形式。

因此,我們能夠看到「AutoGLM 沉思」所具備的劃時代的意義:當推理模型的「深度研究」結合 Agent 的「動手執行」,它能夠模擬人在面對複雜問題時的思考、能夠像人一樣感知這個世界、能夠像人一樣使用工具。

Chatbot 同樣具有交互性和功能性,而 Agent 與之最大的差異就是自主性和適應性。「AutoGLM 沉思」的價值在於,模型實現了自己決策操作過程,能夠通過連續、多步推理實現模型自主規劃,並通過反思實現動態調整,不需要提前設計工作流。

從此以後,我們不需要再設計複雜的智能體工作流。這就是自主智能體的雛形,不久後的我們,或許就能觸摸到 AI 作為生產力工具的理想形態。

就像領域內最近在討論的觀點:我們所有人都在一架上升的電梯里,你可以站著不動,也可以原地俯臥撐。但最終,都能輕鬆抵達那個曾經遙不可及的高點。