實測智譜AutoGLM沉思:用DeepSeek的方式干Manus的活,還全部免費?

週一笑|zhouyixiao@pingwest.com
Yoky|yokyliu@pingwest.com
當深度思考遇上Agent,真全能的AI來了?
智譜AI在OpenDay上發佈了全球首個集深度研究和操作執行於一體的Agent產品——AutoGLM沉思。有別於大多數隻會打嘴炮的AI,這款號稱「邊想邊干」的產品不僅能思考,還能實時操作瀏覽器,像真人一樣打開網頁、檢索信息、生成報告。
我們第一時間進行了一手評測,用三個實際工作場景測試後不得不說:這次不是PPT產品,這次是真的能用!
通用Agent一直面臨的最大難題是C端場景過於複雜多變,導致穩定性和準確性難以保證。智譜通過「先思考再執行」的策略解決了一部分準確性的痛點。AutoGLM沉思會先製定完整研究計劃,再一步步執行,最後進行系統總結,大大降低了幻覺率和操作失誤率。
AutoGLM沉思之所以能真能用,關鍵在於其背後的技術棧。它基於智譜自研的推理模型GLM-Z1-Air訓練,這個模型號稱性能比肩DeepSeek-R1,但速度提升最高8倍,價格僅需其1/30。深度推理能力讓它不僅能像OpenAI的Deep Research一樣進行深度思考,AutoGLM框架則賦予了它真實的操作能力,能自動瀏覽和操作網頁,獲取更多高質量信源。
而且對於打工人來說,AutoGLM沉思完全免費且不限次數使用,現場智譜用它演示了「如何賺到100塊錢」以及「14天小紅書起號計劃」,我們實測下來,AutoGLM沉思打破了「通用Agent等於玩具」的刻板印象,不過由於「邊想邊干」的工作方式,它完成一項複雜任務往往需要5-20分鐘不等,效率確實有待提高。但考慮到它能完成的任務複雜度和準確性,這個時間成本其實已經比人工低得多。
當深度調研與實際操作能力相結合,通用Agent終於要從概念走向實用了?
以下是矽星人針對自媒體常見三個場景:熱點分析、財務分析和計劃製定,對AutoGLM進行了實測。
一、熱搜話題評論分析
我讓AutoGLM沉思分析一下微博上關於「胖東來店長月薪近8萬」這個熱門話題的主要觀點、大概佔比和能得出什麼結論,AutoGLM沉思整個運作的過程如下。
本文影片均經過倍速處理
接到任務後,AutoGLM沉思先去瞭解了胖東來這家公司和這個話題的基本情況,確認了消息來源和薪資數據。它嘗試直接去微博抓取和分析討論,但好像遇到了點技術困難,可以抓取微博帖子,但沒法直接看大量的評論。

於是,它換了個思路,開始廣泛搜索相關的新聞報導、創始人於東來的發言、以及其他社交平台(像知乎、小紅書)上關於這個話題的討論和帖子。通過閱讀這些替代來源的信息,特別是小紅書上的一些帖子和評論。

最終還是給出了一個信息量豐富、邏輯清晰的分析報告。值得注意的是不僅回答了我的問題,還深挖了背景信息和商業邏輯,讓結論更有說服力。

從這個過程來看AutoGLM沉思挺靈活,路子堵了知道換條道走,最後還是把任務完成了。不足是因為沒直接看微博,觀點比例是靠其他平台的信息,沒有嚴格遵守用戶的要求,如果能直接處理微博數據,分析會更紮實。
二、特斯拉股票分析
我們讓AutoGLM深思做一份全面的特斯拉股票分析報告,要求包含財務、市場情緒、技術面、競品對比等方面。

AutoGLM深思接到任務後,先是蒐集了特斯拉的基本情況和最新動態,瞭解了大概的業績。然後它開始深入挖掘,找詳細的財務數據,雖然嘗試直接讀官方年報沒成功,但還是從其他財經網站把關鍵數據(像營收、利潤、現金流)扒拉出來了。接著,它又去查了分析師們怎麼看這隻股票、市場情緒怎麼樣、股價圖走勢如何,還重點比較了特斯拉和比亞迪等競爭對手的優劣。

最後,它把這些信息彙總起來,從價值投資的角度分析了潛力和風險,做了個SWOT總結,並針對不同類型的投資者給出了建議,形成了一份詳細的報告。

和上面熱搜評論分析的情況類似,AutoGLM深思能按照給出的框架一步步去蒐集和分析信息,覆蓋面很全。即使遇到信息獲取的小障礙(比如直接讀年報失敗),也能換個途徑把任務完成。不過整個過程看起來挺繁瑣,搜了很多次,花了些時間。
實際上這個股票分析的任務也是Manus的官方案例之一。
對比兩個產品完成任務的過程來看,Manus像一個自動化分析師 + 開發者。它明確地執行計劃、調用工具、獲取特定數據(如股價、財務指標)、進行計算(如DCF估值、技術指標)、生成圖表,並且過程非常透明,用戶能看到它一步步在做什麼。除了生成了詳細報告,還做出了一個交互式的數據看板。AutoGLM沉思在信息蒐集和總結方面做得不錯,但顯得工具化和分析能力稍弱一些。
三、日本七日遊旅行計劃
我們繼續讓AutoGLM沉思和Manus同題「打擂」,讓AutoGLM沉思規劃為一對美國公民規劃一個4月中從西雅圖出發的7天日本行程:預算在2500-5000美元,喜歡歷史文化(特別是劍道、茶道)、想看奈良的鹿,而且打算在這次旅行中求婚,需要推薦個特別地點,最後還要個簡單的網頁版旅行手冊。

接到任務後,AutoGLM沉思先去查了西雅圖到東京的航班大概價格和時間,確認了美國公民去日本不用簽證。然後它研究了在日本幾個城市間怎麼走最方便(主要是新幹線),接著就針對興趣點(歷史、文化體驗)去搜東京、京都、奈良的景點和活動,特別找到了東京可以體驗茶道和劍道的地方(從小紅書上找的信息)。還查了4月份天氣怎麼樣,並且根據別人的經驗推薦了東京塔下的公園作為求婚地點。

最後,它把這些信息整合起來,做了一個每天的詳細行程安排,加了些日語短語和旅行提示,還生成了一個簡單的HTML格式的旅行手冊,但可視化程度有限,基本上是提煉了一些要點。

總結
對比來看,AutoGLM沉思強項是資料獲取和信息收集,但過程有點「黑箱」,不太清楚它怎麼篩選信息、怎麼做的決策,但遇到問題知道換個法子試試,很喜歡小紅書這類社交平台,這讓它可能更擅長找到一些普通用戶分享的、非官方的、甚至有點「網紅」性質的地點或體驗。這可能是個優勢,能挖到那種更依賴官方或結構化數據的 AI 找不到的信息。對於想直接「抄作業」的用戶來說,可能更直接、更省事。
而Manus的過程更透明,用的方法更多樣,最後給的東西(行程、求婚指南、手冊分開)更規整、更專業。
整體來看,經過這次AutoGLM沉思的評測體驗,雖然有一些槽點,但不得不說,AutoGLM沉思給人的印象確實是勤奮得令人印象深刻,而且考慮到其免費特性,它很可能是你能接觸到的最好用的免費AI勞動力了。它就像一位不知疲倦的實習生,默默在後台為你蒐集信息、整合分析,而且完全免費。這意味著你可以放心嘗試各種不同場景,探索它的能力邊界。免費的最大好處就是極低的試錯成本,用戶可以放心地讓它嘗試各種不同的應用場景和任務。探索它的能力邊界。
當然,它也有明顯的短板。任務處理速度不算快,有時一個分析可能需要半小時以上。不過好在你不必乾等著,完全可以讓它在後台默默工作,自己去處理其他事情。唯一的小煩惱是,它會不時地自動打開新網頁,如果你正在Chrome瀏覽器中工作,可能會有些干擾。
這或許是人類與Agent之間的第一次「領地爭奪戰」——誰才是電腦的真正主人?(笑)