​實測新版通義 APP:更好用的個人 AI 助理,需要什麼?

正式併入阿里 AI To C 業務之後,通義有了新的動作。

最近,通義 App 全新升級——整合了上週剛剛開源的 QwQ-32B,並上線了人格化的智能體作為主產品要交互對象。

與 AI 大模型不同,「智能體」所強調的除了模型本身能力之外,多了目標導向的需求,通過感知環境、自主決策與執行動作,從而在真實環境中完成操作。

這次更新,可以說是通義 App 上線以來最重要的一次產品迭代。一方面,上週開源的 QwQ-32B,因為以更低的參數量實現了媲美 R1 的推理和通用能力,而被全球 AI 行業關注;另一方面,由於 Monica 團隊推出的 Manus 一夜爆火,智能體也是近期行業關注的焦點,人們期待看到更多可以影響真實世界的 AI 應用誕生。

而過去兩年,通義千問一直憑藉著模型能力本身,通過 AI 模型生成影片等方式,多次在全球社交媒體上「出圈」,因此也有很多人期待通義 APP 的這次更新,能真正做到整合阿里在模型領域的競爭優勢,在面向 C 端用戶的 App 應用場景中打造爆款。

當然,路遙知馬力,通義 App 這次能否在用戶體驗上帶來驚喜,還是要試試才知道。

01

實測效果

如其名,QwQ-32B 是一款擁有 320 億參數的大模型,但阿裡通過基礎模型 + 大規模強化學習的方式,在前代模型的基礎上實現性能提升。

在此前開源版本的基準測試中就已經能看出,其數學推理、編程能力以及通用能力,已經可與具備 6710 億參數的 DeepSeek-R1 媲美。

在保持強勁性能的同時,千問 QwQ-32B 還大幅降低了部署使用成本,在消費級顯卡上也能實現本地部署。

本次更新之後,通義 App 首頁就能看到千問 QwQ-32B 的應用,同時提供了多個能夠體現深度思考能力的問題供用戶體驗

整合深度思考能力的通義 App,在面對如「若 A=5,B=3*A,C=B+2,求 C 的值」這樣的數學邏輯問題,亦或是「分析《哪吒 2》三個關鍵角色的 MBTI 這樣根據互聯網內容」「把橙汁加進牛奶里」這樣結合知識庫的解答問題。

在實際的問題測試中,深度思考讓通義 App 成功通過了數學題這樣的基準測試理解,同時也展示出了針對現實物理現象的推導能力,同時相比於同期其他模型的回答,通義 App 更強調對結果的複核以及謹慎列出其他可能的特徵。

比如在處理另一個容易誤導 AI 的經典問題「為什麼爸媽結婚沒有叫我參加婚禮?」時,通義 App 成功識別到其中的邏輯漏洞,但仍然從「時間因素」以及「婚禮習俗」等角度,謹慎地為這個明顯看起來很「抽像」的問題,絞盡腦汁地幫你從各種角度,想出了更多可能性。

QwQ-32B 處理問題時展現出了更強的邏輯性以及對回答更謹慎的態度 | 圖片來源:極客公園QwQ-32B 處理問題時展現出了更強的邏輯性以及對回答更謹慎的態度 | 圖片來源:極客公園

不過上面也提到,QwQ-32B 模型本身的強大,並不是構成「超級智能體」的全部要素。隨著大模型應用在端側設備上的整合越來越深入,「不同任務不同模型」的這個邏輯概念也被越來越多人所熟知。

首先從模型能力上來說,通義 App 這個超級智能體是一個復合模型,比如問答、聊天等等調用的都是阿里不同的模型能力,例如代碼、翻譯、邏輯推理這些就是調用的通義千問的旗艦模型 Qwen2.5-MAX。

除了模型能力本身,本次通義 App 更新的另一個重點,則是聚焦在了 App 本身:這在近兩年 AI 應用能力軍備競賽如火如荼的情況下,是一個很罕見的情況,但因此也更加值得關注。

新版通義 App 將主頁設計分為了三部分,左滑右滑對應著不同的功能。首頁左滑是歷史記錄,包括聊過的智能體、對話記錄等,便於高效管理與資產沉澱。右滑則進入通義豐富的智能體生態,覆蓋學習、工作、娛樂等多元場景。類似拍照講題、思維導圖這樣新增的功能,在首頁的輸入欄上方就能找到。

新版通義 App 主要可交互界面分為左滑/右滑兩個頁面 | 圖片來源:極客公園新版通義 App 主要可交互界面分為左滑/右滑兩個頁面 | 圖片來源:極客公園

在首頁,通義 App 還增加了一個可愛的「鄰家女孩」,作為此前以科研、代碼能力專長的通義千問大模型產品中,從未出現過的 AI 陪伴形象,用戶可以通過與她的對話,直接使用到 QwQ-32B 的全部能力。

除了新形象之外,在右滑之後進入到的界面中,你能找到各種對應具體應用場景的模型能力,例如「健康顧問」「AI 擴圖」這樣的重要但小到不會有人專為其開發 App 的場景。都被通義 App 整合到了這個「工具箱」中。用戶還可以在這裏根據自己的具體使用需求,創建屬於自己的智能體:例如讓模型模仿某個劇中的角色,或是利用模型能力,創建各種娛樂遊戲。

除此之外,通義 App 就沒有其他的主要交互方式了,所有內容被濃縮在這三大頁面中,讓已經習慣當代各種應用層層嵌套操作邏輯的我,甚至一時間都沒有適應這種突如其來的簡潔。

按照官方開發人員的介紹,未來通義 App 還會繼續在 App 中塞入更多 AI 能力,但不會跳出這「三大頁面」的框架。未來,通義 App 還能實現根據用戶的問題,自動識別到應該調用哪個具體的智能體。

這個變化,有體驗新版通義 App 後的網民感慨說,通義 App 讓「最強 AI 飛入尋常百姓家」。

02

行業意義

在軟件領域,「殺手級應用」(Killer App)是一個已經頗有年頭的名詞。按照通義 App 的說法,「殺手級應用」的定義是「一種具有顛覆性吸引力或功能」的 App。

按照這個定義,實際上 ChatGPT 之後,AI ToC 應用生態直到目前,都還沒有產生真正的「殺手級應用」。

這一現象與 2025 年 AI Agent 的爆火背道而馳,AI Agent「代替你做一切」概念的出現,其實反而倒逼著大模型應用在體驗上要做到「更好用」:不僅能聊,還要在類似幫用戶規劃行程、查找資料等相關場景中,體現出「超級入口」應有的智能。

「AI 即 APP」最大的挑戰在於用戶習慣的改變——畢竟,不是每個人都願意為一個個 AI 單獨下載一個又一個的 APP,甚至更習慣在已有的 APP 里順手調用 AI。

對於通義 App 團隊來講,他們或許是讓用戶感受到「這個超級智能體什麼都會幹」;不僅能問能聊能寫作,能生圖能拍圖能翻譯這些基礎需求,還能在此基礎上,做到更多基於用戶個人需求專屬定製的智能化。

03

總結

「智能體」這一概念,從誕生一開始,就以追求目標導向為設計指標。

對於通義 App 來講,無論是更強悍的基座模型,還是「可愛的鄰家女孩」,都是在這個目標導向下所作出的努力,為了讓 AI App 變得更智能,真正成為一個滿足用戶預期的超級入口。

一個讓用戶足夠方便的 AI App,並不只是一個簡單的提效工具,更將會成為我們的「數字世界代理人」。

隨著模型能力的逐步提升,個人 AI 助理這個概念能做到的事,也在逐漸變得更多。

或許,隨著 AI Agent 進化到極致,我們甚至將不再需要一個可以用於觸控的 UI:無論是 AI 應用早期出現的 Rabbit R1,還是近期爆火的 Manus AI,這些 AI Agent 產品,實際上都是通向這個目標的不同階段。通義 App 實際上也是在這個方向上,向著成為一個更好用的產品,又邁進了堅實的一步。