實測新版通義 APP：更好用的個人 AI 助理，需要什麼？

正式併入阿里 AI To C 業務之後，通義有了新的動作。

最近，通義 App 全新升級——整合了上週剛剛開源的 QwQ-32B，並上線了人格化的智能體作為主產品要交互對象。

與 AI 大模型不同，「智能體」所強調的除了模型本身能力之外，多了目標導向的需求，通過感知環境、自主決策與執行動作，從而在真實環境中完成操作。

這次更新，可以說是通義 App 上線以來最重要的一次產品迭代。一方面，上週開源的 QwQ-32B，因為以更低的參數量實現了媲美 R1 的推理和通用能力，而被全球 AI 行業關注；另一方面，由於 Monica 團隊推出的 Manus 一夜爆火，智能體也是近期行業關注的焦點，人們期待看到更多可以影響真實世界的 AI 應用誕生。

而過去兩年，通義千問一直憑藉著模型能力本身，通過 AI 模型生成影片等方式，多次在全球社交媒體上「出圈」，因此也有很多人期待通義 APP 的這次更新，能真正做到整合阿里在模型領域的競爭優勢，在面向 C 端用戶的 App 應用場景中打造爆款。

當然，路遙知馬力，通義 App 這次能否在用戶體驗上帶來驚喜，還是要試試才知道。

實測效果

如其名，QwQ-32B 是一款擁有 320 億參數的大模型，但阿裡通過基礎模型 + 大規模強化學習的方式，在前代模型的基礎上實現性能提升。

在此前開源版本的基準測試中就已經能看出，其數學推理、編程能力以及通用能力，已經可與具備 6710 億參數的 DeepSeek-R1 媲美。

在保持強勁性能的同時，千問 QwQ-32B 還大幅降低了部署使用成本，在消費級顯卡上也能實現本地部署。

本次更新之後，通義 App 首頁就能看到千問 QwQ-32B 的應用，同時提供了多個能夠體現深度思考能力的問題供用戶體驗。

整合深度思考能力的通義 App，在面對如「若 A=5，B=3*A，C=B+2，求 C 的值」這樣的數學邏輯問題，亦或是「分析《哪吒 2》三個關鍵角色的 MBTI 這樣根據互聯網內容」「把橙汁加進牛奶里」這樣結合知識庫的解答問題。

在實際的問題測試中，深度思考讓通義 App 成功通過了數學題這樣的基準測試理解，同時也展示出了針對現實物理現象的推導能力，同時相比於同期其他模型的回答，通義 App 更強調對結果的複核以及謹慎列出其他可能的特徵。

比如在處理另一個容易誤導 AI 的經典問題「為什麼爸媽結婚沒有叫我參加婚禮？」時，通義 App 成功識別到其中的邏輯漏洞，但仍然從「時間因素」以及「婚禮習俗」等角度，謹慎地為這個明顯看起來很「抽像」的問題，絞盡腦汁地幫你從各種角度，想出了更多可能性。

QwQ-32B 處理問題時展現出了更強的邏輯性以及對回答更謹慎的態度｜圖片來源：極客公園

不過上面也提到，QwQ-32B 模型本身的強大，並不是構成「超級智能體」的全部要素。隨著大模型應用在端側設備上的整合越來越深入，「不同任務不同模型」的這個邏輯概念也被越來越多人所熟知。

首先從模型能力上來說，通義 App 這個超級智能體是一個復合模型，比如問答、聊天等等調用的都是阿里不同的模型能力，例如代碼、翻譯、邏輯推理這些就是調用的通義千問的旗艦模型 Qwen2.5-MAX。

除了模型能力本身，本次通義 App 更新的另一個重點，則是聚焦在了 App 本身：這在近兩年 AI 應用能力軍備競賽如火如荼的情況下，是一個很罕見的情況，但因此也更加值得關注。

新版通義 App 將主頁設計分為了三部分，左滑右滑對應著不同的功能。首頁左滑是歷史記錄，包括聊過的智能體、對話記錄等，便於高效管理與資產沉澱。右滑則進入通義豐富的智能體生態，覆蓋學習、工作、娛樂等多元場景。類似拍照講題、思維導圖這樣新增的功能，在首頁的輸入欄上方就能找到。

新版通義 App 主要可交互界面分為左滑/右滑兩個頁面 | 圖片來源：極客公園

在首頁，通義 App 還增加了一個可愛的「鄰家女孩」，作為此前以科研、代碼能力專長的通義千問大模型產品中，從未出現過的 AI 陪伴形象，用戶可以通過與她的對話，直接使用到 QwQ-32B 的全部能力。

除了新形象之外，在右滑之後進入到的界面中，你能找到各種對應具體應用場景的模型能力，例如「健康顧問」「AI 擴圖」這樣的重要但小到不會有人專為其開發 App 的場景。都被通義 App 整合到了這個「工具箱」中。用戶還可以在這裏根據自己的具體使用需求，創建屬於自己的智能體：例如讓模型模仿某個劇中的角色，或是利用模型能力，創建各種娛樂遊戲。

除此之外，通義 App 就沒有其他的主要交互方式了，所有內容被濃縮在這三大頁面中，讓已經習慣當代各種應用層層嵌套操作邏輯的我，甚至一時間都沒有適應這種突如其來的簡潔。

按照官方開發人員的介紹，未來通義 App 還會繼續在 App 中塞入更多 AI 能力，但不會跳出這「三大頁面」的框架。未來，通義 App 還能實現根據用戶的問題，自動識別到應該調用哪個具體的智能體。

這個變化，有體驗新版通義 App 後的網民感慨說，通義 App 讓「最強 AI 飛入尋常百姓家」。

行業意義

在軟件領域，「殺手級應用」（Killer App）是一個已經頗有年頭的名詞。按照通義 App 的說法，「殺手級應用」的定義是「一種具有顛覆性吸引力或功能」的 App。

按照這個定義，實際上 ChatGPT 之後，AI ToC 應用生態直到目前，都還沒有產生真正的「殺手級應用」。

這一現象與 2025 年 AI Agent 的爆火背道而馳，AI Agent「代替你做一切」概念的出現，其實反而倒逼著大模型應用在體驗上要做到「更好用」：不僅能聊，還要在類似幫用戶規劃行程、查找資料等相關場景中，體現出「超級入口」應有的智能。

「AI 即 APP」最大的挑戰在於用戶習慣的改變——畢竟，不是每個人都願意為一個個 AI 單獨下載一個又一個的 APP，甚至更習慣在已有的 APP 里順手調用 AI。

對於通義 App 團隊來講，他們或許是讓用戶感受到「這個超級智能體什麼都會幹」；不僅能問能聊能寫作，能生圖能拍圖能翻譯這些基礎需求，還能在此基礎上，做到更多基於用戶個人需求專屬定製的智能化。

總結

「智能體」這一概念，從誕生一開始，就以追求目標導向為設計指標。

對於通義 App 來講，無論是更強悍的基座模型，還是「可愛的鄰家女孩」，都是在這個目標導向下所作出的努力，為了讓 AI App 變得更智能，真正成為一個滿足用戶預期的超級入口。

一個讓用戶足夠方便的 AI App，並不只是一個簡單的提效工具，更將會成為我們的「數字世界代理人」。

隨著模型能力的逐步提升，個人 AI 助理這個概念能做到的事，也在逐漸變得更多。

或許，隨著 AI Agent 進化到極致，我們甚至將不再需要一個可以用於觸控的 UI：無論是 AI 應用早期出現的 Rabbit R1，還是近期爆火的 Manus AI，這些 AI Agent 產品，實際上都是通向這個目標的不同階段。通義 App 實際上也是在這個方向上，向著成為一個更好用的產品，又邁進了堅實的一步。

你可能喜歡