先讓不懂代碼的來測？通義這個新產品，代碼剛寫完，預覽就出來了

10月28日 12:22 新浪網 news-china-auto-hilite

機器之心原創

機器之心編輯部

這才是未來 AI 該有的樣子？

奇怪了。

一款 AI 代碼工具剛發佈，限量測試卻要求「不懂代碼」的人優先。

10 月 24 日，阿里旗下的通義正式宣佈了「代碼模式」，並開放試用預約，首批邀請 1024 名用戶進行體驗。

通義代碼模式旨在降低應用開發的門檻。它針對簡單的代碼和應用生成需求，主打一個所見即所得。

具體來說，人與 AI 大模型的交流現在會出現在一個專門的窗口裡，AI 大模型生成的代碼會實時地在網頁上跑出來以供預覽。

因此，非專業程序員優先是本次測試的特別要求。

這是國內首家實現「讓使用者一句話編程，並實時生成可見預覽」的公司，通義代碼模式的出現，或許代表著一種未來新趨勢。

言聽計從，不用吵架

24 小時隨時等需求的「貼身程序員」來了

最近一段時間，大模型技術正在加速進入下半場。各家科技巨頭、AI 創業公司在發展新一代模型的同時，也在不斷探索大模型的應用方式。

上週，消費級產品領域曝出了一系列新產品，微軟發佈的「商業智能體」旨在包攬人們在銷售、客服、財務、供應鏈團隊的工作；Anthropic 提出的升級版 Claude 3.5 Sonnet 則主打一個「AI 自己操縱電腦」；在手機端，榮耀提出智能終端的「自動駕駛」，似乎讓手機具備了全局跨 App 自動操縱的能力。

通義代碼模式，則預示著在生產的一側，開發領域的新一輪迭代。

在實時可預覽代碼模式出現之前，我們即使是使用 ChatGPT 等行業頂尖的大模型來寫代碼，也必須遵循這樣的路徑：1）先想好與 AI 溝通的措辭提出需求；2）複製 AI 生成的代碼，嘗試在外部開發環境中運行；3）繼續追問大模型，不斷修改代碼並嘗試運行，直到最終獲得滿意的結果為止。

現在有了通義代碼模式，你在敘述完具體功能需求後，系統會創建一個工作空間，AI 在其中與你協同工作。在後續對話過程中，AI 可以實時查看你的新要求，持續編輯代碼。問題隨時解決，效果實時呈現，就像是在現實世界中的多人協作一樣。

而且，AI 還永遠不會與你 battle。

ChatGPT 剛剛爆發時人們曾預測，AI 大模型先解放的將會是軟件開發。現在看來，我們距離實現這個理想又更近了一步。

我們看到，使用通義代碼模式可以搗鼓出各種不同的應用。比如生成一個貪吃蛇小遊戲：

帶有一定複雜規則的格鬥遊戲：

甚至還有音樂播放器：

通義產品經理王曉明表示，代碼模式的提出主要是來自於用戶需求。通義大模型的代碼能力屬於業界領先，每天有大量程序員在使用通義進行代碼生成和代碼解釋等任務。此外，他們發現還有不少不懂代碼的用戶會有創建應用、網頁等需求。

與通義靈碼、AI 程序員主要面向資深程序員的深度編碼場景不同，通義代碼模式提供了一種新的交互方式，針對簡單的代碼和應用生成需求，為用戶創建一個動態的窗口，將生成的代碼文件直接在網頁上渲染成應用。

從「通義靈碼」到「AI 程序員」再到「通義代碼模式」到底迭代了什麼？至此，答案就呼之慾出了：

第一是人與 AI 的高度協作。你負責提出想法，調整參數，AI 負責來實現。在這個過程中，若遇到任何問題，用戶都可以隨時與大模型進行溝通，從而充分發揮人與 AI 各自的優勢。
第二是結果直觀可視化。即使是沒有開發經驗的人，也能夠通過可視化的演示知道 AI 生成的代碼是否跑通了。這樣每個人都可以不再限於自己的技術背景，能夠快速地實現一些新想法。
最後，不論是人與 AI 的交互，還是代碼生成的結果，都是實時的。這樣的工作流程大幅提升了效率。

「這相當於讓用戶擁有一個 24 小時隨時提需求的『貼身程序員』，不用排期、隨時上線，且能滿足你專屬需求。」王曉明類比說。他還透露，阿里內部的開發者每天都在讓通義協助完成大量的代碼任務，從簡單的代碼排查、生成和解釋，到更深入的代碼文件輔助生成。「有些同事甚至直接用通義代碼模式複刻出了小時候玩的掌機、小霸王上的一些小遊戲，比如坦克大戰、俄羅斯方塊、飛機大戰等。」

基於 Qwen 2.5

通義代碼模式還在持續進化

任何一款好用的 AI 產品都離不開背後足夠聰明的大模型，通義代碼模式也是如此。它基於 Qwen 2.5 大模型進行開發。如果你一直在關注大模型領域的動態，會發現 Qwen 大模型最近的熱度正在持續提高。

在 9 月底，全球開源社區基於 Qwen 系列二次開發的衍生模型數量已經超過了 Llama 系列，達到了 7.4 萬。在 LiveBench 排行榜上，該模型的編碼能力得分超過了 OpenAI 的 o1 模型，曾經躋身排行榜第二。在 Chatbot Arena 榜單上，該模型也能排到第五。

而且除了跑分，這個模型在國內外開發者中的口碑也非常好。

無論是在性能方面，還是在影響力方面，Qwen 都已經獲得了充分的認可。

通義代碼模式的出現，則讓 Qwen 2.5 在多個方面充分發揮了自己的潛力。具體來說，代碼模式一方面需要基於模型的意圖識別和指令理解能力，將涉及到代碼的用戶意圖精準識別出來，另一方面也需要將代碼生成能力進行提升。有了 Qwen 2.5 做基礎，通義代碼模式在代碼生成、推理和修復等能力方面表現非常優秀，能夠支持 40 多種編程語言。

此外，通義代碼模式的代碼能力相比常規模式有 30% 以上的顯著提升，在代碼場景下表現極為優秀的同時，也具備很強的數學和通用能力。

在完成意圖的理解和代碼的生成之後，通義代碼模式還需要將代碼文件渲染成小遊戲、網頁和數據圖表等各類應用，並且支持直接對代碼的編輯修改（如轉換語言、添加註釋、問答等）。

這其中最大的難點就在代碼渲染層面。為了儘可能擴大代碼成功渲染為各類應用的範圍，通義的團隊需要對用戶需求進行深入調研，並且針對主要的幾大類場景進行優化，以確保滿足用戶的實際使用需求。其中涉及到意圖理解、模型調優、前端渲染組件適配等一系列複雜的工作。

王曉明表示，通義代碼模式目前可以實現大多數隻依賴前端渲染的應用生成任務，對於更複雜的前後端代碼，目前可以實現長篇的代碼片段生成作為輔助。未來，該模式會進一步與 IDE 進行深度結合，幫助用戶完成更加完整的前後端系統代碼生成，實現更加複雜的應用類型生成。

這才是未來 AI 該有的樣子？

通義代碼模式選擇的人機交互範式，可謂如今各路大模型公司主攻的新方向。

從理念上來說，這一模式與國外知名 AI 公司 Anthropic 提出的新功能 Artifacts 以及 OpenAI 發佈的 ChatGPT with Canvas 不謀而合。或者，從某種程度上來說，通義代碼模式更像是集合了二者的優勢。

Artifacts 的最大特點在於實時預覽。長期以來，大型語言模型一直能夠生成代碼，但在 GitHub 和 Copilot 等人工智能輔助開發環境之外，執行生成的代碼通常需要額外的步驟。這些步驟讓開發人員感覺繁瑣，也把非開發人員擋在了門檻之外。在單獨的窗口中保存和運行代碼，可以帶來方便、即時的體驗。同樣，在生成圖像和其他可視化輸出時也是如此。

所以，在 Artifacts 問世之際，很多人將其稱為「本年度最重要的 AI 功能」、「Claude AI 最有用的功能」…… 還有人評價說，它「比 GPT-4o 還要震撼，這才是未來 AI 的樣子」。

不過，Artifacts 也有一些不方便的地方，比如對於編程語言之間的自動轉換、註釋的添加還沒有做到很好的支持。OpenAI 隨後發佈的 ChatGPT with Canvas 倒是提供了這些功能，但並不支持代碼預覽和應用生成，前面提到的種種問題依然存在。

通義代碼模式更像是二者的結合體。它能夠實現類似 Claude Artifacts 的代碼生成和預覽功能，並且還支持 Claude 不具備的代碼編輯、添加註釋、轉換語言等功能，可以一步到位實現小遊戲、網頁、數據圖表等各類應用的預覽和使用，所觸及的人群更加廣泛。

同時，為了讓那些不會寫指令的用戶直接創建應用，通義代碼模式預置了一批提前生成好的小遊戲和應用，用戶可以直接使用。如果需要修改，用戶只需要簡單改一下指令，就能生成符合自己需要的應用。

如果說，未來的人類社會不可避免地走向人機協作，那麼真正的挑戰不僅在於如何打造更智能的 AI，還在於如何讓這種智能易於獲取、直觀自然，並能無縫融入現有的工作流程。

在大模型之爭的上半場，大多數企業都在關注前者。如今到了下半場，關注後者的企業將變得越來越多，OpenAI、Anthropic、阿裡通義都屬於行動較早的那一撥。

最後，關於「為什麼要招募不懂代碼的用戶做測試」，王曉明回答說，「不懂代碼的人更關注的是能否使用 AI 生成自己需要的各類應用，比如搭建個人博客、生成貪吃蛇小遊戲、編寫數據圖表等，甚至還有用戶希望用通義來生成一個表白網站的。對於這些用戶來說，更重要的是應用生成的簡便程度和可用性，而不是底層的代碼實現邏輯。」

從實際使用場景出發，只需要用「大白話敘述」就能構建起符合我們需要的應用，這樣的工具才是真正能夠提升效率的工具，能夠讓更多的人用起來。

因此，「通義代碼模式」用戶的大頭可以不是程序員，可以是學生、老師、數據分析師，自媒體從業者…… 測試者自然要更貼近這些人。

聽起來，這會是一場非常有趣的測試，得到的洞察也會非常豐富。

如果你也想參與測試，可以在通義 App 或者通義 PC 頁面對話框輸入「1024」進行預約。期待大家的測試反饋。