先讓不懂代碼的來測?通義這個新產品,代碼剛寫完,預覽就出來了

機器之心原創

機器之心編輯部

這才是未來 AI 該有的樣子?

奇怪了。

一款 AI 代碼工具剛發佈,限量測試卻要求「不懂代碼」的人優先。

10 月 24 日,阿里旗下的通義正式宣佈了「代碼模式」,並開放試用預約,首批邀請 1024 名用戶進行體驗。

通義代碼模式旨在降低應用開發的門檻。它針對簡單的代碼和應用生成需求,主打一個所見即所得。

具體來說,人與 AI 大模型的交流現在會出現在一個專門的窗口裡,AI 大模型生成的代碼會實時地在網頁上跑出來以供預覽。

因此,非專業程序員優先是本次測試的特別要求。

這是國內首家實現「讓使用者一句話編程,並實時生成可見預覽」的公司,通義代碼模式的出現,或許代表著一種未來新趨勢。

言聽計從,不用吵架

24 小時隨時等需求的「貼身程序員」來了

最近一段時間,大模型技術正在加速進入下半場。各家科技巨頭、AI 創業公司在發展新一代模型的同時,也在不斷探索大模型的應用方式。

上週,消費級產品領域曝出了一系列新產品,微軟發佈的「商業智能體」旨在包攬人們在銷售、客服、財務、供應鏈團隊的工作;Anthropic 提出的升級版 Claude 3.5 Sonnet 則主打一個「AI 自己操縱電腦」;在手機端,榮耀提出智能終端的「自動駕駛」,似乎讓手機具備了全局跨 App 自動操縱的能力。

通義代碼模式,則預示著在生產的一側,開發領域的新一輪迭代。

在實時可預覽代碼模式出現之前,我們即使是使用 ChatGPT 等行業頂尖的大模型來寫代碼,也必須遵循這樣的路徑:1)先想好與 AI 溝通的措辭提出需求;2)複製 AI 生成的代碼,嘗試在外部開發環境中運行;3)繼續追問大模型,不斷修改代碼並嘗試運行,直到最終獲得滿意的結果為止。

現在有了通義代碼模式,你在敘述完具體功能需求後,系統會創建一個工作空間,AI 在其中與你協同工作。在後續對話過程中,AI 可以實時查看你的新要求,持續編輯代碼。問題隨時解決,效果實時呈現,就像是在現實世界中的多人協作一樣。

而且,AI 還永遠不會與你 battle。

ChatGPT 剛剛爆發時人們曾預測,AI 大模型先解放的將會是軟件開發。現在看來,我們距離實現這個理想又更近了一步。

我們看到,使用通義代碼模式可以搗鼓出各種不同的應用。比如生成一個貪吃蛇小遊戲:

帶有一定複雜規則的格鬥遊戲:

甚至還有音樂播放器:

通義產品經理王曉明表示,代碼模式的提出主要是來自於用戶需求。通義大模型的代碼能力屬於業界領先,每天有大量程序員在使用通義進行代碼生成和代碼解釋等任務。此外,他們發現還有不少不懂代碼的用戶會有創建應用、網頁等需求。

與通義靈碼、AI 程序員主要面向資深程序員的深度編碼場景不同,通義代碼模式提供了一種新的交互方式,針對簡單的代碼和應用生成需求,為用戶創建一個動態的窗口,將生成的代碼文件直接在網頁上渲染成應用。

從「通義靈碼」到「AI 程序員」再到「通義代碼模式」到底迭代了什麼?至此,答案就呼之慾出了: 

  • 第一是人與 AI 的高度協作。你負責提出想法,調整參數,AI 負責來實現。在這個過程中,若遇到任何問題,用戶都可以隨時與大模型進行溝通,從而充分發揮人與 AI 各自的優勢。

  • 第二是結果直觀可視化。即使是沒有開發經驗的人,也能夠通過可視化的演示知道 AI 生成的代碼是否跑通了。這樣每個人都可以不再限於自己的技術背景,能夠快速地實現一些新想法。

  • 最後,不論是人與 AI 的交互,還是代碼生成的結果,都是實時的。這樣的工作流程大幅提升了效率。

「這相當於讓用戶擁有一個 24 小時隨時提需求的『貼身程序員』,不用排期、隨時上線,且能滿足你專屬需求。」王曉明類比說。他還透露,阿里內部的開發者每天都在讓通義協助完成大量的代碼任務,從簡單的代碼排查、生成和解釋,到更深入的代碼文件輔助生成。「有些同事甚至直接用通義代碼模式複刻出了小時候玩的掌機、小霸王上的一些小遊戲,比如坦克大戰、俄羅斯方塊、飛機大戰等。」

基於 Qwen 2.5

通義代碼模式還在持續進化

任何一款好用的 AI 產品都離不開背後足夠聰明的大模型,通義代碼模式也是如此。它基於 Qwen 2.5 大模型進行開發。如果你一直在關注大模型領域的動態,會發現 Qwen 大模型最近的熱度正在持續提高。

在 9 月底,全球開源社區基於 Qwen 系列二次開發的衍生模型數量已經超過了 Llama 系列,達到了 7.4 萬。在 LiveBench 排行榜上,該模型的編碼能力得分超過了 OpenAI 的 o1 模型,曾經躋身排行榜第二。在 Chatbot Arena 榜單上,該模型也能排到第五。

而且除了跑分,這個模型在國內外開發者中的口碑也非常好。

無論是在性能方面,還是在影響力方面,Qwen 都已經獲得了充分的認可。

通義代碼模式的出現,則讓 Qwen 2.5 在多個方面充分發揮了自己的潛力。具體來說,代碼模式一方面需要基於模型的意圖識別和指令理解能力,將涉及到代碼的用戶意圖精準識別出來,另一方面也需要將代碼生成能力進行提升。有了 Qwen 2.5 做基礎,通義代碼模式在代碼生成、推理和修復等能力方面表現非常優秀,能夠支持 40 多種編程語言。

此外,通義代碼模式的代碼能力相比常規模式有 30% 以上的顯著提升,在代碼場景下表現極為優秀的同時,也具備很強的數學和通用能力。

在完成意圖的理解和代碼的生成之後,通義代碼模式還需要將代碼文件渲染成小遊戲、網頁和數據圖表等各類應用,並且支持直接對代碼的編輯修改(如轉換語言、添加註釋、問答等)。

這其中最大的難點就在代碼渲染層面。為了儘可能擴大代碼成功渲染為各類應用的範圍,通義的團隊需要對用戶需求進行深入調研,並且針對主要的幾大類場景進行優化,以確保滿足用戶的實際使用需求。其中涉及到意圖理解、模型調優、前端渲染組件適配等一系列複雜的工作。

王曉明表示,通義代碼模式目前可以實現大多數隻依賴前端渲染的應用生成任務,對於更複雜的前後端代碼,目前可以實現長篇的代碼片段生成作為輔助。未來,該模式會進一步與 IDE 進行深度結合,幫助用戶完成更加完整的前後端系統代碼生成,實現更加複雜的應用類型生成。

這才是未來 AI 該有的樣子?

通義代碼模式選擇的人機交互範式,可謂如今各路大模型公司主攻的新方向。

從理念上來說,這一模式與國外知名 AI 公司 Anthropic 提出的新功能 Artifacts 以及 OpenAI 發佈的 ChatGPT with Canvas 不謀而合。或者,從某種程度上來說,通義代碼模式更像是集合了二者的優勢。

Artifacts 的最大特點在於實時預覽。長期以來,大型語言模型一直能夠生成代碼,但在 GitHub 和 Copilot 等人工智能輔助開發環境之外,執行生成的代碼通常需要額外的步驟。這些步驟讓開發人員感覺繁瑣,也把非開發人員擋在了門檻之外。在單獨的窗口中保存和運行代碼,可以帶來方便、即時的體驗。同樣,在生成圖像和其他可視化輸出時也是如此。

所以,在 Artifacts 問世之際,很多人將其稱為「本年度最重要的 AI 功能」、「Claude AI 最有用的功能」…… 還有人評價說,它「比 GPT-4o 還要震撼,這才是未來 AI 的樣子」。

不過,Artifacts 也有一些不方便的地方,比如對於編程語言之間的自動轉換、註釋的添加還沒有做到很好的支持。OpenAI 隨後發佈的 ChatGPT with Canvas 倒是提供了這些功能,但並不支持代碼預覽和應用生成,前面提到的種種問題依然存在。

通義代碼模式更像是二者的結合體。它能夠實現類似 Claude Artifacts 的代碼生成和預覽功能,並且還支持 Claude 不具備的代碼編輯、添加註釋、轉換語言等功能,可以一步到位實現小遊戲、網頁、數據圖表等各類應用的預覽和使用,所觸及的人群更加廣泛。

同時,為了讓那些不會寫指令的用戶直接創建應用,通義代碼模式預置了一批提前生成好的小遊戲和應用,用戶可以直接使用。如果需要修改,用戶只需要簡單改一下指令,就能生成符合自己需要的應用。

如果說,未來的人類社會不可避免地走向人機協作,那麼真正的挑戰不僅在於如何打造更智能的 AI,還在於如何讓這種智能易於獲取、直觀自然,並能無縫融入現有的工作流程。

在大模型之爭的上半場,大多數企業都在關注前者。如今到了下半場,關注後者的企業將變得越來越多,OpenAI、Anthropic、阿裡通義都屬於行動較早的那一撥。

最後,關於「為什麼要招募不懂代碼的用戶做測試」,王曉明回答說,「不懂代碼的人更關注的是能否使用 AI 生成自己需要的各類應用,比如搭建個人博客、生成貪吃蛇小遊戲、編寫數據圖表等,甚至還有用戶希望用通義來生成一個表白網站的。對於這些用戶來說,更重要的是應用生成的簡便程度和可用性,而不是底層的代碼實現邏輯。」

從實際使用場景出發,只需要用「大白話敘述」就能構建起符合我們需要的應用,這樣的工具才是真正能夠提升效率的工具,能夠讓更多的人用起來。

因此,「通義代碼模式」用戶的大頭可以不是程序員,可以是學生、老師、數據分析師,自媒體從業者…… 測試者自然要更貼近這些人。

聽起來,這會是一場非常有趣的測試,得到的洞察也會非常豐富。

如果你也想參與測試,可以在通義 App 或者通義 PC 頁面對話框輸入「1024」進行預約。期待大家的測試反饋。