看圖寫代碼,3毛錢開發一個網頁,字節AI Coding新模型真卷麻了

編程模型最新卷王來了。

就在今天,火山引擎推出了面向Agentic編程任務深度優化的全新代碼模型Doubao-Seed-Code

三個不同的維度,捲出了新高度。

第一,性能SOTA,與TRAE開發環境深度結合後,能更快、更準地解決問題,登頂了SWE-Bench Verified榜單。

第二,價格,調用價格國內最低,火山引擎還配套推出9塊9套餐,一杯咖啡錢,就能搞掂各種摸魚小遊戲——比如辦公室躲老闆(doge)。

最後,遷移成本——Doubao-Seed-Code原生兼容Anthropic API,在Claude Code環境中進行遷移,都不用做複雜的配置,幾乎就是零成本切換。

不過說歸說鬧歸鬧,最後還得看實測效果。

咱實測一波看看……

實測Doubao-Seed-Code

老樣子,Coding測試,咱先設置幾個進階任務,看看能力究竟幾斤幾兩。

首先是基礎功能,然後交互優化,接著工程化重構,最後完整網站設計……

邏輯上層層遞進,難度上從單一視覺實現到複雜問題解決,逐步考驗Doubao-Seed-Code的綜合能力。

第一階段聚焦簡單任務,看看它的基礎視覺效果實現能力。

請幫我創建一個銀河系粒子效果動畫。要求:

1)使用Canvas繪製粒子系統;2)粒子隨機分佈在畫布上,模擬星空效果;3)粒子有不同的大小和亮度,模擬遠近不同的星星;4)添加鼠標交互,鼠標移動時粒子會有輕微的響應;5)背景使用深色漸變,營造宇宙深邃感。請使用HTML5 Canvas和JavaScript實現。

這個任務的核心需求單一,沒有複雜的交互,模型耗時1分多鍾輸出完整的HTML5 Canvas+JS代碼,運行後粒子隨機分佈,大小與亮度差異也確實能體現遠近感,和鼠標交互的輕微響應也能get。

結果很不錯,能快速完成簡單視覺任務,技術棧使用準確且基礎功能無偏差。

緊接著,驗證一下模型對「視覺風格+複雜交互邏輯」的理解與優化能力。

這次在Claude Code里進行API調用,不得不誇一句,「無縫銜接」真絲滑,就這個API原生兼容爽!

實際上也不止Claude Code,Doubao-Seed-Code在Cursor、Cline、Codex CLI等主流智能編程環境里,都能與開發者們日常使用的工具無縫銜接。

完整html,Minecraft風格,展示拉鏈形狀,當我上下移動鼠標時,拉鏈會像真實的拉鏈一樣打開和關閉。拉鏈閉合拉開的速度慢點。要求:禁止使用任何改變應用結構或組件化範式的JavaScript 框架/庫(例如:React,Vue,Angular)。可以cdn引用第三方庫以滿足題目要求,如Three.js,p5js。最終產物必須是純粹的HTML、CSS和JS文件。如果需要創建多個文件(HTML/CSS/JS),請確保所有文件引用均使用相對路徑。

任務是開發Minecraft風格拉鏈交互效果,相比第一階段增加了「鼠標上下移動控制拉鏈開合(速度慢)」 的交互要求。

模型第一次做完項目倒是非常貼心地幫忙檢查了運行效果,也給了一些速度修改建議。

Minecraft風格是有了、拉鏈形狀也有了,但這個交互方式,怎麼看也不像拉鏈啊……

是不是提示的問題,那咱再進一步改造一下:

這個交互模式不像現實生活中的拉鏈

很快就找到了問題所在,定位到交互邏輯與現實場景脫節的核心問題。

一次改造後的效果如下:

雖然第一次沒完成,但調整起來效率尚可,在多輪交互時響應也還算絲滑。

下面,咱來看看Doubao-Seed-Code解決工程化問題的能力,給它給一份舊代碼,讓它找bug並且進行項目重構。

測試素材是一份有多個問題的記事本項目。

(提供文件)定位這份代碼的bug,並進行結構化重構

Doubao-Seed-Code拿到任務後先是明確了舊代碼的問題,將Bug定位到了具體的代碼行。

隨後輸出重構代碼,還列出了優化清單。

對比兩份代碼,從菜單創建模塊可以看出,左邊舊代碼結構混亂,並且沒有分離設計,重構後的代碼拆分了菜單與文件操作模塊,並且綁定了快捷鍵。

具體到某個函數,比如打開文件夾模塊,左邊舊代碼中文內容亂碼,沒有進行文件不存在的異常處理,新代碼都進行了改善。

可以看出模型面對「多Bug+結構混亂」的複雜工程問題時,具備系統性診斷與專業重構的能力。

重構後的記事本be like:

最後進行完整項目開發,測試模型對多需求整合與落地的能力。

幫我開發一個故宮博物院的導覽網站。需要包含幾個主要宮殿的介紹,配上高清的館藏文物圖片。最重要的是,每個宮殿的介紹頁面,都要有一個語音導覽按鈕,點擊後能播放由AI生成的專業語音解說。

由於沒有提前提供素材,模型在交付的代碼中主動補充了圖片替換教程,詳細說明如何按需搜索素材並替換佔位圖,解決了素材缺失的問題。

從最終效果來看,網站結構完整,涵蓋了核心功能模塊,語音導覽按鈕的邏輯也已預留,並且實現了完整功能。

同時還考慮到了實際使用中的素材問題,不得不說,全面~

等一下,好像還有更有意思的事情,Doubao-Seed-Code居然能看圖寫代碼

現階段,只有Claude系列、GPT-4V等一些國外模型能夠參考UI設計稿或截圖生成代碼。

Doubao-Seed-Code要是能做到,那真是國產編程模型獨一份了。

馬上來試試!先提供一個「移動端咖啡點單頁面」的UI設計稿:

(提供UI設計稿)請參考給出的UI設計稿圖片,生成一個「移動端咖啡點單頁面」,生成滿足所有要求的前端代碼,確保頁面主題明確。

點餐頁面就這麼水靈靈的做出來了,相似度99%!

那另外的1%去哪了?

原來是為了避免素材依賴,Doubao-Seed-Code給畫了個和原圖不太一樣的咖啡杯(hhh

這隻能說,「圖片在手,UI我有」了。

整體測完後,Doubao-Seed-Code的實測效果,確實符合官方強調的優勢特點——

國內首個支持視覺理解能力的編程模型 ,能夠參照 UI設計稿、界面截圖或手繪草圖 直接生成對應代碼;同時,還能對已生成的頁面進行視覺比對,主動識別樣式偏差與功能Bug,並自主完成修復優化,顯著提升了前端開發效率;

原生兼容Anthropic API 。對於廣大使用Claude Code的開發者,幾乎零成本即可將API切換到Doubao-Seed-Code。 多平台適配 ,還對Claude Code、Trae等主流IDE進行了特別優化;

原生256K長上下文 ,在處理長代碼文件、多模塊依賴等複雜場景能力提升,實現端到端自主編程,全棧開發友好,前端能力突出;

當然,性能上的優勢之外,火山引擎在AI大模型浪潮中給人的最大印象,還得是穩定又便宜。

模型夠強,保障夠硬,價格夠低

AI Coding愈發競爭激烈,各廠商紛紛發力卷性能卷價格卷使用保障,火山引擎也不遑多讓。

最最最受關切的成本問題,也被火山引擎打到了「一杯咖啡價」。

綜合使用成本在業界平均水平上砍了62.7%,在調用價格上,不僅比國際主流模型低得多,還捲到了國內最低價:

0-32k輸入區間:輸入1.20元/百萬Token,輸出8.00元/百萬Token

32-128k輸入區間:輸入1.40元/百萬Token,輸出12.00元/百萬Token

128-256k輸入區間:輸入2.80元/百萬Token,輸出16.00元/百萬Token

打個比方,要創建一個美觀的交互式英語學習網站,在0-32k區間的相同tokens量下,Claude Sonnet 4.5的成本約4.05元,GLM-4.6約0.77元,而Doubao-Seed-Code僅約0.34元

這不剛好雙11,火山引擎還給個人開發者安排了慳錢大禮包,推出了支持最新模型的Coding Plan,最低套餐首月僅需9.9元。

火山引擎自投身編程模型研發以來,從早期版本的逐步迭代,到推出如豆包大模型系列,在編程能力上可以說是持續進化。

開源了命令行AI Agent——veCLI,通過自然語言交互,實現從指令到代碼的自動化構建與運行。

還基於編程相關模型打造了IDE產品TRAE 。如今,在字節內部,超過80%的工程師都在使用TRAE輔助開發,其整體月活用戶已超100萬。

現下,Doubao-Seed-Code和TRAE的組合拳更是有亮眼表現,在SWE-Bench-Verified基準上「卷」到了SOTA。

Doubao-Seed-Code在Terminal Bench、SWE-Bench-Verified-Openhands、Multi-SWE-Bench-Flash-Openhands等主流測評也表現出色,在國內同賽道模型中表現突出。

表現如此,離不開背後的技術支撐優化。

這次,火山引擎為Doubao-Seed-Code構建了覆蓋10萬容器鏡像的龐大訓練庫,支持端到端沙盒環境評測;依託千卡GPU集群,實現了萬級併發沙盒session能力。

採用端到端強化學習,直接從任務沙盒反饋中學習,不用依賴複雜的蒸餾過程,優化路徑也更高效。

另外,火山引擎還在算力和安全保障上,做了進一步加碼。

背靠火山引擎的超大資源池,即便遇到多用戶並行調用、複雜項目開發等高頻場景,也能保持穩定響應。

同時,模型由火山方舟提供推理接口服務,代碼數據傳輸和調用過程全程加密,不用擔心核心開發信息泄露。

可以說把企業級AI開發,痛點都琢磨得透透的了。

不愧是宇宙廠自己先用先檢驗的產品和技術。

AI coding正進入了「一杯咖啡」時代,而且還是一杯國產咖啡價格的時代。

本文來自微信公眾號 「量子位」(ID:QbitAI),作者:關注前沿科技,36氪經授權發佈。