DeepSeek V3「小版本升級」實測堪比 V3.5，非推理模型也有「啊哈時刻」

03月25日 09:14 新浪網 tech-auto-hilite

DeepSeek V3 升級了，新版本 V3-0324。

官方輕描淡寫只說是「小版本升級」，但很多人實測下來可一點也不小。

把流行的小球彈跳測試，提升難度到 4 維空間超立方體也沒問題。

天哪，如果這隻是一個小更新，那我想像不出大更新會是什麼樣子。

編程這塊，只需一句提示詞開發一個完整產品著陸頁，帶自適應佈局帶動效，被評價為與 Claude 3.7 Sonnet 同一水平。

由於發佈時間太短，還沒有正式測評結果，不過在開發者 Xeophon 的個人 Benchmark 上所有指標都有大提升，成為該測試下最好的非推理模型。

不是推理模型也有「啊哈時刻」

DeepSeek-V3-0324 並非推理模型，在回答之前不會給出思考過程，但依然遵循一定的思維方式分解問題。

走入死胡同的話，還表現出自主回到上一步重新思考的能力。

在「9.11 和 9.9 那個大」、「Straberry 有多少個 r」已經不成問題的今天，最新折磨 AI 的難題是「讓 7 米長的甘蔗通過 2 米高 1 米寬的門」。

在量子位的測試中，DeepSeek-V3-0324 先是像它的前輩以及許多其他 AI 一樣碰壁。

碰壁之後開始重新思考題目本身的含義，後面依舊陷入誤區，但突然在中文解題過程中夾雜一句英語思考，類似 DeepSeek-R1 技術報告中的「啊哈時刻」。

等等，這似乎與之前的對角線方法相似，也許我遺漏了什麼。

頓悟之後，突然就走上了正確的道路，注意到了題目中沒直接提到的隱藏條件。

雖然從計算過程看，還是沒理解到問題的本質，但好歹得出瞭解決方案，還認識到了自己的誤區。

依舊免費，依舊開源

像這樣的優秀模型依舊免費，依舊開源，權重文件已火速上線 HuggingFace，使用最寬鬆的 MIT 協議。

擁有權重文件加起來佔硬盤空間約 688GB，與初代 v3 保持一致，說明依然是 671B 參數的 MoE 模型，目前沒有更多技術細節，還需等待官方進一步發佈公告。

目前在官網和官方 App（關閉深度思考即可）、HuggingFace 等渠道都能體驗到 v3-0324。

也可以到大模型競技場去與其他模型 pk，不過投票結果還要等一段時間才能出來。

當然最讓大家期待的還是，v3 更新了，r2 還會遠嗎？

官網試玩：

https://chat.deepseek.com/

HuggingFace：

https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/blob/main/README.md

參考鏈接：

[1]https://x.com/TheXeophon/status/1904225899957936314
[2]https://x.com/Yuchenj_UW/status/1904223627509465116
[3]https://x.com/risphereeditor/status/1904194061780590773

本文來自微信公眾號：量子位（ID：QbitAI），作者：夢晨，原標題《DeepSeek V3「小版本升級」實測堪比 V3.5，非推理模型也有「啊哈時刻」，7 米甘蔗過 2 米門想通了》

廣告聲明：文內含有的對外跳轉鏈接（包括不限於超鏈接、二維碼、口令等形式），用於傳遞更多信息，節省甄選時間，結果僅供參考，IT之家所有文章均包含本聲明。