推理模型 DeepSeek-R1-Lite 預覽版上線,號稱媲美 OpenAI o1-preview

感謝IT之家網民 Skyraver 的線索投遞!

IT之家 11 月 20 日消息,DeepSeek 宣佈,全新研發的推理模型 DeepSeek-R1-Lite 預覽版正式上線。

官方表示,DeepSeek R1 系列模型使用強化學習訓練,推理過程包含大量反思和驗證,思維鏈長度可達數萬字。該系列模型在數學、代碼以及各種複雜邏輯推理任務上,取得了媲美 OpenAI o1-preview 的推理效果,並為用戶展現了 o1 沒有公開的完整思考過程

DeepSeek-R1-Lite 預覽版模型在美國數學競賽(AMC)中難度等級最高的 AIME 以及全球頂級編程競賽(codeforces)等評測中,超越了 GPT-4o 等知名模型

DeepSeek-R1-Lite 的推理過程長,並且包含了大量的反思和驗證。下圖展示了模型在數學競賽上的得分與測試所允許思考的長度緊密相關。

▲ 紅色實線展示了模型所能達到的準確率與所給定的推理長度呈正相關▲ 紅色實線展示了模型所能達到的準確率與所給定的推理長度呈正相關

IT之家注意到,DeepSeek-R1-Lite 目前仍處於迭代開發階段,僅支持網頁使用,暫不支持 API 調用。DeepSeek-R1-Lite 所使用的也是一個較小的基座模型,無法完全釋放長思維鏈的潛力。

官方稱正式版 DeepSeek-R1 模型將完全開源,並公開技術報告和部署 API 服務。

廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。