IBM 企業級 AI 開發平台 watsonx.ai 上線 DeepSeek R1 蒸餾模型
IT之家 2 月 11 日消息,IBM 日前宣佈,DeepSeek-R1 蒸餾版 Llama 3.1 8B 和 Llama 3.3 70B 現已上線 IBM 的企業級 AI 開發平台 watsonx.ai。

根據官方介紹,DeepSeek 還借助知識蒸餾技術,利用 R1 模型生成的數據優化了多個 Llama 和 Qwen 變體。用戶可通過以下方式在 watsonx.ai 上使用 DeepSeek 蒸餾模型:
-
在 watsonx.ai 的「按需部署」目錄中,IBM 提供 Llama 蒸餾版,用戶可以部署專用實例以進行安全推理。
-
用戶還可通過「自定義基礎模型」導入功能,上傳 DeepSeek-R1 其他變體,例如 Qwen 蒸餾模型。
DeepSeek-R1 具備強大的推理能力,適用於多個領域:
-
規劃:其「鏈式思維」邏輯有助於處理需要逐步推理的任務,特別適合智能體(agentic)應用。
-
編程:可用於代碼生成、調試和優化,提升開發效率。
-
數學問題求解:具備處理複雜數學問題的能力,在科研、工程和科學計算等領域表現突出。
開發者可在 watsonx.ai 上利用 DeepSeek-R1 進行 AI 解決方案開發,並使用以下解決方案能力:
-
直觀測試和評估模型輸出
-
通過連接向量數據庫和嵌入模型構建 RAG(檢索增強生成)管道
-
支持 LangChain、CrewAI 等主流 AI 框架
IBM watsonx.ai 提供靈活的開源模型定製選項,支持 DeepSeek-R1 在不同環境下的部署,並簡化智能體開發、微調、RAG、提示工程等工作流。此外,watsonx.ai 內置安全機制,保障用戶應用的安全性。
據IT之家此前報導,IBM 首席執行官本月初曾發表長文稱,他們(DeepSeek)僅用約 2000 枚英偉達芯片,以大約 600 萬美元的成本訓練了最新的模型,遠低於行業預期。這再次證明,小型、高效的模型也能帶來實際成果,無需依賴龐大而昂貴的專有系統。
廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。