推理模型性能比肩世界先進水平,智譜 GLM開源模型系列迎來新成員,同時啟用全球域名「z.ai」
4月15日消息,智譜將開源 32B/9B 系列 GLM 模型,涵蓋基座、推理、沉思模型,均遵循 MIT 許可協議。該系列模型現已通過全新平台 z.ai 免費開放體驗,並已同步上線智譜 MaaS 平台。
其中,推理模型 GLM-Z1-32B-0414 性能媲美 DeepSeek-R1 等頂尖模型,實測推理速度可達 200 Tokens/秒(MaaS 平台 bigmodel.cn),目前國內商業模型中速度最快。此外,其價格僅為 DeepSeek-R1 的 1/30。
智譜啟用全新域名 z.ai,目前該平台整合了 32B 基座、推理、沉思三類 GLM 模型,後續將作為智譜最新模型的交互體驗入口。
模型開源
本次開源的所有模型均採用寬鬆的 MIT 許可協議。這意味著可以免費用於商業用途、自由分發,為開發者提供了極大的使用和開發自由度。我們開源了 9B 和 32B 兩種尺寸的模型,包括基座模型、推理模型和沉思模型,具體信息如下:

基座模型 GLM-4-32B-0414 擁有 320 億參數,其性能可與國內、外參數量更大的主流模型相媲美。該模型利用 15T 高質量數據進行預訓練,特別納入了豐富的推理類合成數據,為後續的強化學習擴展奠定了基礎。在後訓練階段,除了進行面向對話場景的人類偏好對齊,我們還通過拒絕采樣和強化學習等技術,重點增強了模型在指令遵循、工程代碼生成、函數調用等任務上的表現,以強化智能體任務所需的原子能力。GLM-4-32B-0414 在工程代碼、Artifacts 生成、函數調用、搜索問答及報告撰寫等任務上均表現出色,部分 Benchmark 指標已接近甚至超越 GPT-4o、DeepSeek-V3-0324(671B)等更大模型的水平。

GLM-4-32B-0414 進一步提升了代碼生成能力,可處理並生成結構更複雜的單文件代碼。Z.ai 的對話模式內建了預覽功能,支持對生成的 HTML 和 SVG 進行可視化查看,便於用戶評估生成結果和進行迭代優化。
給我設計一個移動端機器學習平台的 UI,其中要包括訓練任務,存儲管理,和個人統計界面。個人統計界面要用圖表展示用戶過去一段時間的各類資源使用情況。使用 Tailwind CSS 來美化頁面,把這 3 個手機界面平鋪展示到一個 HTML 頁面中

設計一個支持自定義函數繪製的繪圖板,可以添加和刪除自定義函數,並為函數指定顏色。

用 svg 展示一個 LLM 的訓練流程

用 HTML 模擬太陽系的行星運動
GLM-Z1-32B-0414 是一款具備深度思考能力的推理模型。該模型在 GLM-4-32B-0414 的基礎上,採用了冷啟動與擴展強化學習策略,並針對數學、代碼、邏輯等關鍵任務進行了深度優化訓練。與基礎模型相比,GLM-Z1-32B-0414 的數理能力和複雜問題解決能力得到顯著增強。此外,訓練中整合了基於對戰排序反饋的通用強化學習技術,有效提升了模型的通用能力。
在部分任務上,GLM-Z1-32B-0414 憑藉 32B 參數,其性能已能與擁有 671B 參數的 DeepSeek-R1 相媲美。通過在 AIME 24/25、LiveCodeBench、GPQA 等基準測試中的評估,GLM-Z1-32B-0414 展現了較強的數理推理能力,能夠支持解決更廣泛複雜任務。

GLM-Z1-9B-0414 是一個驚喜。我們沿用了上述一系列技術,訓練了一個 9B 的小尺寸模型。雖然參數量更少,GLM-Z1-9B-0414 在數學推理及通用任務上依然表現出色,整體性能已躋身同尺寸開源模型的領先水平。特別是在資源受限的場景下,該模型可以很好地在效率與效果之間取得平衡,為需要輕量化部署的用戶提供強有力的選擇。

沉思模型GLM-Z1-Rumination-32B-0414 代表了智譜對 AGI 未來形態的下一步探索。
與一般推理模型不同,沉思模型通過更多步驟的深度思考來解決高度開放與複雜的問題。其關鍵創新在於,它能在深度思考過程中整合搜索工具處理複雜任務,並運用多種規則型獎勵機制來指導和擴展端到端的強化學習訓練。該模型支持「自主提出問題—搜索信息—構建分析—完成任務」的完整研究閉環,從而在研究型寫作和複雜檢索任務上的能力得到了顯著提升。
(沉思模型解決開放問題demo:撰寫兩個城市AI發展情況,以及未來的發展規劃)
速度提升 8 倍,價格僅為 1/30
除模型開源外,基座、推理兩類模型也已同步上線智譜MaaS開放平台(bigmodel.cn),面向企業與開發者提供API服務。
本次上線的基座模型提供兩個版本:GLM-4-Air-250414 和 GLM-4-Flash-250414,其中 GLM-4-Flash-250414 完全免費。
上線的推理模型分為三個版本,分別滿足不同場景需求:
- GLM-Z1-AirX(極速版):定位國內最快推理模型,推理速度可達 200 tokens/秒,比常規快 8 倍;
- GLM-Z1-Air(高性價比版):價格僅為 DeepSeek-R1 的 1/30,適合高頻調用場景;
- GLM-Z1-Flash(免費版):支持免費使用,旨在進一步降低模型使用門檻。

對應模型價格表:
Z.ai 上線
全新站點 Z.ai,作為智譜最新模型交互體驗入口,將正式啟用!

Z.ai目前已上線三款開源模型:
- GLM-4-32B(基座模型):具備強大代碼生成能力,支持全新 Artifacts 功能,打造交互式開發體驗。
- Z1-32B(推理模型):超強推理性能,在線體驗最高達 200 Tokens/秒 的極速輸出。
- Z1-Rumination-32B(沉思模型):可以體驗 Deep Research 的強大能力,適合做深度調研。
附:如何使用
【開源模型】 32B 基礎模型、32B 推理模型、32B 沉思模型(裸模型)
【配置要求】
1 張 H100 / A100 或者更先進的NVIDIA旗艦顯卡
4 張 4090 / 5090 / 3090
【在線體驗】
MaaS平台:32B 基礎模型、 32B 推理模型的極速版和高性價比版
z.ai:32B 基礎模型、32B 推理模型、基於 32B 沉思模型的完整 Deep Research 功能
【模型測試側重點–根據使用平台不同】
z.ai:GLM-4-32B(Artifacts 類任務)、Z1-32B (驚人的推理速度、各種難題)、Z1-Rumination(Deep Research 信息整合能力)
MaaS:GLM-Z1-AirX(速度)、GLM-Z1-Air(性價比)、GLM-Z1-Flash(免費)
開源:普通開發者 Z1-Rumination,有框架開發能力的可以試試體驗沉思。