百川智能發佈深度思考模型 Baichuan-M1-preview,同時具備語言、視覺和搜索三大領域推理能力
IT之家 1 月 24 日消息,百川智能今日宣佈推出全場景深度思考模型 Baichuan-M1-preview,聚齊三大核心推理能力。同時,百川智能還推出了行業首個開源醫療增強大模型 Baichuan-M1-14B。

據官方介紹,Baichuan-M1-preview 同時具備語言、視覺和搜索三大領域推理能力,在數學、代碼等多個權威評測中的表現可對標 o1-preview。
IT之家注意到,它還解鎖了「醫療循證模式」,實現了從證據檢索到深度推理的完整端到端服務,能夠快速、精準地回答醫療臨床、科研問題。

Baichuan-M1-14B 則是 Baichuan-M1-preview 的小尺寸版本,同時也是行業首個開源的醫療增強大模型。據介紹,其醫療能力超越了更大參數量的 Qwen2.5-72B,與 o1-mini 相差無幾。
-
Github:https:https//github.com/baichuan-inc/Baichuan-M1-14B
-
Huggingface(base):https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Base
-
Huggingface(Instruct):https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Instruct
-
NPU 版本支持 BF16 推理:https://modelers.cn/models/MindIE/Baichuan-M1-14B-Base

語言推理方面,其在 AIME 和 Math 等數學基準測試,以及 LiveCodeBench 代碼任務上的成績均超越了 o1-preview 等模型。
視覺推理能力方面,在 MMMU-val、MathVista 等權威評測中的成績,超越了 GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview 等模型。

廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。