國內首個全場景深度思考模型Baichuan-M1-preview發佈:囊括三大推理能力,解鎖醫療循證模式
1月24日,百川智能發佈了國內首個全場景深度思考模型Baichuan-M1-preview。該模型是國內目前唯一同時具備語言、視覺和搜索三大領域推理能力的模型。在數學、代碼等多個權威評測中,Baichuan-M1-preview的表現均超越了o1-preview,展現了其在多領域推理方面的獨特優勢。
此外,作為國內唯一專注醫療領域的頭部大模型公司推出的深度思考模型,它還解鎖了醫療循證模式,實現了從醫療證據檢索到深度推理的完整端到端服務,能夠快速、精準地回答醫療臨床、科研問題。

Baichuan-M1-preview現已在百小應中正式上線,在深度思考模式下不僅能準確解答數學、代碼、邏輯推理等問題,面對複雜醫療問題,還能像資深醫療專家一樣,通過深度思考構建嚴謹的醫學推理過程,為用戶提供全面的疾病分析和個性化健康管理建議。
為了更好地繁榮AI醫療生態,助力醫療事業發展,百川智能還同時推出了行業首個開源醫療增強大模型Baichuan-M1-14B,其醫療能力超越了更大參數量的Qwen2.5-72B,與o1-mini相差無幾。
Github: https://github.com/baichuan-inc/Baichuan-M1-14B
Huggingface(base): https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Base
Huggingface(Instruct): https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Instruct
Baichuan-M1-preview多項能力超越o1-preview,解鎖醫療循證模式
作為一個全場景深度思考模型,Baichuan-M1-preview的能力全面,具備強大的語言推理、視覺推理及搜索推理能力。語言推理方面,其在AIME和Math等數學基準測試,以及LiveCodeBench代碼任務上的成績均超越了o1-preview等模型。

視覺推理方面,在MMMU-val、MathVista等權威評測中的成績,超越了GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview等國內外頭部模型。

Baichuan-M1-preview的另一大亮點是解鎖了醫療循證模式。在面對複雜醫學問題時,會將專業可靠的醫療知識作為推理依據,幫助用戶做出最佳的醫療決策。
為實現這一能力,百川智能自建了涵蓋億級條目的循證醫學知識庫,囊括了國內外海量醫學論文、權威指南、專家共識、疾病與症狀解析、藥品說明等專業醫療內容,且以天為單位進行動態更新,及時收錄醫療領域的新突破、新進展。
眾所周知,醫學知識多樣性強、因果關係複雜。因此,即使構建了龐大的醫療知識庫,在調用其中的醫學知識,尤其疊加了互聯網上搜索到的醫療信息時依然會遇到部分醫學數據、醫學理論不一致的情況。
針對這一問題,醫療循證模式能運用醫學知識和證據評估標準,對證據進行多層分級,並對不同權威等級的證據進行專業分析與整合,精準識別各類權威信息的來源和可信度,從而避免因信息混雜導致的誤判,然後基於這些醫學證據進行可靠、準確的醫學推理,最終提供可信賴的醫療答案。

通過「醫療循證模式」,Baichuan-M1-preview實現了從證據檢索到深度推理的完整端到端服務,能夠有效地解決醫療場景中信息過載、不確定性和碎片化等痛點。無論是醫生面對複雜病案,還是患者尋求權威建議,它都能通過「擺事實、講道理」的循證方式提供言之有物、有理有據的解答。不僅能在臨床場景中幫助醫生提升診療效率,在醫學科研場景中大幅縮短科研探索時間,還能幫助普通用戶更好地理解自身健康狀況,幫助患者科學管理生活方式,提升治療效果。
行業首個開源醫療增強通用大模型 ,Baichuan-M1-14B醫療能力超越Qwen2.5-72B
為了推動AI技術在醫療領域的創新發展,增強AI醫療技術的透明度和可信性,提高醫療服務的可及性,繁榮AI醫療生態,百川智能還開源了Baichuan-M1-preview的小尺寸版模型Baichuan-M1-14B。
作為行業首個開源醫療增強通用大模型Baichuan-M1-14B的表現非常優異,不僅在cmexam、clinicalbench_hos、clinicalbench_hos、erke等權威醫學知識和臨床能力評測上的成績超越了更大參數量的Qwen2.5-72B-Instruct,並且與o1-mini也相差無幾。

為了提升Baichuan-M1-14B的醫療能力,百川智能多管齊下:數據構建方面,面向細分醫療場景,收集了萬億級 token 的嚴肅醫療數據,涵蓋了千萬級的中/英文專業醫療論文、院內真實中/英文醫療病例,億級的醫療問答、醫療問診、臨床數據等,還對全網數據進行了包括醫療科室、醫療內容以及醫療價值在內的分類評估,確保模型能學習到有價值且全面的醫療知識。

在此基礎上,百川智能還針對病例、醫學教材、醫學指南等不同類別的高質量醫療數據生成了超千億 token 的多樣化數據,包含了醫療複雜決策推理鏈條、決策依據以及問答對等多樣化形式。這些合成數據擁有豐富的知識呈現形式以及與醫生一致的思維過程,進一步強化了Baichuan-M1-14B的醫學知識能力和醫療推理能力。
進入到模型訓練階段,百川智能運用行業首創的多階段領域提升方案,將整個訓練過程分為通識提升、醫療基礎知識提升、醫療進階知識提升三個階段,依次提升模型的基礎語言、高階及疑難病症應對等能力。此外還在 CoT 訓練框架中創新的引入了ELO強化學習法,優化思維鏈路徑,避免傳統獎勵模型偏差,有效提升了模型的生成質量與邏輯推理能力。
Baichuan-M1-preview是百川智能在AI醫療領域的又一次重要突破,為其實現「造醫生、改路徑、促醫學」的AI醫療願景提供了有力支撐。於此同時,Baichuan-M1-14B開源模型則為中國AI醫療健康生態建設提供了強大助力。百川智能不僅希望加速AI技術在醫療領域的廣泛應用,更旨在激發更多創新力量,共同推動中國醫療健康生態的持續進步,助力實現更公平、更高效的高質量醫療服務。