全國產算力大模型實現對標DeepSeek R1 中國AI已具備與國際頂尖模型同台競技實力

封面新聞記者 歐陽宏宇
基於全國產算力訓練的深度推理大模型再度迎來升級,目前已全面對標OpenAI o1和DeepSeek R1。
4月20日,科大訊飛對外透露,深度推理大模型訊飛星火X1迎來升級。據介紹,升級後的星火X1在數學、代碼、邏輯推理、文本生成、語言理解、知識問答等通用任務上效果顯著提升,並在通用任務效果評測中全面對標OpenAI o1和DeepSeek R1,同時強化其在教育、醫療、司法等重點行業份額。
近段時間,國產人工智能技術仍在取得突破,科技公司將升級的方向定位在了應用和商業化上。
上月底,通義千問大模型推出AI助手“超級智能體”,主打深度思考能力和實時信息整合技術。此前,百度發佈的文心大模型4.5和文心大模型X1則在多模態的基礎上,更強調了其將免費向用戶開放。騰訊混元大模型的處境,則在元寶接入DeepSeek後變得有些尷尬。快手人工智能大模型“可靈AI”在幾天前宣佈了基座模型再次升級,也只針對視頻生成和圖像生成兩個場景。此外,DeepSeek-R2或將於5月發佈。
廠商競逐“最後一公里”讓國產人工智能在“軟實力”上加速提升。但要在真實的環境中解決那些日常煩瑣、但重要的行業需求,靠的不僅是應用落地,更需要AI公司能在技術的“硬實力”上建立護城河。
國產AI邁向自主可控新階段,也需要在技術路徑上進行創新。據業內人士分析,通過全國產算力訓練深度推理大模型,需要基於強化學習、模型訓練等多個方面創新與可控。
一是提出基於問題難度的大規模多階段強化學習方法,在複雜推理、數學、代碼、語言理解等場景全面提升模型效果及泛化性;同時提出強化學習動態更新算法,基於樣本采樣長度動態調整強化學習更新速度,進一步提升深度思考強化學習效率及效果。
二是統一模型下的快慢思考混合訓練方法,充分發揮快慢思考數據相互促進作用,實現基於系統指令控制模型是否深度思考,支撐下遊更高效便捷地部署使用。
三是實現多項工程技術創新,顯存動態卸載技術大幅提升長文本推理併發、訓推共卡協同實現高效訓推資源轉換、推理引擎冬眠機制實現快速拉起和恢復,實現國產算力平台上高效和穩定的強化學習訓練全流程。
從行業整體來看,金融、教育、文旅、車載、政務等B端場景成為國產AI廠商主要試水地,而大模型企業在商業化上的打法也需要基於研發實力才能在快速迭代進步中,對實際應用場景取得顯著效能優勢,並在參與國際形勢中具備更強戰略韌性。
“全國產算力訓練的深度推理大模型全面升級,不僅展示了中國人工智能技術在國產算力平台上的創新突破,也為各行各業數字化轉型提供了新的可能。”業內人士表示,這一技術之下的代表大模型不斷迭代,已證明在技術自主可控的道路上,中國AI已具備與國際頂尖模型同台競技的實力。