預見·科技丨全國產算力訓練深度推理大模型發佈 已在教育、醫療等真實場景落地

封面新聞記者 歐陽宏宇

“AI應用落地元年”剛過,2025一開年,人工智能大模型在國產化和智能化上再進一步。

1月15日,科大訊飛發佈深度推理大模型“訊飛星火X1”。據瞭解,該大模型為科大訊飛攜手華為,基於全國產算力“訓練”出的具備深度思考和推理能力的大模型。全新大模型產品的出現,背後是我國算力產業發展動能持續強勁,算力基礎設施完善為AI廠商們帶來新⼀輪發展機遇。

從大模型的演進路徑出發,探索其高質量發展的“中國路徑”,是我國搶占科技製高點的重要戰略。在此之前,文心一言、零一萬物等中國造通用大模型都用上了中國算力。其中,支援文心一言的陽泉智算中心是亞洲單體最大的智算中心;零一萬物在去年底與智能算力運營服務廠商圖靈新智算達成合作,要打造公共算力服務平台。

在國產算力供給方面,工信部《算力基礎設施高質量發展行動計劃》顯示,2023年我國算力規模達到220EFLOPS,其中智能算力占25%,目標到2025年,算力規模超過300EFLOPS,智能算力佔比達到35%。截至2024年6月,全國在用算力中心機架總規模超過830萬標準機架,算力總規模達246EFLOPS。

國產算力供給增加

帶動大模型技術升級

事實上,佈局國產大模型研發,規範大模型建設生態,統籌優化通用與行業大模型發展,早在大模型元年就已開始。2023年10月,首個國產萬卡算力集群“飛星一號”平台上線;一年後,國產超大規模智算平台“飛星二號”正式啟動,引領國產大模型底座的發展。

算力供給的增加,也帶動了國產AI大模型技術的升級。據瞭解,目前,基於全國產算力研發的,唯一一個全國產算力上訓練的深度推理模型已經推出,並在教育、醫療等真實場景中實現了應用落地。

與通用大模型相比,所謂的“深度推理模型”更接近人類的“慢思考”方式,並且用更少的算力。據介紹,該類模型有三大典型特徵:一是化繁為簡,將複雜問題分步拆解簡化;二是進行自我探索和反思驗證;三是基於答案正確與否的優質反饋信息進行強化訓練。

AI“慢思考”範式出現

人機互動將更智能

在此之前,OpenAI推出的大模型o1已探索出,通過強化學習讓AI具備人類的,主動反思、糾錯等複雜思考能力的“慢思考”範式。如今,全國產算力也實現了讓中國造AI大模型具備了這樣的能力。

以X1大模型為例,例如在解答高考題、高中奧賽題時,不僅能準確給出了這些題目的答案,還可以對解題思路和步驟進行了詳細拆解。在醫療領域,這一計算範式可使得專科輔助診斷和複雜病曆內涵質控的準確率均達90%。

這種技術的進步所帶來的是AI大模型擬人能力上的巨大進步。在此之前,由於機器學習技術的廣泛使用,市面上大量通用大模型的訓練原理是,通過大量知識和數據的訓練,讓大模型具備“快思考”能力,即讓AI擁有快速直覺、無意識,快速反應的能力。

“但這樣的缺陷在於,能力不夠強。”業內人士分析稱,這也是為什麼不少大模型面對問題出口成章,但回答質量不夠穩定,時常出現機器幻覺。相較而言,慢思考具備有意識、有邏輯性的特徵,雖然需要分很多步驟,但會在回答之前進行一段時間的“思考”,有助於模型避免出錯,並提供更全面的解答。

這種大模型底層範式的變化,也是變革大模型科研和應用範式,形成中國特色大模型應用領跑優勢的具體體現。在中國工程院院士陳曉紅看來,國產AI工程化工具研發提速,能有力回應各行業AI賦能的強烈需求,形成貫通算力、算據、算法、應用的大模型賦能產業生態。“這將有助於鼓勵創新大模型應用場景,加快在醫療、金融、法律、教育、交通等行業的落地應用,借助AI完成重點領域彎道超車,打造一條大模型高質量發展的‘中國路徑’。”