預見·科技 | 性能整體超越GPT-4 Turbo,頭部國產大模型成為AI開發者的“高替”

封面新聞記者 歐陽宏宇

又一國產大模型超越GPT-4 Turbo。

6月27日,科大訊飛在北京發佈訊飛星火大模型V4.0,以及在醫療、教育、商業等多個領域的人工智能應用。據科大訊飛董事長劉慶峰介紹,訊飛星火V4.0七大核心能力全面升級,在文本生成、語言理解、知識問答、邏輯推理、數學能力等方面實現了對GPT-4 Turbo的整體超越。加上此前已公佈了其對標性能的BAT等,目前已有多個國產大模型實現對GPT-4 Turbo的超越。

幾天前,海外大模型對特定區域用戶設限,倒逼了國產大模型紛紛推出“平替”甚至“高替”應對。而能否實現國產自主替代,大模型的性能是關鍵。

除訊飛星火外,文心一言在今年4月時,其在語義理解、閱讀理解等能力上已超過GPT-4 Turbo。隨後,阿里雲發佈通義千問2.5,並對外表示其模型性能全面趕超GPT-4 Turbo。SuperCLUE在上月公佈的測評榜單上,商湯科技的日日新5.0也超越了GPT-4 Turbo。

當前,大模型與人工智能技術處於科技競爭的焦點。中國科技公司作為大模型賽道上的後起之秀,背靠龐大市場、政策支援和自主創新,已在AI領域取得了長足的進步。但在基礎算法創新、底座大模型訓練數據等方面仍有趕超的空間。

“面對風起雲湧的通用人工智能浪潮,有沒有國家底座的支撐,將決定了行業到底能走多遠。”劉慶峰以訊飛星火V4.0訓練為例談到,基於國產萬卡算力集群“飛星一號”訓練的國產大模型後,面向個人消費端和企業端口,都能以個性化的AI解決方案,為個人和企業創造更具價值的AI解決方案。

在豐富的應用場景,穩定的政策支援以及算力規模加速成長的培優土壤中,國產大模型如何才能真正實現自主替代?專家表示,要在避免“重複造輪子”的基礎上,發揮我國大模型既有優勢,協同業內創新研究與產業化落地。

中國工程院院士鄔賀銓建議,在國家科技與產業計劃的協調下,研究機構與科技企業要合理分工形成合力,如組建算力聯盟,集中已有高檔GPU的算力資源。世界工程組織聯合會前主席龔克則認為,我國有著數實融合的天然基礎,應盡快發掘對於傳統領域的賦能作用。“產業的‘AI+’,是可以重點發力的方向。”