預見·科技丨通用大模型“國家隊”成果迭代,大模型競爭進入新維度丨封面天天見

封面新聞記者 歐陽宏宇

中國造大模型發展到怎樣的程度了?在第一個款國產通用大語言模型發佈的592天后,“通用大模型國家隊”拍了拍GPT-4 Turbo說,“起來卷”。

近日,在第七屆世界聲博會暨2024科大訊飛全球1024開發者節開幕式上,科大訊飛董事長劉慶峰公佈訊飛星火大模型應用成績單,並發佈訊飛星火大模型4.0 Turbo:根據鮮活的真實數據背靠背測試,七大能力全面超過GPT-4 Turbo,數學能力、代碼能力超過GPT-4o,國內外中英文14項主流測試集中9項實現超越。同時公佈了10項基於該底座能力的硬核產品與創新應用。

從百度文心到阿裡通義、商湯日日新、騰訊混元,再到科大訊飛此次發佈的訊飛星火4.0 Turbo,中國造大模型在推出時與GPT一較高下,已是發佈會上的一個保留環節。AI大模型產品背後,眾多科技企業和全國重點實驗室貼著OpenAI進行技術比拚,更是中國AI技術在同全球技術高地比長短、找差距中,所展現出的雄心。

更重要的是,比性能只是國產大模型參與全球競爭的第一步。當越來越多的國產大模型將其多模態能力,從剪視頻、寫文案、做PPT中抽離,把更多優先級植入工業場景、生活場景、家庭陪伴機器人具身智能等多個領域,已證明了拚賦能才是走向世界的關鍵一步棋。正如劉慶峰在演講中所表示的,“未來AI技術的探索,必須大規模產業化,必須在場景中進入到真正的深水區,所有玩‘概念’的都不會有大未來”。

大模型加速發展

“國家隊”下場加碼研發

國產大模型的發展史就是一段同GPT比拚的競爭史。

自去年3月GPT-4上線後,國內科技企業紛紛跑步入場。兩個月後,星火大模型1.0版本發佈,當時劉慶峰放話,星火大模型要在10月份對標ChatGPT,不僅要在中文上超越,還要在英文上達到和ChatGPT一樣的水平。隨後才有李彥宏發佈“文心大模型4.0”時稱,該模型綜合水平與GPT-4相比已經毫不遜色。

這也拉開了國內“百模大戰”,走出去參與全球技術競爭的序幕。阿里“通義大模型”、百川智能“Baichuan 3”、零一萬物“閃電”陸續對外宣稱已在不同維度上超越GPT的新版本。

技術演進往往有“差異化”和“跨界”的特點,這也催生了很多創業公司在技術爆發初期能有一番作為。但AI大模型技術突破需有規模效應,“小打小鬧”地搞研發是無法把技術變成生產力的。在巨頭企業、頭部廠商、科研院所百花齊放的序曲中,“國家隊”下場加碼AI研發才能將技術研發推向新高度。

2022年5月,認知智能全國重點實驗室在合肥成立,是我國首批20家標杆全國重點實驗室之一。據介紹,該實驗室由中國科學技術大學和科大訊飛聯合共建,主要圍繞認知智能共性基礎技術和應用關鍵技術開展研究,目前已產出了星火認知大模型等一系列創新成果。

在經過了多版本迭代後,訊飛星火4.0 Turbo已經在近期發佈。據介紹,根據真實數據背靠背的測試,該大模型的7大能力超過GPT-4 Turbo,代碼能力和數學能力超越GPT-4o;在理解和推理、綜合考試、數學和科學、代碼等不同任務類型的14項主流測試集中的9項,實現了對GPT-4o、Claude 3.5 Sonnet、Gemini 1.5pro等國外三大主流模型的超越,效率相對提升50%。

“我們已完成超長思維鏈、樹搜索和自我反思評價等算法驗證,預計今年底可實現類OpenAI 01的高難度數學能力顯著提升。”劉慶峰表示。

中國造大模型正以超乎想像的進化速度對全球AI技術高地發起衝擊。相關技術一路狂飆,速度超過了以往任何一項技術的發展進程。

不過,和所有新技術投入的過程一樣,對大模型加大研發投入也是一場燒錢的持久戰,在技術智能化已達到一定程度後,如何走出“大而空、講故事、講情懷”的套路,真正專注於落地場景和案例,實現可持續的商業化變現。這是大模型前進的必由之路,也是廠商們下一階段的重頭戲。

突破行業瓶頸期

靠紮根產業“換道超車”

今年初,OpenAI憑藉人工智能文生視頻大模型Sora再次在全球範圍內掀起一輪大模型熱潮,也讓業界看到了AI技術發展達到一定高度後,對於行業應用帶來的巨大潛力。

事實上,受數據與算力的製約,在國產AI大模型發展到今天,靠繼續提升其通用性能催生進步已顯示出規模不經濟的態勢。要想實現“彎道超車”,必須“換道超車”,紮根產業場景。

“大模型的多模態理解能力比多模態生成更重要。”在劉慶峰看來,對於大模型的多模態能力,生成視頻只是娛樂,更優先級的是進入工業場景、生活場景、家庭陪伴機器人等具體領域。

智能汽車被認為是智能手機後的下一個藍海市場,也是AI眾多應用場景中非常重要的一個。就在今年5月,支付寶宣佈與科大訊飛達成合作,雙方將在大模型、車機支付、小程式服務等領域展開合作,共建更為智能的座艙服務生態。相似的合作還有吉利和騰訊應用寶,廣豐攜手華為,長安之於百度,上汽聯合阿里,為的是將數智化駕乘用車體驗賦能到智能汽車上。

奇瑞控股集團有限公司黨委書記董事長、總經理尹同躍在聲博會現場接受採訪時表示:“過去的21年,奇瑞汽車連續位居中國乘用車品牌出口第一名。在智能化助力中國車企‘出海’的道路上,科大訊飛一直是奇瑞最堅實的合作夥伴。”據瞭解,類似有智能語音交互裝配的智能汽車已經超過了6000萬輛。

AI上車在智慧座艙場景中的應用,不僅將推動服務從簡單推薦轉變為識別需求、執行需求,更能實現車載服務在交互效能層面、服務推薦層面、用戶意圖執行層面的全鏈路優化。其帶來的智能駕駛的便捷性與智能性,已重新定義了人與車的關係。

除了汽車場景之外,教育、醫療、司法、政務服務、企業辦公等多個民生領域和行業也已得到了AI技術的賦能。科技企業所要做的,就是用人工智能技術解決這些社會剛需。

比如在教育領域AI學習機賽道,前有精準學推出超擬人一對一AI老師技術,在講授環節提高學習效率,而在訊飛AI學習機中首次搭載的AI作業過濾器技術,則進一步補全了練習環節。據介紹,在AI的賦能下,學習機可以通過OCR能力識別出紙質練習題,根據學生歷史學習情況和本地化考情,將題目分出“必做題”“選做題”“建議不做題”三個等級,實現“練得更少、學得更好”的目標。這種教師智慧和機器智能的雙向賦能,通過“人機共育”幫助學生實現知識、到能力、再到素養的綜合培養,正是用AI技術解決教育行業剛需的外延之一。

專注於場景落地,在細分領域展示出旺盛的生命力,切實為企業和用戶提供降本增效的方案,已經成為當下“通用大模型國家隊”集中發力的點。從“做與不做”邁向“做得怎麼樣”,這正是大模型之爭的下一步。

新技術蓬勃興起

借應用與普惠穿越“奇點”

就在幾天前,工信對外披露的新型信息基礎設施建設進展數據顯示,我國現有完成備案並上線為公眾提供服務的生成式人工智能服務大模型近200個,註冊用戶超過了6億;並且已形成了135個新型數字服務優秀案例,覆蓋交通、文旅、養老、醫療、應急等領域。

不過,在人工智能等新技術蓬勃興起背後,行業也在面對飽和與同質的問題。以至於用戶經常會注意到一個現象,在手機上下載了十來個大模型App,使用下來發現難找到它們之間的技術差異。

這個現象出現的原因,在於不少大模型仍在盲目追求數據量與模型參數,卻忽視了應用層的落地與積累。就像是要知道一根原木是不是可造之材,絕不僅僅是把它束之高閣,要將其打磨出來,去造橋建屋,發揮自己的價值。對於AI大模型來說也是同理,不是在發佈會和測試數據里說出來的,而是在億萬用戶,在千行百業手裡用出來的。

可喜的是,隨著新一代信息技術的發展,已經有越來越多的新技術、新產品和新服在政策的支援下開始落地應用。據工信部新聞發言人、總工程師趙誌國透露,在持續推動《算力基礎設施高質量發展行動計劃》任務落實的背景下,已在支援部分發達地區先行先試,探索人工智能等建設和應用新模式。

在很多業內人士看來,在“大數據+大算力+強算法”增強通用性之後,人工智能已進入了以專用小模型定製訓練為主的“手工作坊”,和以通用大模型預訓練為主的“大型工廠”並行的時代。

此前發佈的《2024-2029年中國人工智能大模型行業發展分析及發展趨勢預測報告》也顯示,未來大模型的發展將有三大趨勢:一是通用大模型性能提升和優化進一步深入;二是大模型將從簡單智能應用向複雜智能應用邁進;三是大模型超級應用將出現,提供體驗感極強的智能服務。

所以,在經曆了近600天的發展後,國產人工智能賽道已從“有沒有大模型”,變成了“能不能做好大模型”以及“能不能用好大模型”。面對新的問題和考驗,“通用大模型國家隊”已經用技術積累和應用生態作出回應。

如果說在大模型元年,我們看到的是大模型的數量。那麼在更遠的未來,在我們所期待的AGI,已經有領先者用大模型的應用質量和普惠價值鋪設了通向穿越“奇點”時刻的路。