新經濟視界 | 國產大模型掀起“長內容”大戰要把AI變成人們的“超級知識助手”

封面新聞記者歐陽宏宇

繼通義千問、Kimi之後，又一國產AI大模型正式進入長內容競賽。

4月26日，科大訊飛更新訊飛星火大模型V3.5版本。更新後，訊飛星火將支援長文本、長圖文、長語音功能，以及多情感超擬人合成、智能體平台等能力。據介紹，這些能力將幫助個人和企業解決大模型落地的最後一公里難題。

國內大模型開始新一輪“我有多長”的比賽，背後是具備了長內容能力後，AI大模型不僅能夠把各種信息來源的海量文本、圖文資料、會議錄音等進行快速學習，進而在各種行業場景給出專業、準確回答。圍繞這一應用場景，多個國內大模型已展開競爭。

以長文本為例，今年3月，在Kimi限額開放200萬字長文本能力後，各大廠排隊官宣跟進這一賽道。通義千問緊隨其後直接免費開放1000萬字長文本功能，文心一言、360智腦也在籌備或內測相關能力，其開放文本長度也在500萬字左右。訊飛星火長文檔能力總體也已達到GPT-4 Turbo最新版本的97%水平，甚至在部分垂直領域實現超越。

大模型帶來的知識管理革命正在上演。據統計，用戶使用AI大模型的最高峰是工作日的上午9:30和下午3:30。這意味著，大部分用戶都在用大模型來解決和工作相關的剛需問題，因而高效的知識獲取成為用戶和開發者都高度關注的問題。

“在知識獲取和學習的過程中，人們能拿到的資料往往不僅是現成的長文本，還有存在於報刊書籍、PPT、培訓視頻等媒介中，AI大模型需要幫助用戶從中快速獲取知識。”業內人士表示，支援長內容的大模型，則可以用來解決用戶真實場景中多源信息的獲取需求。

具有長內容能力並不只是讓大模型囫圇吞棗地把所有知識都灌進“肚子”里，還需要算力支援，讓AI理解和應用其中的內容、知識，進而幫用戶解決真正的問題。科大訊飛董事長劉慶峰透露，通過對大模型進行模型剪枝和蒸餾，就能讓AI在效果損失很小的情況下，實現文檔上傳解析處理、知識問答的首響時間以及文字生成方面的能力提升。