新經濟觀察丨國產頭部AI大模型再降價 規模效應逐步體現成本有望持續下降

封面新聞記者 孟梅 歐陽宏宇

繼今年上半年首次大幅降價後,國產頭部AI大模型再次降價。

9月19日,阿里雲CTO周靖人在雲棲大會上宣佈,Qwen-Turbo價格直降85%,低至百萬tokens 0.3元,Qwen-Plus和Qwen-Max分別再降價80%和50%。其中,推理能力追平GPT4的Qwen-Plus同等規模較行業價格低84%。

今年5月,AI大模型打響了價格戰,BAT、科大訊飛、字節、智譜等多家企業集體降價,百萬tokens低至1元,開啟了大模型“厘時代”。進入7月後,又一輪價格戰開啟。

百度在2024世界人工智能大會期間,宣佈文心旗艦款模型ERNIE 4.0和ERNIE 3.5大幅降價,ERNIE Speed、ERNIE Lite兩款主力模型持續免費。其中,ERNIE 4.0 Turbo輸入輸出價格分別低至0.03元/千Tokens、0.06元/千Tokens。

雖然價格下降了,但摩爾定律並沒有在AI大模型的賽道上消失。以通義大模型為例,其旗艦模型Qwen-Max性能已接近GPT-4o,新一代開源模型Qwen2.5中72B性能超越Llama 405B。

在價格和性能的雙重更新之下,也帶來了用戶規模的大幅增長。周靖人透露,自首次宣佈降價後,百煉付費客戶數較上一個季度增長超過200%,大批企業和開發者已放棄私有化部署,選擇直接調用各類AI大模型。

那麼,大模型的價格戰是否會持續下去?何處是降價的底部?業內人士分析稱,大模型降價的本質是讓利給企業和開發者,使其像基礎設施一樣讓開發者都能用得起。“如果大模型太貴的話,是沒有辦法讓其得到大規模使用的;對於AI服務商而言,也有機會通過規模效應把大模型的成本降下來。”