新經濟觀察丨國產頭部AI大模型再降價規模效應逐步體現成本有望持續下降

09月19日 15:39 新浪網 tech-auto-hilite

封面新聞記者孟梅歐陽宏宇

繼今年上半年首次大幅降價後，國產頭部AI大模型再次降價。

9月19日，阿里雲CTO周靖人在雲棲大會上宣佈，Qwen-Turbo價格直降85%，低至百萬tokens 0.3元，Qwen-Plus和Qwen-Max分別再降價80%和50%。其中，推理能力追平GPT4的Qwen-Plus同等規模較行業價格低84%。

今年5月，AI大模型打響了價格戰，BAT、科大訊飛、字節、智譜等多家企業集體降價，百萬tokens低至1元，開啟了大模型“厘時代”。進入7月後，又一輪價格戰開啟。

百度在2024世界人工智能大會期間，宣佈文心旗艦款模型ERNIE 4.0和ERNIE 3.5大幅降價，ERNIE Speed、ERNIE Lite兩款主力模型持續免費。其中，ERNIE 4.0 Turbo輸入輸出價格分別低至0.03元/千Tokens、0.06元/千Tokens。

雖然價格下降了，但摩爾定律並沒有在AI大模型的賽道上消失。以通義大模型為例，其旗艦模型Qwen-Max性能已接近GPT-4o，新一代開源模型Qwen2.5中72B性能超越Llama 405B。

在價格和性能的雙重更新之下，也帶來了用戶規模的大幅增長。周靖人透露，自首次宣佈降價後，百煉付費客戶數較上一個季度增長超過200%，大批企業和開發者已放棄私有化部署，選擇直接調用各類AI大模型。

那麼，大模型的價格戰是否會持續下去？何處是降價的底部？業內人士分析稱，大模型降價的本質是讓利給企業和開發者，使其像基礎設施一樣讓開發者都能用得起。“如果大模型太貴的話，是沒有辦法讓其得到大規模使用的；對於AI服務商而言，也有機會通過規模效應把大模型的成本降下來。”