字節、阿里雲、百度大模型價格混戰:低價背後是數據競爭,爆款尚未出現

大模型價格戰愈演愈烈。

5月21日,阿里雲宣佈,通義千問GPT-4級主力模型Qwen-Long,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%。這意味著,一元可以買200萬tokens,相當於五本《新華字典》的文字量。這款模型最高支持1000萬tokens長文本輸入,降價後約為GPT-4價格的1/400。

在阿里雲武漢AI智領者峰會現場,阿里雲智能集團資深副總裁、公共雲事業部總裁劉偉光表示:「阿里雲這次大幅降低大模型推理價格,就是希望加速AI應用的爆發。我們預計2024年大模型API的日調用次數有望突破100億。」

上週,字節跳動剛剛高調入局大模型戰場,豆包主力模型在企業市場的定價只有0.0008元/千Tokens,引發外界廣泛關注。這次,阿里雲也為通義千問打出了「擊穿全球底價」的口號。對此,火山引擎相關負責人回應稱,非常歡迎通義千問大模型降價,共同助力企業以更低成本探索AI轉型,加速大模型應用場景落地。

而在幾小時後,百度智能雲也宣佈,文心大模型兩大主力模型全面免費。這似乎意味著,大模型價格戰已經全面打響。

不過,也有業內人士對澎湃新聞表示,所謂「價格戰」更像是一個噱頭,「看起來很熱鬧,最後效果可能不如預想」。

技術「卷」出低價?

5月15日,字節跳動在火山引擎原動力大會上正式發佈豆包大模型,被認為是吹響了大廠大模型價格戰的號角。

據字節方面介紹,豆包主力模型在企業市場的定價只有0.0008元/千Tokens,0.8厘就能處理1500多個漢字,比行業便宜99.3%。根據火山引擎公佈的價格計算,一元錢就能買到豆包主力模型的125萬Tokens,大約是200萬個漢字,相當於三本《三國演義》。

火山引擎總裁譚待在接受澎湃新聞等媒體採訪時,談到了大模型的定價策略。譚待坦言,「背後主要有兩個原因:第一點是我們能做到,第二點是我們需要這麼做。」他介紹,火山引擎在技術上有非常多優化手段,可以降低大模型成本,在工程上可以通過分佈式推理的形式將底層算力使用得更好;另外,在混合調度方面,可以把不同負載作為混合調度,這樣的成本也大幅下降。

阿里雲相關人士也對澎湃新聞記者表示,能夠推出低價大模型「主要靠技術層面」。

在字節「開啟」大模型價格戰後不久,騰訊雲副總裁、騰訊雲智能負責人吳運聲在接受澎湃新聞記者採訪時對此回應稱,騰訊大模型的底層能力和構建工具鏈都在快速迭代過程中,未來會把核心精力放在產品和技術能力發展上,相信能夠提供有競爭力的模型和產品。

而在更早之前,國內大模型公司智譜AI宣佈,個人版/入門版GLM-3 Turbo模型調用價格由5元/百萬tokens降為1元/百萬tokens,相當於0.001元/千tokens。

5月6日,幻方量化旗下DeepSeek(深度求索)發佈第二代MoE模型DeepSeek-V2,稱DeepSeek-V2「性能比肩GPT-4」,每百萬token輸入1元、輸出2元(32K上下文),是GPT-4的近百分之一水平。

在社交平台上,有認證為深度求索員工的用戶表示,公司能夠兼顧模型效果和成本,「基本純靠模型結構創新(MLA+DeepSeekMoE)+ 超強Infra(基礎架構技術)」。

順福資本創始人、行行AI董事長李明順認為,為了爭奪市場佔有率,大模型價格戰的到來是「必然的」。隨著規模效應的展開,「笑到最後的肯定能賺錢,這個就是定價策略的問題」。不過,在這種情況下,大模型初創企業可能會面臨較大的挑戰,所以也有很多人「從做大模型變成做應用公司」。

華泰證券在近期研報中也寫道,目前,從基礎大模型到行業大模型、再到終端應用的大模型路線非常清晰。訓練基礎大模型的高成本和高技術壁壘,決定了科技巨頭或成為主要玩家。基礎模型現在仍處於軍備競爭的階段,未來競爭格局有兩種可能,即贏者通吃或國內外多個大贏家共存。

用低價換取數據,關鍵要看爆款

國內大模型市場正在因價格戰而熱火朝天,但這份熱鬧能否為行業帶來真正的用戶和活力,還是一個未知數。

作為大模型行業內的初創企業,製作API集合工具包的藍雨AI聯合創始人北山對澎湃新聞記者表示:「這個行業目前遇到的一個最大的卡點,其實不在於成本,而是沒有一個大模型或者應用,能夠讓大部分用戶不用不行。」

北山進一步指出,重要的一點其實在於「市場教育」,不管是C端還是B端,如何讓用戶切實感受到AI的用處、願意為AI付費,出現真正的「爆款」,可能才是大廠和中小微企業都需要考慮的關鍵問題,不然就僅限於「圈地自萌」。

某大廠大模型相關負責人也向澎湃新聞記者坦言:「實際上行業還沒發展到價格戰的階段,還需要不斷提升底層技術和應用能力……降價當然是有利於客戶和市場的好事,但現階段比降價更重要的是提供高質量的服務。現在市場上一個重要的問題是缺乏有價值的剛性應用,降價對於應用創新可能有一定幫助,對於垂直行業客戶市場的影響不太好說。」

作為基礎大模型與用戶端之間的「中間廠商」,瀾碼科技的CEO周健表示,目前還沒有到「用戶端真正受益」的平衡點,「文生圖等應用可能會迎來新一波降價或者免費趨勢,但是距離最終用戶能夠用上這個東西還是有差距」。不過,周建也指出,降價對產業的實質性影響,第一是「讓爆款應用的開發變得更加容易」。

雖然有業內人士稱這場價格戰更像是一個「噱頭」,周健則認為,這其實是各大廠商之間在競爭數據:「大模型廠商實際上在燒錢進行大量的投入,有點類似於當年‘百團大戰’、滴滴和快的打車競爭的格局。我認為大模型廠商並沒有太考慮定價能否cover(覆蓋)成本或帶來利潤,從大模型廠商的商業策略講,現在降價的主要目的更多還是收集數據。」

在此前的採訪中,譚待也談到,今年是大模型提升應用之年,需要將AI相關生態建立起來,但是創新的風險成本很高,只有把試錯成本降低,才能實現更大範圍的普及,市場的呼聲就是字節跳動選擇降低成本的核心原因,「用虧損換收入是不可持續的,所以字節跳動從來不走這條路」。

從用戶的角度來看,在選擇國內大模型時,成本也不是唯一需要考慮的因素。

周建認為,在價格之外,還有更重要的因素:「更關鍵的是模型的質量或能力,包括大型模型的推理能力。另一方面與模型的參數密切相關,在客戶算力有限的情況下,不同的參數決定了我們能夠處理的項目規模……此外,模型的連續性也是一個非常重要的屬性。」

前互聯網大廠的資深創意負責人、AI驅動的創意公司zax創始人趙晨對澎湃新聞記者表示,AIGC(生成式人工智能)已改變他的工作流,但面對國產大模型的降價,他認為吸引力一般:「需求者要的是聰明準確的大模型,而不是便宜,就想請醫生看病是考慮能否治好,而非僅考慮價格因素。」