國產大模型首超GPT-4o,李開複:中美頂尖模型的時間差只有五個月

預訓練成本太高,一些公司快要扛不住了;內捲得越來越厲害,各家廠商都是賠錢賺吆喝……

在最近國內大模型行業暗流湧動的時候,零一萬物發佈了全新 SOTA 旗艦模型亮相,中國大模型中首度超越 GPT-4o,正面闢謠瘋傳的流言:絕不放棄預訓練,而且做得又快又好。

關注 AI 第一新媒體,率先獲取 AI 前沿資訊和洞察

超越 GPT-4o,追平 Grok,國內大模型的第一次

在對大模型的測評中,LMSYS Org 發佈的 Chatbot Arena,以「盲測」機制著稱,是最能反映用戶體驗的測評標準之一。這一次,零一萬物的 Yi-Lightning,排名世界第六,中國第一,穩居世界第一梯隊大模型公司之列。

其中,在中文子榜單上,Yi-Lightning 超越了 xAI 發佈的 Grok-2-08-13、智譜發佈的 GLM-4-Plus 等國內外優質模型,與 o1-mini 等模型並列排名世界第二。

在零一萬物召開的線上發佈會中,李開複展示了一段不同模型對莎士比亞作品《李爾王》的翻譯。Yi-Lightning 在結合上下文、轉譯微妙的語義方面格外突出,展現了出色的中英互通能力。

而這些,恰恰與之前的風傳相反:預訓練功不可沒。

上週國內的大模型行業傳出風聲:國內部分模型公司,打算放棄成本高昂的預訓練,不再和國外大廠硬拚——零一萬物是被猜測是其中打算放棄的公司之一。

「這個事情我們就正式闢謠,這個理解是錯誤的。」李開複在發佈會上說。

他表示,GPT 新發佈 o1 之後,的確帶來了新靈感,「一年半以前大家覺得大模型最厲害的地方就是預訓練,一年以後發現 Post train 也是同樣重要,這感謝 OpenAI 點醒我們這一點。」

不過,後訓練的重要性變高,不代表要徹底放棄預訓練。

在 Yi-Lightning 的訓練過程中,採用 Mixture of Experts(MoE)混合專家模型架構,同時改進了單階段訓練,使用了多階段的訓練模式,並且採用了混合注意力機制(Hybrid Attention)。在保持模型性能接近最優的同時,儘可能減少激活參數的數量以降低訓推成本,提高推理速度。

「中國的六家大模型公司,只要有夠好的人才,想做預訓練的決心,融資額跟芯片都不會是問題的。」李開複說。

「很多人問中國的預訓練是否落後美國?我們也坦誠中國是落後美國,但有人說落後十年、二十年,今天我們可以用非常精確的數字來算:GPT4o 在 5 月做出來的模型,我們在 10 月的今天已經把它打敗了。如果真的算中國趕超美國有多遠的距離,至少,零一萬物離 OpenAI 的模型,只差五個月。」

在低價面前,一定是對性能的保證

看得出來,在對於模型訓練的規劃上,零一萬物仍然在「模基共建」的戰略路徑上穩定前進。有所變化的,是對商業化的理解。

自從五個月前發佈千億參數模型 Yi-Large 之後,零一萬物相繼和阿里雲、360、順豐科技、飛書、釘釘、鈦動科技等頭部企業達成合作,toB 的路子越走越寬。

「SaaS 在國內,還是一直有很大的問題。」李開複解釋道,SaaS 自身有很多不同的模式,比如計量,比如訂閱,比如分成,都很可持續,但在國內並沒有一個普遍被接受的 SaaS 模式。

「首要任務就是要尋找少數能夠按使用情況收費的方法,而不是項目定製的方法,能得到比較高利潤率的訂單再去做。」李開複說。

零一萬物對 toB 和 toC 的業務,有了更明確的側重。針對國內的環境,比如明顯遙遙領先的零售、電商行業,這次推出了「AI 2.0」數字人,提供了動作訓練、表情生成等能力,並配備 AI 2.0 門店短影片解決方案。

而 toC 的探索則主要放在國外,「我們嘗試了一些產品,有些表現很好,有些沒有那麼好。在國內,也在觀察什麼時候適合在國內做什麼樣的產品。」

這是考慮到國內的用戶獲取的流量成本,已經被一卷再捲得很高,且無法控制流失率。相比之下,獲客成本較低而且營利方式更多元成熟。「現在當下最大的理由還是說國外做 to C 的產品,我們變現能力和消耗用戶增長的成本算賬可以算得過來,以後再關注國內有什麼機會可以推出。」

當然,無論是 toB 還是 toC,對於模型的追求都是一以貫之的:性能越強越好,價格越低越好。

目前 Yi-Lightning 已上線 Yi 大模型開放平台,每百萬 token 僅需 0.99 元,直逼行業最低價,讓人不禁要問,零一萬物也來卷價格戰了?

「我們還是有利潤空間,所以歡迎大家使用,不用擔心我們被你用垮了。」李開複解釋道,0.99/百萬 token 的價格看似捲起來了,但實際應用中,調用量累積下來還是很大,因此需要把價格平衡在一個適當的區間,「不會賠錢賣模型,但也不會賺很多錢,而是在成本線上加一點點小小的利潤」,以保證開發者能在用上優秀模型的前提下,再去挑最便宜的。

放眼望去,中國大模型產業進入到了「耐力賽」階段,如何讓大模型賦能千行百業,提升企業新質生產力是一個重要的命題。

這不僅將牽涉到大模型在各個具體行業里的未來發展方向,甚至會影響世界的創新版圖。