對話李開複:零一萬物融的錢夠做預訓練,我做toB不會虧錢

作者|lijingya郵箱|lijingya@pingwest.com

剛從美國回來的李開複,想清楚了很多事情,他的大模型公司零一萬物也開始發生變化。

在10月16日難得的一次溝通會上,李開複「回應一切」。他提到,最近自己意識到只有基座好的模型才能達到PMF(產品和市場地完美匹配),而如果想激活一個健康的生成式AI生態系統,幫助自身的AI產品提高盈利能力,就需要有白菜價的世界頂級模型。在當天的線上發佈會上,零一萬物發佈了新模型Yi- Lightning,就是李開複心目中最符合這一標準的模型。

目前零一萬物模型序列分為開閉源兩方,開源模型如Yi-9B,Yi-1.5,Yi-Coder更多打出品牌效應,閉源模型中,千億參數模型 Yi-Large是零一萬物最重要的當家大模型,而本次的Yi- Lightning代替了他的位置。

在全球大模型評測金標準的加州伯克利大模型競技場LMSYS之上,Yi- Lightning排名總榜第六,超越了矽谷知名OpenAI GPT-4o、Anthropic Claude 3.5 Sonnet,排在中國第一,放在LMSYS這一公開擂台上,這算是中國大模型首度實現超越OpenAI GPT-4o 的最佳成績。

從評測結果看,Yi-Lightning有相對優秀的模型性,在推理速度和推理成本方面也展現了突破能力,較上一代旗艦模型Yi-Large ,Yi-Lightning的最高生成速度提速了近四成。李開複稱,這款模型以每百萬token降至0.99元的價格,會帶給零一萬物「百分之幾十的利潤」。「我們不會賠錢賣,但也不會賺太多。」李開複進一步表示,「要能讓APP使用,就要把性能極高的模型做到白菜價。」他透露,現在Yi- Lightning已經獲得幾家大型客戶訂單。

除此之外,零一萬物在國內市場決定從C端轉向B端。當天,零一發佈了一套數字人解決方案。其聚焦零售和電商等場景,將旗艦模型Yi Lightning 實踐於具體行業。

而在五個月前,零一萬物的重心還在C端AI辦公助手萬知。彼時李開複曾強調自己不做虧錢的toB生意。

據矽星人瞭解,零一萬物下半年的內部策略為國內主抓toB,國外主抓toC,目前,其內部已經孵化出新的toB產品矩陣,即將在近期線下集中亮相。

國內toB市場主要以API接口調用量和定製化軟硬件交付項目進行收費,C端市場則主要通過訂閱製進行付費。李開複發佈會上強調,零一要做的toB依然不是虧錢的toB。

「零一萬物的toB做法是做有利潤的解決方案,不只是賣模型不只是項目製。」李開複表示。他進一步稱,由於基因問題,一家大模型公司同時做B端和C端非常辛苦,需要多元化的管理方式,也需要差異化的衡量方法。「零一萬物選擇把toB放在國內做,找破局空間,比如用數字人做零售,做餐飲,會形成完整解決方案,找本地供應商。」

那麼toC還做麼,toC還做,國內暫時不推新,還在國外做——「toC我們選擇做國外,toC產品在國內如果走流量會面臨成本的居高不下,」李開複稱,會繼續維護萬知的運營,但此後會把更多精力放在國外,「用更低價買到更高質量用戶,或者直接把App賣出,讓國外用戶訂閱收費。」

針對一些頭部大模型初創暫停了對基礎模型預訓練的傳聞,李開複也做了回應。他認為,做一次預訓練模型的費用在300多萬美金左右,這個價位對於頭部初創不成為問題。只是「做好預訓練模型是一個技術活兒,需要很多有才華的人一起工作。」而如果一個公司有幸擁有這些人才,跨領域合作,中國就有機會做出世界前十的預訓練模型。

在大模型頭部初創都面臨模型能力增長放緩和變現焦慮的當下,零一萬物堅持推出基礎模型,並劍指B端市場,是為一款經典打法。從李開複的表述中可以洞察,融資難度的加劇以及資源的緊缺並未對這家公司造成影響,模型方面與OpenAI的6個月差距也並不給他形成焦慮。零一萬物似乎還在堅持,用基礎技術創新的方式,在競爭激烈的市場中謀求新的增長點,這與其他大模型初創的道路已經出現分野。

「如果期待破局,可能需要一個前所未有的算法才有機會。」李開複如是說。

以下為發佈會問答環節,有適度刪改。

問:此前有消息稱AI方面的六小虎中的某幾家放棄了預訓練,開複曾進行闢謠,但站在行業角度,請您評估,對預訓練模型逐步放棄會是行業整個趨勢嗎?

李開複做好預訓練模型是一個技術活,而且要非常多有才華的人在一起工作,慢工出細活,需要懂芯片的人,懂推理的人,懂基礎架構的人,懂模型的人,有很好的算法同學,才能一起做出來。

如果一個公司能有幸擁有這麼多優秀的人才,能夠跨領域的合作,那我相信中國是絕對可以做出世界排名前十的預訓練的通用模型,但不是每家公司都可以做這件事情,做這件事情的成本也比較高,以後有可能會越來越少的大模型公司訓練做預訓練。不過據我所知,這六家公司融資額度都是夠的,我們做預訓練的production run,訓練一次三四百萬美金,這個錢也是頭部公司都付得起,我覺得中國的六家大模型公司只要有夠好的人才,想做預訓練的決心,融資額跟芯片都不會是問題的。

問:OpenAI的o1發佈後,很多人認為,從技術上會帶來新的範式。這對初創公司來說會有哪些影響?

李開複我剛從美國回來,跟OpenAI的人有溝通,他們跟我分析公司內部還有好東西,但不急拿出來,因為他們領先行業足夠多,到了一定的業務節點才釋放出來,這是他們能做而別人不能做的。OpenAI o1 雖然隱藏了所有中間的思考狀態,但還是很多人在網上開始猜它怎麼做,我們認為有一些揣測比較可靠。當你發起一個新技術時,這個技術一定會被很多聰明人使用揣測,我覺得五個月以後,應該也有不少類似o1模型的能力會出現在各個模型公司,包括零一萬物。

o1的思考模式是把之前只在預訓練中 scaling 趨勢擴展到了推理的時候,這件事情對行業是最大的認知改變。過去大家覺得誰預訓練做好就夠了,慢慢大家發現後訓練SFT和強化訓練都是非常重要。所以零一萬物的團隊剛開始做的主要是專注預訓練,之後又有很多很厲害的人加入,幫我們把Posttrain(後訓練)也做出來,現在看來推理也很重要,一年半以前大家覺得大模型最厲害的地方就是預訓練,一年以後發現後訓練也是同樣重要,這感謝OpenAI點醒我們這一點,現在我相信很多中美公司都在往o1方向狂奔。

問:開複前說「不做賠錢的to B」,這次卻首次公佈了相關矩陣,是否意味著我們也嘗試往to B方向進一步深耕?

李開複我們特別重視給每個用戶提供價值,所以我們不會去說有模型,你要拿來做什麼,我賣給你,你先給錢,這樣對用戶是不會滿足的。另外一種常見的做法,就是到企業里,企業說我要作客服,模型賣給我,怎麼作客服我不會做,你幫我做,這就成為和AI1.0時代一樣的可以稱為系統集成型的AI,也就是說賣模型給你,先幫你把客服應用做好,這樣的情況下很難有利潤,之前我說如果做一單賠一單的to B,零一萬物寧可不做,這句話我們並沒有改變。

我們剛剛發佈的AI 2.0數字人解決方案不會做一單賠一單,因為它是專注到用戶重大的痛點需求和盈利點,也就是說一個店長或KOL平時做一次直播浪費最重要的資源,就是他的時間,而且這個時間就算做一小時的直播能賺到一千塊錢,也就是一千塊錢,但如果用數字人直播就不是一小時了,可能可以做一千個小時,哪怕每一個小時只能賺一半的錢,一千個小時還是可以賺五百倍的錢,這樣的賬就很好算了。如果真的能把數字人做到端到端,只要輸入公司內部的東西,這次減價的,選一個形象、聲音按一個鈕就開始百錄甚至千錄的直播,等於你是賣給這個企業一個印鈔機,印鈔機要收租賃費就是可行的了。除了直播以外,我們的AI 2.0數字人解決方案已經跑通了更多業務場景,比如AI伴侶、IP形象、辦公會議等等。我們繼續執行模應一體戰略,將Yi-Lightning模型能力與數字人解決方案結合,不斷迭代產品,後續會解鎖更多業務場景。

回到國內的SaaS的問題,國內現在很難說到SaaS,整個收費模式和商業模式在美國走通了,但國內還是一直有很大的問題。但也有一些行業可以走通SaaS,SaaS按使用收費,也可以訂閱,按照每個月收費,也可以用分成,這些模式都可以綜合稱為比較好的商業模式,因為它不是一次性賣掉,像一個項目製的公司幫你做一個客服賣給你,你付錢就走了,以後沒有錢可以收了,而是可以持續收費。剛才講的模式,無論分成、訂閱的SaaS模式才是可持續的商業模式,今天我們並沒有看到一個普遍被接受的SaaS模式的存在。所以在國內,我們大模型to B相對於AI 1.0時代有不同的打法,首要任務就是要尋找少數能夠按使用情況收費的方法,而不是項目定製的方法,能得到比較高利潤率的訂單再去做。

整體來看,零一萬物to B整體解決方案會採取「一橫一縱」的打法。和Yi-Large相比,Yi-lightning的模型性能又有大幅提升,作為國際 SOTA 的基座模型,他們本身就具備著出色的泛化性,再加上零一萬物自身擁有很強大的SFT(監督學習)能力。這些技術能力使得我們的團隊能夠先將單個行業做深做透,進而以自身技術能力和行業積累為基礎,凝練出標準化的to B解決方案,為各行各業的企業客戶降本提效,將世界第一梯隊的大模型用到實處,真正為企業帶來業務增長和新競爭力。

問:上次5月份時,Yi-Large把中美頂尖模型的時間差縮短到六個月,這次我們的發佈這邊直接擊敗了GPT4o,把時間差甚至縮短到了五個月,從零一萬物到整個中國大模型初創公司來說,預訓練模型要有自己怎樣的獨門特色,才能繼續追趕、縮短時間差?

李開複縮短時間差非常困難,我不預測我們可以縮短。因為畢竟人家是用十萬張GPU訓練出來,我們用的是兩千張GPU訓練出來,我們時間差能達到只是因為我們模型、AI infra等團隊都熱心聰明,去使用和理解對方做出來的東西,再加上我們每家的研發有特色,比如數據處理、訓推優化等等,現在這一套方法論在零一萬物已經成熟,我們有信心把自己的創新加上一些特長,融合對OpenAI和其他公司發佈新技術的關注,把它的能力在我們產品裡面發揮出來,我覺得這套方法保持在六個月左右,就已經是很好的結果了。

如果期待破局,可能需要一個前所未有的算法才有機會。我們千萬不要認為落後六個月是很羞恥的事情,或者一定要追趕,因為很多美國朋友都認為中國會遠遠落後,也有美國朋友認為,人家十萬張GPU等,我們要被甩掉三年、五年甚至十年都有可能,現在從零一萬物證明,不會落後這麼多,這次LMSYS榜單也有兩家其他中國公司表現不錯,不是只有我們一家在做。所以對於奮力圖強、勤奮努力、聰明多元化的團隊,在國內擁有這樣團隊的公司,要用類似零一萬物的打法,去貼近美國最頂尖的公司,不落後超過六個月,我覺得是可能,而且不只是我們一家可能,但難度是高的,希望再往下減非常困難,除非真的有一個發明和科技上的突破。

問:零一萬物在海外市場推出了to C的產品,同時在國內也逐步推出了to B的產品。在這種背景下,如何看待to B和to C產品之間的界限?零一萬物從去年開始以來進行嘗試把技術產品化,尤其在B端、C端方面有哪些優勢?二者有無場景和能力上的複用情況?

李開複:一個大模型公司同時做to B和to C也是很辛苦的,也是需要多元化的管理方式,因為兩個團隊的基因不一樣,做事的方法和衡量KPI的方法都不太一樣,我自己在這兩個領域有經驗,也在試著做,但是也絕對不能什麼都做,所以to B選擇做國內因為我們找到了一些破局的空間,比如用數字人來做零售,來做餐飲等等,這能做一個完整的解決方案,另外還有兩三個領域開始在做,現在還不方便披露。

我們覺得這樣的to B工作只能在中國做,因為要觸達美國的用戶或國外的用戶不太可能,所以全世界的範疇來說,to B供應商基本都是當地的,即便在中國要買SAP的產品也是SAP中國賣給你,所以跨國的設立分公司做to B絕對不是我們或其他的創業公司能做的,所以to B的國外就放棄了,做to B就做國內,做to B就做有利潤的解決方案,而不只是賣模型,不只是做項目製,這是我們to B的做法。to C我們主要佈局海外,有好幾個理由。第一個理由,當我們開始做零一萬物時國內還沒有合適的中文模型,我們只有在國外先嘗試,嘗試了一段就有了心得,就迭代了一個、兩個、三個產品,這些產品現在表現有些很好,有些沒有那麼好,我們也在不斷地調整中。

我們在國內也在觀察什麼時候適合在國內做什麼樣的產品,to C的產品在中國國內走流量有一個很大的問題,就是流量的成本越來越高,我們也看到了有些友商的單用戶成本從十幾塊人民幣加到三十多塊人民幣,近來還有相當的流失,在這樣一個挑戰環境里我們會非常謹慎,先不推出中國本土新的to C的應用,我們已有的產品還會繼續維護,但更多的精力會在國外的土壤用更低廉的錢買到非常高質量的用戶,或者能直接把App賣出去,讓用戶來訂閱收費,這個訂閱的習慣在國外也是比較良好,主要是這幾個理由。現在當下最大的理由還是說國外做to C的產品,我們變現能力和消耗用戶增長的成本算賬可以算得過來,以後再關注國內有什麼機會可以推出。

有關這兩者有沒有相似的地方?相似挺多。首先兩邊都需要非常高質量、快速的模型,我們有。另外我們會需要用到各種預訓練和後訓練的技術,這兩邊都會用上,一個to C的應用,調一個數字人的應用方法都需要類似的技術,我們有技術累積。當我們最終做出產品,比如to B的產品裡面需要的各種功能,還有to C需要的功能也有很多可以共用,比如AI閱讀、AI撰寫、AI PPT、AI搜索是很多to B、to C應用需要的模塊,今天看傳統的軟件底層還有很多是相似的,就是Windows裡面提供平台的API都是to B、to C共用,我們也在累積這些共用的地方。

問:你們新發佈的旗艦模型以白菜價格公示,這會造成虧本麼?

李開複:零一萬物在Yi-Lightning的定價上並沒有虧本。

從成立的第一天起,零一萬物就同時啟動了模型訓練、AI Infra、AI 應用三大團隊。當三個團隊都成熟以後,再對接到一起。零一萬物這一模式總結為模基共建、模應一體兩大戰略——AI Infra能力助力模型訓練和推理,以更低的訓練成本訓練出性能領先的模型,以更低的推理成本支撐應用層的探索。出色的模型性能與低廉的推理成本不僅能支撐零一萬物開拓絕佳的to B應用場景,還能讓零一萬物推出的大模型to B解決方案更具性價比。

之前回應行業價格戰時,我的回答就是零一萬物不參與。另外,我當時提到,不能只看模型價格,還要看模型性能是否足夠好。

當時有很多性能較差的模型價格降到非常低,甚至是免費,我相信當時選擇接入這類模型API的企業與個人,收穫都不達預期。

要接入API,足夠好的模型性能很重要,不然產品無法達到PMF。另外很重要的一點,是把高性能模型的價格降到白菜價,0.99元人民幣/百萬 token 的價格很便宜,但如果一個應用里每個用戶每天調掉十幾次,累積下來每年的成本還是不容忽視。零一萬物也在做App,做App需要控製成本,所以我們不會賠錢賣模型,但也不會賺很多錢,而是在成本線上加一點點小小的利潤,就得到了今天0.99元/百萬token的價格。

挑選模型API最重要的一點,就是模型性能一定要優秀,在這個前提下去挑最便宜的,實際算一算用戶掉用量會是多少,賬算不算得過來。我相信,綜合Yi-Lightning的模型質量和價格來看,Yi-Lightning很可能是很多開發者最認可、最高性價比的模型了。

問:此次公佈的to B解決方案矩陣是完整的嗎?近期是否還會公佈其他to B解決方案?

李開複:除了我們已經發佈的AI 2.0數字人、API之外,零一萬物目前還有 AI Infra 解決方案、私有化定製模型等其他to B業務,我們會在近期正式對外發佈,敬請期待。