對話李開複:為了變道,籌備了數月

出品 | 虎嗅科技組

作者 | 王欣

編輯 | 苗正卿

頭圖 | 零一萬物提供

在海澱區毗鄰北京大學的零一萬物辦公區中,員工依然忙忙碌碌,彷彿並沒有受到外界輿論風波的影響。

身處漩渦中心的李開複,第一時間與虎嗅進行了一對一交流。

是什麼契機讓李開複重新思考預訓練?從什麼時候開始暫停對超大模型的追求?做出了什麼影響公司命運的關鍵抉擇?

面對虎嗅的靈魂拷問,他依舊保持一貫的溫文爾雅,絲毫沒有迴避外界關心的焦點,並分享了他做出轉變的心路歷程。

雖然在外界看來零一萬物的轉變有些突然,但對李開複和零一萬物來說這是一次有章法有節奏的「變道」,甚至在半年前就開始長線佈局。

以下是虎嗅與李開複溝通實錄:

虎嗅:零一萬物內部的決策模式是怎樣的?比如你是更樂於和大家商量?還是你更相信自己的預判?

李開複:在我創業之初,就集結了一批「願意相信我,我也很信任他們」的創始團隊。穀雪梅、馬傑、祁瑞峰、Anita等,這些人從一開始就在我的聯創團隊里,最初的核心聯創團隊基本上沒有改變,還有約20位勤奮強悍的干將。

我們因為同樣信仰AGI,同時也勇於腳踏實地地擁抱應用落地和商業化,所以我們走到一起來。即使在充滿壓力的狀況下,任何同事都可以跟我約一對一的時間,我們固定舉辦開誠布公無話不說的TGIF全員溝通會,每個重要決策從判斷到落地,必定是我們達成共識的結果。

虎嗅:你什麼時候開始對預訓練有新的思考?有什麼關鍵節點,是你思考這件事的契機嗎?

李開複:大模型賽道技術迭代特別快,所以必須做超前預判和佈局。在 2024 年 5 月的時候,我們就開始思考預訓練的路線問題。在 2024 年 5 月,我們發佈了一個千億參數模型 Yi-Large,當時 Yi-Large 的模型表現很好,在國際權威盲測榜單 LMSYS Chatbot Arena 總榜上取得了當時世界第七、中國第一的成績。但是從現在往回看, Yi-Large 在模型推理速度和推理成本優化方面,還有相當大的提升空間。

原本我們模型路線圖上的下一個版本是更大尺寸的 Yi-X-Large,仍然走稠密模型、需要加倍的卡才能做到的路線。當時我們就面臨著一個抉擇,是繼續沿著 Scaling Law,用更多的 GPU、更多的數據去訓練更大參數規模的模型,還是說我們要采更務實的路線,去專注於做更輕量化、但是模型性能依然能保持領先的模型?

我們內部在半年多前就意識到了 Scaling Law 的邊際收益遞減,對初創公司最直接的就是財務影響,我的財務同事每幾週跟我過現金流,看到算力一個月一個月的支出,真不是可持續的方式。賭上巨量資源去訓練超大參數規模的模型,超低的性價比對初創公司來說,肯定不是一個務實的選擇。

那次的關鍵技術決策討論是個節點,經過很多實驗後我們決定換一個路線,去年10月零一萬物推出的新旗艦模型 Yi-Lightning 是我們一次嘗試,Yi-Lightning 採取MoE(混合專家)架構,激活參數僅20多B,但模型表現更出色——模型性能上超過了 2024 年 5 月版本的 GPT-4o,發佈時在 LMSYS 上排名世界第六、中國第一(2024 年 10 月 16 日數據)。更重要的是,Yi-Lightning 的模型訓練成本僅350萬美元,僅是 GPT-4o 的 1/30,我們的推理成本做到行業最低,喊出大模型也能有「白菜價」。

從去年下半年,我們開始暫停對超大參數規模的模型的追求,回頭複盤,真是還好沒加那多幾千卡的成本。

虎嗅:當你意識到這件事情後,你當時做的第一個決定是什麼?你如何去推動公司內部接受這個認知,並參與到這個轉型之中?

李開複:有了前面提到的這個放棄 X-Large 的轉變和驗證,公司內部也很快都達成了共識。因為作為親身經歷者,我們每個人都看到了,跟AI 1.0時代不一樣,AI 2.0時代大模型技術和產業發展都是被加速的。大模型公司融到了更多資源,但是也因為大模型預訓練投入更大的資源。從技術上看,僅僅一年多的時間,引領大模型前進的傳統 Scaling Law 邊際收益遞減明顯,商業化上同樣如此,我參與過 AI 1.0 時代的投資和孵化,一家公司獲得商業化的成功可能有5到8年窗口,相比之下,大模型賽道一切加速,AI 2.0 大模型公司會更快地面臨商業模式的靈魂拷問。

在當下的階段,聚焦「小而美且便宜」的模型,在此之上加速應用落地和商業變現,不論是在技術角度,還是在商業角度,都更實際、更負責,也是更健康、更能走下去的選擇。

虎嗅:這個轉型中最大的挑戰來自什麼?

李開複:可能外界觀感是零一萬物轉型調整來得突然,但是我們從去年第二季度開始針對技術路線進行複盤,第三季度開始嘗試構建輕量化模型 10 月推出了Yi-Lightning,同時積極在 ToC 和 ToB 領域探索落地,11月份我們首度公佈了 ToB 戰略,再到 2025 年年初宣佈與阿里雲成立產業大模型聯合實驗室,你可以看到,這一切調整都是基於長線戰略調整循序漸進、一脈相承的。只是近期一些噪音和歪曲解讀突然出現,讓我們有章法有節奏的佈局對外界顯得有些突然。

歷史上許多新的技術過了黑科技發明期,面臨技術落地和產品化的時候,沒能獲得商業的成功,這個階段被稱為「創新死亡穀」。零一萬物已經證實了我們能做世界級的技術,是時候要關注和聚焦模型能力的落地實現,運轉出能良性造血的商業模式。

更確切地說,行業正在集體穿越大模型時代的「創新死亡穀」

最大的挑戰在於有限的資源、有限的時間。行業對 Scaling Law 從追捧到懷疑就不到一年的時間,我們如何在時間表裡製定計劃、保持敏捷,在有限的資源里最大化我們的執行力。我們必須以快打快,不進則退。

虎嗅:圈內有些公司在做ToB業務同時仍然在做預訓練,你如何看待?

李開複:如果一家創業公司的長板足夠長,不管你的長板是在模型上還是產品上,都可以一定程度上回答所謂的靈魂拷問。我在這裏不點評其他家的做法,我相信大家都能夠找到專屬於自己的道路。

對於零一萬物而言,我們的長板就是能夠在保證模型性能處於世界第一梯隊的同時,大幅降低訓練和推理成本、大幅提升推理速度。大模型公司第一年在前期科研、模型訓練方面需要花費巨量的資源,狂奔進入第二年後,初創公司更應該有一個符合商業邏輯、對投資人負責、能確保活下來的商業模式。

虎嗅:在ToB這件事情上,你認為零一萬物最本質的競爭力在哪幾個維度?這幾個維度在你心中它的排列順序該是什麼樣的?

李開複:首先,在經過一年多的技術沉澱,零一萬物已經具備了世界第一梯隊的技術能力,證明了自己能夠交付出性能世界領先的模型。我們技術底子夠硬。

其次,在尋找落地場景這件事上,我們不像其他 AI 公司能夠僱傭數百個銷售。但我本人以及聯創團隊都有著豐富的人脈資源,使得零一萬物能夠從開始就切入重點領域內的頭部公司,快速找到適合凝練出標準化 ToB 解決方案的領域和場景。

第三,零一萬物還可以跟創新工場聯動。創新工場投資的很多領域的公司,比如 AI 製造、 AI 金融、 AI for Science、具身智能、無人駕駛等等,跟我們都是非常互補的,都可以在行業大模型方面展開合作。

創辦零一萬物的最初目標是在實現我的 AGI 夢想同時取得商業上的成功,我們要做的是要讓頂尖大模型能力走出實驗室,去進行產業落地,打造AI-First產業應用,把技術超能力變成「鈔能力」,創造實質的商業價值,才能面對最後的靈魂拷問:你到底能不能把技術轉換成商業價值?先有收入,再增加收入,然後收窄虧損,最終從單點盈利到多點持續盈利。

虎嗅:你認為2025年在 ToB 業務上,真正考驗每家公司的焦點能力是什麼?這種情況下我們如何保持自己的競爭優勢?

李開複:2025 年是 AI-First 應用爆發的元年,中國有望在應用元年彎道超車,零一萬物必須提前爭位。

大模型 ToB 行業的挑戰是,客戶和技術提供商不是雙贏,而是一方壓價,另一方因為沒有利潤只能隨便做做。對於大模型公司來說,很大一部分的 ToB 合作客戶付費意願不高,服務場景也很難做成可複製化的產品。這就會變成惡性循環:大模型公司沒辦法全身心投入,客戶也沒辦法從解決方案中獲得業績增長,最後大家都賺不到錢。

在零一萬物看來,有三種 ToB 的方向是值得嘗試的。一種是能夠為客戶創造核心價值的,不僅能慳錢,更重要的是能夠幫助客戶做增長。比如零一萬物的如意數字人和萬視營銷短影片;第二種是在一些特別垂直、又很適合大模型落地的領域,與真正有遠見、有決心擁抱大模型的公司一起共創,打造行業大模型。基於目前為人熟知的金融、醫療等領域,零一萬物會再向下挖掘更垂直的行業,在這些垂直行業里,行業龍頭可能會因為大模型而產生營業額的快速增長。這類企業每個都是金礦,我們已經有了一些嘗試。第三就是服務可複製、可快速規模化的領域,服務第一個客戶時可能不賺錢,但相似的產品可以服務很多家同類型的客戶。

目前,在國內 ToB 方向上,零一萬物在遊戲、能源、汽車、金融領域都在談千萬以上的單子,而且基本都是軟件單。下一個階段零一萬物會繼續放大這些領域,也會進入有機會的新領域。如果能結合對方的行業 Know-how、數據和零一萬物的技術,比如以共同設立合資公司的形式,一起做細分的行業模型和更好的行業解決方案,就能創造更多價值。我有把握,在 2025 年能有數倍收入增長,從 1 億做到數億。