科技

對話李開複：為了變道，籌備了數月

01月08日 21:35 新浪網 tech-auto-hilite

出品 | 虎嗅科技組

作者 | 王欣

編輯 | 苗正卿

頭圖 | 零一萬物提供

在海澱區毗鄰北京大學的零一萬物辦公區中，員工依然忙忙碌碌，彷彿並沒有受到外界輿論風波的影響。

身處漩渦中心的李開複，第一時間與虎嗅進行了一對一交流。

是什麼契機讓李開複重新思考預訓練？從什麼時候開始暫停對超大模型的追求？做出了什麼影響公司命運的關鍵抉擇？

面對虎嗅的靈魂拷問，他依舊保持一貫的溫文爾雅，絲毫沒有迴避外界關心的焦點，並分享了他做出轉變的心路歷程。

雖然在外界看來零一萬物的轉變有些突然，但對李開複和零一萬物來說這是一次有章法有節奏的「變道」，甚至在半年前就開始長線佈局。

以下是虎嗅與李開複溝通實錄：

虎嗅：零一萬物內部的決策模式是怎樣的？比如你是更樂於和大家商量？還是你更相信自己的預判？

李開複：在我創業之初，就集結了一批「願意相信我，我也很信任他們」的創始團隊。穀雪梅、馬傑、祁瑞峰、Anita等，這些人從一開始就在我的聯創團隊里，最初的核心聯創團隊基本上沒有改變，還有約20位勤奮強悍的干將。

我們因為同樣信仰AGI，同時也勇於腳踏實地地擁抱應用落地和商業化，所以我們走到一起來。即使在充滿壓力的狀況下，任何同事都可以跟我約一對一的時間，我們固定舉辦開誠布公無話不說的TGIF全員溝通會，每個重要決策從判斷到落地，必定是我們達成共識的結果。

虎嗅：你什麼時候開始對預訓練有新的思考？有什麼關鍵節點，是你思考這件事的契機嗎？

李開複：大模型賽道技術迭代特別快，所以必須做超前預判和佈局。在 2024 年 5 月的時候，我們就開始思考預訓練的路線問題。在 2024 年 5 月，我們發佈了一個千億參數模型 Yi-Large，當時 Yi-Large 的模型表現很好，在國際權威盲測榜單 LMSYS Chatbot Arena 總榜上取得了當時世界第七、中國第一的成績。但是從現在往回看， Yi-Large 在模型推理速度和推理成本優化方面，還有相當大的提升空間。

原本我們模型路線圖上的下一個版本是更大尺寸的 Yi-X-Large，仍然走稠密模型、需要加倍的卡才能做到的路線。當時我們就面臨著一個抉擇，是繼續沿著 Scaling Law，用更多的 GPU、更多的數據去訓練更大參數規模的模型，還是說我們要采更務實的路線，去專注於做更輕量化、但是模型性能依然能保持領先的模型？

我們內部在半年多前就意識到了 Scaling Law 的邊際收益遞減，對初創公司最直接的就是財務影響，我的財務同事每幾週跟我過現金流，看到算力一個月一個月的支出，真不是可持續的方式。賭上巨量資源去訓練超大參數規模的模型，超低的性價比對初創公司來說，肯定不是一個務實的選擇。

那次的關鍵技術決策討論是個節點，經過很多實驗後我們決定換一個路線，去年10月零一萬物推出的新旗艦模型 Yi-Lightning 是我們一次嘗試，Yi-Lightning 採取MoE（混合專家）架構，激活參數僅20多B，但模型表現更出色——模型性能上超過了 2024 年 5 月版本的 GPT-4o，發佈時在 LMSYS 上排名世界第六、中國第一（2024 年 10 月 16 日數據）。更重要的是，Yi-Lightning 的模型訓練成本僅350萬美元，僅是 GPT-4o 的 1/30，我們的推理成本做到行業最低，喊出大模型也能有「白菜價」。

從去年下半年，我們開始暫停對超大參數規模的模型的追求，回頭複盤，真是還好沒加那多幾千卡的成本。

虎嗅：當你意識到這件事情後，你當時做的第一個決定是什麼？你如何去推動公司內部接受這個認知，並參與到這個轉型之中？

李開複：有了前面提到的這個放棄 X-Large 的轉變和驗證，公司內部也很快都達成了共識。因為作為親身經歷者，我們每個人都看到了，跟AI 1.0時代不一樣，AI 2.0時代大模型技術和產業發展都是被加速的。大模型公司融到了更多資源，但是也因為大模型預訓練投入更大的資源。從技術上看，僅僅一年多的時間，引領大模型前進的傳統 Scaling Law 邊際收益遞減明顯，商業化上同樣如此，我參與過 AI 1.0 時代的投資和孵化，一家公司獲得商業化的成功可能有5到8年窗口，相比之下，大模型賽道一切加速，AI 2.0 大模型公司會更快地面臨商業模式的靈魂拷問。

在當下的階段，聚焦「小而美且便宜」的模型，在此之上加速應用落地和商業變現，不論是在技術角度，還是在商業角度，都更實際、更負責，也是更健康、更能走下去的選擇。

虎嗅：這個轉型中最大的挑戰來自什麼？

李開複：可能外界觀感是零一萬物轉型調整來得突然，但是我們從去年第二季度開始針對技術路線進行複盤，第三季度開始嘗試構建輕量化模型 10 月推出了Yi-Lightning，同時積極在 ToC 和 ToB 領域探索落地，11月份我們首度公佈了 ToB 戰略，再到 2025 年年初宣佈與阿里雲成立產業大模型聯合實驗室，你可以看到，這一切調整都是基於長線戰略調整循序漸進、一脈相承的。只是近期一些噪音和歪曲解讀突然出現，讓我們有章法有節奏的佈局對外界顯得有些突然。

歷史上許多新的技術過了黑科技發明期，面臨技術落地和產品化的時候，沒能獲得商業的成功，這個階段被稱為「創新死亡穀」。零一萬物已經證實了我們能做世界級的技術，是時候要關注和聚焦模型能力的落地實現，運轉出能良性造血的商業模式。

更確切地說，行業正在集體穿越大模型時代的「創新死亡穀」。

最大的挑戰在於有限的資源、有限的時間。行業對 Scaling Law 從追捧到懷疑就不到一年的時間，我們如何在時間表裡製定計劃、保持敏捷，在有限的資源里最大化我們的執行力。我們必須以快打快，不進則退。

虎嗅：圈內有些公司在做ToB業務同時仍然在做預訓練，你如何看待？

李開複：如果一家創業公司的長板足夠長，不管你的長板是在模型上還是產品上，都可以一定程度上回答所謂的靈魂拷問。我在這裏不點評其他家的做法，我相信大家都能夠找到專屬於自己的道路。

對於零一萬物而言，我們的長板就是能夠在保證模型性能處於世界第一梯隊的同時，大幅降低訓練和推理成本、大幅提升推理速度。大模型公司第一年在前期科研、模型訓練方面需要花費巨量的資源，狂奔進入第二年後，初創公司更應該有一個符合商業邏輯、對投資人負責、能確保活下來的商業模式。

虎嗅：在ToB這件事情上，你認為零一萬物最本質的競爭力在哪幾個維度？這幾個維度在你心中它的排列順序該是什麼樣的？

李開複：首先，在經過一年多的技術沉澱，零一萬物已經具備了世界第一梯隊的技術能力，證明了自己能夠交付出性能世界領先的模型。我們技術底子夠硬。

其次，在尋找落地場景這件事上，我們不像其他 AI 公司能夠僱傭數百個銷售。但我本人以及聯創團隊都有著豐富的人脈資源，使得零一萬物能夠從開始就切入重點領域內的頭部公司，快速找到適合凝練出標準化 ToB 解決方案的領域和場景。

第三，零一萬物還可以跟創新工場聯動。創新工場投資的很多領域的公司，比如 AI 製造、 AI 金融、 AI for Science、具身智能、無人駕駛等等，跟我們都是非常互補的，都可以在行業大模型方面展開合作。

創辦零一萬物的最初目標是在實現我的 AGI 夢想同時取得商業上的成功，我們要做的是要讓頂尖大模型能力走出實驗室，去進行產業落地，打造AI-First產業應用，把技術超能力變成「鈔能力」，創造實質的商業價值，才能面對最後的靈魂拷問：你到底能不能把技術轉換成商業價值？先有收入，再增加收入，然後收窄虧損，最終從單點盈利到多點持續盈利。

虎嗅：你認為2025年在 ToB 業務上，真正考驗每家公司的焦點能力是什麼？這種情況下我們如何保持自己的競爭優勢？

李開複：2025 年是 AI-First 應用爆發的元年，中國有望在應用元年彎道超車，零一萬物必須提前爭位。

大模型 ToB 行業的挑戰是，客戶和技術提供商不是雙贏，而是一方壓價，另一方因為沒有利潤只能隨便做做。對於大模型公司來說，很大一部分的 ToB 合作客戶付費意願不高，服務場景也很難做成可複製化的產品。這就會變成惡性循環：大模型公司沒辦法全身心投入，客戶也沒辦法從解決方案中獲得業績增長，最後大家都賺不到錢。

在零一萬物看來，有三種 ToB 的方向是值得嘗試的。一種是能夠為客戶創造核心價值的，不僅能慳錢，更重要的是能夠幫助客戶做增長。比如零一萬物的如意數字人和萬視營銷短影片；第二種是在一些特別垂直、又很適合大模型落地的領域，與真正有遠見、有決心擁抱大模型的公司一起共創，打造行業大模型。基於目前為人熟知的金融、醫療等領域，零一萬物會再向下挖掘更垂直的行業，在這些垂直行業里，行業龍頭可能會因為大模型而產生營業額的快速增長。這類企業每個都是金礦，我們已經有了一些嘗試。第三就是服務可複製、可快速規模化的領域，服務第一個客戶時可能不賺錢，但相似的產品可以服務很多家同類型的客戶。

目前，在國內 ToB 方向上，零一萬物在遊戲、能源、汽車、金融領域都在談千萬以上的單子，而且基本都是軟件單。下一個階段零一萬物會繼續放大這些領域，也會進入有機會的新領域。如果能結合對方的行業 Know-how、數據和零一萬物的技術，比如以共同設立合資公司的形式，一起做細分的行業模型和更好的行業解決方案，就能創造更多價值。我有把握，在 2025 年能有數倍收入增長，從 1 億做到數億。

你可能喜歡