李開複:「DeepSeek時刻」大幅加速模型落地

「大概9個月前,我曾經沮喪地說,中國還沒有‘ChatGPT時刻’,雖然過去也有表現不錯的模型出現,但是始終缺少一個一枝獨秀的模型,能夠支撐ToB、ToC 應用百花齊放,能夠讓每個企業CEO都在追問IT部門‘什麼時候能在企業里接入大模型?’而現在,企業和用戶已經經歷過‘DeepSeek時刻’的市場教育。」

3月27日至31日,2025中關村論壇年會舉行,人工智能主題日系列活動貫穿整個年會期間。在人工智能主題日核心論壇「未來人工智能先鋒論壇」上,零一萬物 CEO、創新工場董事長李開複分享了他基於全球視角對生成式AI的展望。

李開複正在發表演講。官方供圖李開複正在發表演講。官方供圖

2025年 大模型「落地為王」

李開複認為,AI 2.0是有史以來最偉大的科技革命與平台革命,大模型走出實驗室,穿透各行各業成為驅動實體經濟的新質生產力,「在過去兩年間,從 ChatGPT 推出之後,大模型智力在不斷地提升,而且目前看起來遠沒有觸及天花板。與此同時,大模型的推理成本在以每年降低十倍的速度快速下降,這為AI-First應用爆發提供了非常重要的條件。兩年前性能不夠好的模型,現在已經夠好了;兩年前推理成本太高的模型,現在已經是‘白菜價’了。」

基於此,他推測AI-First 應用將很快井噴,2025 年會是AI-First應用爆發、大模型「落地為王」的元年。

幾個月前,OpenAI聯合創始人蘇茨克維公開表示,預訓練階段的Scaling Law(規模效應)放緩,因為模型訓練所用的數據量已經觸及瓶頸,算力方面超大GPU集群效益降低,隨著GPU數量增加容錯問題等導致邊際效益降低。

對此,李開複認為,行業內已經出現了新的曙光,Scaling Law正從預訓練階段轉向推理階段,也就是慢思考模式。目前來看,在慢思考Scaling Law下,模型性能的成長速度非常快,而且還有很大的增長空間。

值得注意的是,DeepSeek正以思考見長,這也從側面印證了李開複的觀點。

DeepSeek開源推理模型思考訓練過程 縮小了中美差距

李開複也分享了他對DeepSeek的觀察。

「DeepSeek破解並開源推理模型的思考訓練過程,進一步縮小與美國的差距。DeepSeek很快讓模型具備了推理慢思考的能力。DeepSeek-R1真正切實掌握了這一技術,並且公開了 DeepSeek-R1的思維鏈。這是令人非常震驚的,因為OpenAI o1一直隱藏著思維鏈,就是防止友商複現,結果DeepSeek還是從零起步做到了這一點。」李開複說。

在他看來,DeepSeek以極其高的工程效率,走出了一條與OpenAI天量級融資的底層邏輯迥然不同的中國道路。在同樣標準下進行比較,DeepSeek-R1要比美國的類似模型更快,也更便宜了5到10倍,這背後是工程能力的巨大進步。

李開複表示,DeepSeek最重要的一點是證明了開源模型能力追趕上閉源模型,進一步推進SOTA模型的商品化,「DeepSeek證明了閉源的路徑是不可取的,開源才能有更好的發展。如果DeepSeek沒有開源,我大膽揣測,它的影響力會遠遠不如今天。在美國的開源社區和社交媒體上,大部分人都在熱情擁抱DeepSeek,過往很少有中國軟件在海外收穫如此廣泛的歡迎。這很大程度是因為與閉源的OpenAI相比,DeepSeek更為開放。」

所以,他認為中國迎來了屬於自己的「DeepSeek時刻」,這將大幅加速大模型在中國的全面落地,經過「DeepSeek時刻」的市場教育,中國市場真正覺醒了,這也為中國AI-First應用的爆發掃清了一大障礙。

「基於上述考量,零一萬物在過去幾個月也做出了戰略調整,我們已經全面擁抱DeepSeek,並且把大部分力量用於把 DeepSeek優質基座模型轉變為企業級DeepSeek部署定製解決方案——可以類比為零一萬物在打造AI 2.0時代的Windows系統,而DeepSeek就是驅動Windows的內核。」李開複說。

記者聯繫郵箱:luoyidan@xjbnews.com

新京報貝殼財經記者 羅亦丹

編輯 王進雨

校對 劉軍