DeepSeek,從追趕者到追殺者
當美國用戶湧入一款便宜、好用的推理大模型後,華爾街對AI的狂熱瞬間變為恐慌。一夜之間,英偉達市值跌去6000億美元,創下美國公司最大單日跌幅歷史紀錄。
DeepSeek從追趕者變成了追殺者,將中國與美國這一輪AI上的差距,從兩三年縮短至不足兩三個月。矽谷巨頭們都感受到了背後越來越近的殺氣。應用、大模型與算力的敘事邏輯正在改寫。
OpenAI難逃「創新者的困境」。就算它每一步都沒做錯,仍然面臨被技術更靈活、價格更低廉的對手顛覆的可能。英偉達證實,DeepSeek使用的GPU完全符合出口標準,否認了ScaleAI的5萬張H100的說法。
去年聖誕節前,OpenAI剛展示了o3,DeepSeek就在一個月後推出了R1,迅速逼得前者的mini版本免費。奧特曼在社交媒體平台上吹噓自己剛發佈的智能體Operator,底下都是追問DeepSeek的——矽谷的心智正在改變。
OpenAI、DeepMind與Anthropic都著力於原始創新階段,需要基礎研發更大比重的支出,早期的持續探索和反復試錯,失敗率很高。追趕者則享受著算力通縮、路徑複現的紅利。但是,算力是資源,也就帶有資源的詛咒。OpenAl已經習慣於堆疊算力的「暴力美學」,正式發佈下一代基礎模型一再延期,已經讓市場陷入焦慮。
DeepSeek無限逼近,讓開源模型和閉源模型一樣好,並且效率還更高,讓更多企業可以用少於以往十分之一的成本構築應用,給了創新者越來越大的商品化壓力。
一般來說,創新者以更高的成本,獲得技術的正選優勢,就會推出差異性的產品,在一段時間內獲得市場壟斷優勢,以補償其創新的成本並獲得超額利潤。但AI領域激烈的競爭,追趕者快速逼近甚至實現反超,把領先的創新者逼入越來越短的時間與越來越窄的空間,它們很快被追趕者替代,付出的十倍於追趕者的成本最終可能無法挽回地沉沒。
用戶聲稱正在無縫切換至DeepSeek的移動應用;AMD已經把DeepSeek-V3集成到MI300X上;Perplexity也將DeepSeek-R1引入了搜索。
但DeepSeek只是證明了另一條途徑是可行的,並沒有否認OpenAl的路徑不再會量變引發新的質變。算力長期以來都是矽谷創新「苦澀的教訓」。無論是OpenAI,還是DeepSeek,大概率手中還握有更大的底牌。DeepSeek昨晚趁勢開源了多模態的Janus-Pro,擊敗了OpenAI的DALL-E 3和Stable Diffusion,又逼了OpenAI一把。
DeepSeek在2025年的第一個月,以一種顛覆性的方式為行業定義了全年的重要創新方向。推理模型的競爭已經提前打響,推理側的訓練和計算,以及更集約的算法,正在重新定義下一代大模型。
DeepSeek的創新,是中國創新的寫照。它採用的混合專家模型(MoE)、多頭潛注意力(MLA)、多令牌預測(MTP)、長鏈式推理(CoT)、DualPipe算法等設計;依賴強化學習(RL)而不加入監督微調(SFT)的訓練嘗試;在數據精度(FP8混合精度)、底層通信等方面優化,都不是從0到1的創新。但DeepSeek通過這些技術重新組合、進化,形成了一整套從底層創新到最終產品的「中間技術」。
DeepSeek的成功,為中國企業在算力約束下開闢自己的技術路線定下了基調。蒸餾可以走很長的路,純粹的強化學習也正在重新吸引研究者。分佈廣泛的高質量數據、相對輕量的推理模型、豐富的實體經濟場景,都更有利於中國產業+AI的創新。AI企業創新和應用,將出現中國範式。中國企業在AI的全球擴散中將發揮更重要的作用,中國的AI行業的創新價值,也值得在今年重估。
在算力儲備富裕的情況下,開源的更集約的探索路線,也意味著更為多元的發散的創新。美國高校與研究者已經將DeepSeek視為新的研究對象。向更高效的路線投入更多算力,意味著抬高了原以為即將觸及的天花板,還有可能把下一代模型的能力,再往上提升一個數量級。在這個意義上,中國也仍將追求更強大的算力硬件的自主。
蘋果是昨晚少數市值收漲的美國科技巨頭。更小的參數規模,更低精度的推理,顯著降低了算力與內存需求,使得端側推理更加可行;而蘋果擁有最好的硬件,最完善的應用生態,並對引入大模型服務持開放態度。其他美國巨頭將不得不應對來自中國的價格戰。
傑文斯悖論將主導下一階段的AI敘事。儘管在短期內,DeepSeek的效率和廣泛可用性,給英偉達最樂觀的增長前景帶來了嚴重的質疑,但英特爾前CEO基辛格、微軟CEO納迪拉維杜華,都重提了英國工業革命期間的經濟學家傑文斯的發現:當煤炭的使用效率不斷提升時,對煤炭的需求不僅沒有下降,反而在煤炭的應用和相關領域產生了大量的創新,滲透到各行各業,導致煤炭的消耗量上升。傑斯悖論在能源電力領域得到了完全的驗證,長期來看,在AI與算力領域也將重演。
在加速計算逐步佔據主流的深度學習「黃金10年」,GPU的效率提升了千倍。但智能算力的需求在絕對數量和相對佔比的意義上,不但沒有減少,反而在加速增長,每個季度翻番。在DeepSeek之前,它是訓練需求推動的,大型智算集群不斷湧現;之後,將是推理需求推動的,海量應用即將湧現。如果考慮到未來的物理AI,世界對於算力的需求幾乎是無限的。
從長期來自,DeepSeek的創新,正是推動了AI計算成本的下降,每秒處理更多的tokens,單位成本、單位能耗能產生更多的Flops;它降低了AI技術門檻,會加快AI應用的湧現,也會讓更多的行業採納AI。
但算力長期增長的市場邏輯,不一定能支撐著芯片企業中短期內的估值邏輯。英偉達從去年底開始就面臨前所未有的競爭威脅,當前股價暗示的增長軌跡不斷承壓,終於在DeepSeek衝擊下,市場開始拋售這種不確定性。當市場利潤的大部分從流入芯片轉向流入應用,供需關係的逆轉也將反映在利潤率之上。這是AI創新進入應用階段的標誌性事件。
每個人都在接受這樣一種觀念:一場全球競賽正在發生,我們不能輸掉它。在地緣競爭的催化下,DeepSeek在美國的矽谷與華爾街引發強震,餘震也已經傳導至華盛頓。
上週,達沃斯論壇的共識是,美國在人工智能全球競爭上的最大問題是,是否有足夠的承包商來建設高達5000億美元的星際之門計劃這樣龐大的項目;今天,特朗普在佛羅里達州說,DeepSeek帶來的變化是積極的,為美國敲響了警鍾,需要專注於競爭以贏得勝利。