為何DeepSeek引發美國恐慌?
據央視新聞消息,這幾天,中國人工智能初創公司DeepSeek火了,不僅在美區下載榜上超越了ChatGPT,還引發多個美國科技股的股價暴跌。美國總統特朗普稱DeepSeek的出現「給美國相關產業敲響了警鍾」。為何DeepSeek的出現會讓美國如此關注,甚至有些緊張?
原因一:高性價比衝擊美國大模型壟斷地位
DeepSeek可謂是用最少的錢,干最多的事。其推出的模型,在性能上和世界目前頂尖的GPT-4o等大模型不相上下。但在成本上,OpenAI訓練ChatGPT-4花費的成本高達7800萬美元,還可能達到1億美元。而DeepSeek大模型訓練成本不到600萬美元,僅為同性能模型的5%到10%。新模型訓練方法大幅度降低了大模型行業的入局門檻,大規模預訓練不再是科技巨頭的專利。在模型推理層面,DeepSeek新推出的DeepSeek-R1,價格為2.2美元/百萬詞元,而同性能OpenAI-o1的價格為60美元/百萬詞元,DeepSeek大概是OpenAI的三十分之一。這種「低成本」標誌著推理大模型調用進入平價時代,顯著改善了大模型的應用成本,對大模型在科研、企業等智力密集型產業中的應用具有重大的價值。因此,無論是從基礎研究角度還是從商業層面上看,在訓練和推理方面,對此前美國一些大模型公司的既有模式衝擊比較大。
原因二:模式創新,帶來美國高新技術人員恐慌
DeepSeek開發成本與美國大模型相比大幅降低,在於應用了不同的模型訓練模式,打破了美國堆砌算力的「豪氣」方式。在喂養學習數據這一大模型重要環節上,OpenAI選擇了「人海戰術」,堆砌算卡、將資源集中在算力,用海量數據投喂實現能力的提升。而DeepSeek相比於「砸資源」選擇了另外一種方式。利用算法把數據進行總結和分類,經過選擇性處理之後再輸送給大模型,最大優化算力實現了成本的降低和模型性能提升。目前看Meta耗費了大量資金訓練Llama,但是效果上卻沒有成本極低的DeepSeek效果好,Meta高層已經在思考其員工是否在浪費公司資金,而這也引發了不少企業技術人員的恐慌,他們擔心自己被質疑技術能力和創新性從而失去工作。根據海外互聯網平台對DeepSeek的討論分析,社交媒體帖子的數量遠高於新聞報導,數量約是新聞報導的十倍。時間上來看,社交媒體帖子的討論早於新聞報導,發酵起點比新聞媒體早了五天,這是由從事科技工作的自媒體人以及員工圈層傳播「破圈」造成。
原因三:國產大模型正在厚積薄發
根據中國工業互聯網研究院推出的《人工智能大模型年度發展趨勢報告》,與國際頂尖大模型能力相比,2024年國內大模型的能力進步非常顯著。從2023年第四季度到2025年第一季度的測評顯示,國內外大模型能力差距縮小了將近75%。可以看出,DeepSeek的出現並不是所謂的「異軍突起」,而是中國國內大模型整體發展的階段性成果體現。此外,在報告統計的世界AI領域的投資上,中國55億美元的投資額排在第二位,僅是第一位美國641億投資額的不到十一分之一,中國未來在AI領域的發展上還有很大的空間。
如今,在DeepSeek對全球AI圈帶來的震動下,很多業內人士都喊出了「DeepSeek接班OpenAI」的口號。事實上,DeepSeek的出現,並不是要取代別人,而是提出了更多樣化的方案,打破了國際主流大模型的市場壟斷,在大模型的發展道路上提出了不同於美西方的中國解法,讓世界看到了在大模型領域不是只有拚算力這一條路,再一次向世界證明,什麼是中國智慧。
編輯 李憶林子