矽谷震驚:DeepSeek或徹底改變遊戲規則
短短一個月內,中國AI初創公司深度求索(DeepSeek)先後發佈了DeepSeek-V3和DeepSeek-R1兩款大模型,成本價格低廉,性能與OpenAI相當,讓矽谷震驚,甚至引發了Meta內部的恐慌,工程師們開始連夜嘗試複製DeepSeek的成果。
Scale AI創始人Alexander Wang在1月24日的採訪中表示,DeepSeek在他們的測試里是表現最好的,與美國最好的模型相當。
此前,Alexander Wang評價說,DeepSeek-V3是中國科技界帶給美國的苦澀教訓。「當美國休息時,中國(科技界)在工作,以更低的成本、更快的速度和更強的實力趕上。」
此外,中國AI「刷屏」國外各大媒體,它們認為中國大模型的新進展為矽谷敲響了警鍾。
在5000億美元的「星際之門」計劃公佈之際,DeepSeek以極低的價格建立了一個突破性的AI模型,而且沒有使用尖端芯片,這讓人們質疑,AI行業數千億美元資本的巨額投入真的是最有效的方法嗎?
一、Meta進入恐慌模式,試圖複製DeepSeek
1月24號,一條發佈在匿名平台teamblind上的帖子瘋傳。一名Meta員工稱,現在Meta內部因為DeepSeek的模型,已經進入恐慌模式。

這位Meta員工寫道:
「一切源於DeepSeek-V3的出現,它在基準測試中已經讓Llama 4相形見絀。更讓人難堪的是,一家‘僅用550萬美元訓練預算的中國公司’就做到了這一點。
工程師們正在爭分奪秒地分析DeepSeek,試圖複製其中的一切可能技術。這絕非誇張。
管理層正為GenAI研發部門的巨額投入而發愁。當部門裡一個高管的薪資就超過訓練整個DeepSeek V3的成本,而且這樣的高管還有數十位,他們該如何向高層交代?
DeepSeek-R1的出現讓情況更加嚴峻。具體細節屬於機密,不便透露,不過很快就會公開了。」
去年12月27日,DeepSeek推出開源模型DeepSeek-V3。當時,聊天機器人競技場(Chatbot Arena)顯示,DeepSeek-V3在所有模型中排名第七,在開源模型排第一。而且,DeepSeek-V3是全球前十中性價比最高的模型。
不到一個月之後,今年1月20日,DeepSeek正式開源R1推理模型,允許所有人在遵循MIT License(註:被廣泛使用的一種軟件許可條款)的情況下,蒸餾R1訓練其他模型。
1月24日,DeepSeek-R1在聊天機器人競技場綜合榜單上排名第三,與頂尖推理模型o1並列。
在高難度提示詞、代碼和數學等技術性極強的領域,DeepSeek-R1拔得頭籌,位列第一。
在風格控制方面,DeepSeek-R1與o1並列第一,意味著模型在理解和遵循用戶指令,並按照特定風格生成內容方面表現出色。
在高難度提示詞與風格控制結合的測試中,DeepSeek-R1與o1也並列第一,進一步證明了其在複雜任務和精細化控制方面的強大能力。

Artificial-Analysis對DeepSeek-R1的初始基準測試結果也顯示,DeepSeek-R1在AI分析質量指數中取得第二高分,價格是o1的約三十分之一。
二、AI大佬驚歎:中國AI已追上美國
去年12月DeepSeek-V3發佈後,AI數據服務公司Scale AI創始人Alexander Wang就發帖稱,DeepSeek-V3是中國科技界帶給美國的苦澀教訓。「當美國休息時,中國(科技界)在工作,以更低的成本、更快的速度和更強的實力趕上。」

著名投資公司A16z的創始人馬克·安達臣1月24日發文稱,Deepseek-R1是他見過的最令人驚歎、最令人印象深刻的突破之一,而且還是開源的,它是給世界的一份禮物。

1月24日,A16z合夥人、Mistral AI董事會成員Anjney Midha表示:「從史丹福到麻省理工,DeepSeek-R1幾乎一夜之間成為美國頂尖大學研究人員的首選模型。」

對於中國AI為何能有如此快速的進展,諾獎得主、「AI教父」傑佛瑞·辛頓在1月21日接受博主Curt Jaimungal專訪中表示,中國的STEM(科學、技術、工程、數學)教育比美國更好,擁有更多受過良好教育的人才,這將為AI的發展提供堅實的基礎。儘管美國試圖通過限制(如英偉達芯片)來減緩中國的發展,但這隻會促使中國加速發展自己的技術,「他們可能會落後幾年,但最終會趕上」。
三、DeepSeek或徹底改變遊戲規則「大力出奇蹟」還有效嗎?
史丹福大學和Epoch AI的研究人員在2024年年中發表的一項研究表明,到2027年,最大型的模型的訓練成本將超過10億美元。Gartner預測,到2028年Google、Microsoft和AWS等超大規模企業僅在AI服務器上的支出就將高達5000億美元。
但DeepSeek完全不同,它的訓練成本並不昂貴。Noah’s Arc資本管理公司表示,DeepSeek-V3模型有可能徹底改變訓練和推理領域的遊戲規則。
特別是在5000億美元的「星際之門」計劃公佈後,DeepSeek更讓人懷疑,巨額投入這種「大力出奇蹟」的辦法真是最有效的方法嗎?
美股大V「THE SHORT BEAR」1月24日在X上發文稱,DeepSeek給AI巨頭們帶來了痛苦時刻,投資者必須對此敲響警鍾。
他說:「如果擊敗OpenAI只需要5500萬美元,那麼這個行業的商業化會比很多人預想的要快很多。」

他還指出:「根據紅杉,美國AI公司每年必須產生約6000億美元收入來支付其AI硬件費用。現在看來,這種冒險行為變得越來越無利可圖。」
著名財經記者Holger Zschaepitz 1月25日表示,DeepSeek以極低的價格建立了一個突破性的AI模型,而且沒有使用尖端芯片,這讓人們質疑該行業數千億美元資本支出的效用。

有投資者甚至認為,美股芯片股的股價也會面臨挑戰。
投資者Geiger Capital表示,Deepseek和OpenAI一樣好,甚至更好,而且價格只有後者的3%……而美國公司卻投入了數千億美元。那麼……諾斯達克會怎樣呢?

值得注意的是,DeepSeek-V3發佈後,英偉達股價下跌了2%。而DeepSeek-R1引發海外大討論後,1月24日英偉達股價又大跌了3.12%。
四、外媒集體刷屏:給矽谷敲響警鍾
如果說DeepSeek-V3只是掀起了波瀾,那麼DeepSeek-R1則是引發了轟動。最近四天,國外媒體紛紛聚焦DeepSeek,並一致認為中國大模型的新進展為矽谷敲響了警鍾。
1月22日,美國媒體Business Insider報導稱,DeepSeek-R1模型秉承開放精神,完全開源,為美國AI玩家帶來了麻煩。開源的先進AI可能挑戰那些試圖通過出售技術賺取巨額利潤的公司。
1月24日,美國媒體CNBC推出了長達40分鐘的節目,邀請了Perplexity CEO Aravind Srinivas來分析為何DeepSeek會引發人們對美國在AI領域的全球領先地位是否正在縮小的擔憂。
英國《金融時報》1月25日報導稱,中國小型AI初創公司DeepSeek震驚矽谷。報導聚焦資源更豐富的美國AI公司能否捍衛自己的技術優勢。

報導援引加州大學伯克利分校AI政策研究員Ritwik Gupta稱,DeepSeek最近發佈的模型表明「AI能力沒有護城河」。Gupta補充說,中國的系統工程師人才庫比美國大得多,他們懂得如何充分利用計算資源來更便宜地訓練和運行模型。
本文來自微信公眾號:每日經濟新聞 (ID:nbdnews),作者:嶽楚鵬、蘭素英,編輯:陳柯名、王嘉琦、蓋源源