一夜之間，微軟、英偉達、亞馬遜全部接入DeepSeek！吳恩達：中國AI正在崛起

01月31日 15:35 新浪網 tech-auto-hilite

新智元報導

編輯：KingHZ 好睏

【新智元導讀】微軟、英偉達、亞馬遜等美國雲計算平台擁抱DeepSeek R1。吳恩達、英特爾前CEO誇讚DeepSeek創新能力。

1月最後一天，來自DeepSeek的熱度絲毫不減。

遠在大洋彼岸的美國，不僅從業者感受到了前所未有的壓力，那些平時對AI毫不關心的人，也感受到了來自中國AI的震撼——

Anthropic CEO呼籲美國加強芯片管製力度；OpenAI尋求矽谷史上最大400億美元單筆融資。

網民們則借助寬鬆的開源許可，製作出了用DeepSeek-R1替代OpenAI Operator的教程——不用200美元訂閱，完全免費！

「俗話」說得好：「打不過就加入」。

一開始便對DeepSeek讚賞有加的英偉達，剛剛宣佈：「DeepSeek-R1正式登陸NVIDIA NIM」。據介紹，在單個NVIDIA HGX H200系統上，完整版DeepSeek-R1 671B的處理速度可達3,872 Token/秒。

同在今天，亞馬遜也在Amazon Bedrock和SageMaker AI中，上線了DeepSeek-R1模型。

曾經衝出來和OpenAI一起高調質疑DeepSeek「偷竊」數據的微軟，甚至在前一天就把DeepSeek-R1搶先部署在了自家的雲服務Azure上。

除了科技大廠，AI初創們也沒有放過如此上好的機會。

Windsurf編輯器同時集成了DeepSeek-R1和V3模型，並且第一次在編程智能體中，實現了R1的工具調用。

Cerebras不僅實現了比GPU快57倍的推理速度，而且還報告稱，自己部署的70B模型在準確率上要比GPT-4o和o1-mini更高。

中國AI正在崛起

在吳恩達看來，本週圍繞DeepSeek的熱議，讓許多人清晰地看到了幾個一直存在的重要趨勢：

美國在GenAI領域的領先地位正在被中國迎頭趕上，AI供應鏈格局將被重塑
開放權重模型正在推動基礎模型層商品化，為應用開發者帶來新機遇
擴大規模並非通往AI進步的唯一途徑。儘管算力備受追捧，但算法創新正在快速降低訓練成本

中國在GenAI領域正在趕上美國

當ChatGPT於2022年11月推出時，美國在GenAI領域明顯領先於中國。

由於觀念的轉變十分緩慢，所以吳恩達直到最近，都還能聽到不少關於中國仍然落後的論調。

但實際上，雙方的差距已經在過去兩年中迅速縮小。

隨著Qwen（吳恩達團隊已經用了幾個月）、Kimi、InternVL和DeepSeek等模型的推出，中國在文本模型上的差距正在縮小，而在影片生成等領域，中國甚至已經展現出了一些領先優勢。

如今，DeepSeek-R1不僅開源了模型權重，而且還分享了一份包含諸多細節的技術報告。

相比之下，一些美國公司卻通過渲染人類滅絕等假想的AI危險，推動製定法規來阻止開源的發展。

不可否認的是，開源/開放權重模型都是AI供應鏈的關鍵部分——很多公司都在用。

對此，吳恩達表示：如果美國繼續妨礙開源，AI供應鏈的這一環節就將由中國主導。

開放權重模型正在使基礎模型層普及化

一直以來，LLM的Token價格都在迅速下降，開放權重模型不僅加速了這一趨勢，並且還為開發者提供了更多選擇。

OpenAI的輸出價格為60美元/百萬Token；而DeepSeek R1只要2.19美元。這種近30倍的差異讓許多人注意到了價格下降的趨勢。

訓練基礎模型並提供API服務充滿困難，很多AI公司至今仍在尋找收回模型訓練成本的途徑。

紅杉資本的文章「AI’s $600B Question」很好地闡述了這一挑戰。

相比之下，在基礎模型之上進行應用開發，則有著絕佳的商機。

現在，已經有公司投入了數十億美元訓練出了一些模型，而你只需支付少量費用就能訪問。然後，拿去開發客服聊天機器人、郵件摘要工具、AI醫生、法律文檔助手等諸多應用。

擴大規模並非AI進步的唯一途徑

圍繞通過擴大模型規模來推動進步的熱議有很多，就連吳恩達也是早期的支持者之一。

許多公司為了數十億美元的融資，製造「噱頭」：

只要有更多資金，他們就能（1）擴大規模並（2）可預測地推動改進。

因此，人們開始過分關注規模的scaling，而忽視了其他方式取得的進步。

受到美國AI芯片禁令的影響，DeepSeek團隊不得不在性能相對較低的H800 GPU上跑模型，而這也推動了他們在優化方面的大量創新。最終，模型訓練成本（不包括研究成本）不到600萬美元。

這是否真能減少計算需求仍有待觀察。有時，商品的單價變得更低，反而會導致該商品的總支出增加。

吳恩達認為：「從長遠來看，對智能和算力的需求是幾乎沒有上限的，所以即使智能變得更便宜，人類依然會使用更多智能。」

在X上，我們可以看到很多對DeepSeek進展的不同解讀。就像「羅夏墨跡測試」一樣，可以讓許多人將自己的理解投射其中。

雖然DeepSeek-R1的地緣政治影響仍有待明確，但它對AI應用的開發者來說確實是個好消息。

吳恩達的團隊已經在頭腦風暴一些新的想法，而這些想法之所以成為可能，僅僅是因為我們可以輕鬆訪問一個開放的高級推理模型。

現在仍然是一個創造的好時機！

DeepSeek帶來的三個啟示

DeepSeek的成功，甚至「炸出」了芯片、計算行業的老兵——英特爾前CEO Pat Gelsinger。

作為業內非常資深的工程師，Gelsinger認為，現在這些針對DeepSeek的反應，忽視了我們在過去五十年計算機發展歷程中學到的三個重要教訓。

第一：計算遵循「氣體定律」

計算會像氣體一樣，填滿由可用資源（資本、電力、散熱限制等）定義的可用空間。

正如在CMOS、個人電腦、多核處理器、虛擬化、移動設備等眾多領域看到的那樣，以極低的價格廣泛提供計算資源，將推動市場的爆炸性擴張，而不是收縮。

未來AI將無處不在，而今天，要實現這一潛力的成本仍然高得離譜。

第二：工程的本質就是應對約束

很明顯，DeepSeek團隊面臨諸多約束，但他們找到了極具創造性的方法，並以低10-50倍的成本，交付了世界一流的解決方案。

美國的禁令限制了可用資源，因此中國的工程師不得不發揮創造力，而他們也確實做到了——價值數百億美元的硬件、最新的芯片和數十億美元的訓練預算，都不再是必需品。

多年前，Gelsinger曾採訪過最為著名的計算機科學家之一Donald Knuth。他詳細描述了當資源極度受限、進度要求最緊迫時，該如何做出最好的工作。

Gelsinger表示，這個見解是他工程管理生涯中最重要的啟示之一。

第三：開放終將勝利

過去幾年，看到正變得越來越封閉的基礎模型研究，實在令人失望。

在這一點上，Gelsinger更認同馬斯克而不是奧特曼的觀點——我們真的希望，不，是需要AI研究的開放性得到提升。

我們需要知道訓練數據集是什麼，研究算法並對其正確性、倫理和影響進行深入思考。Linux、GCC、USB、WiFi等眾多例子，已經讓這一點無比清晰。

在法律、頻譜、工程和採用方面的戰鬥中，開放並不容易，並且始終在受到市場力量的挑戰。但只要給一個適當的機會，「開放」每次都會勝出。

AI對人類未來的重要性不言而喻，因此，絕對不能讓一個封閉的生態系統在這個領域成為唯一的主宰。

DeepSeek是一個令人難以置信的工程壯舉——它將推動AI實現更廣泛發採用，並將幫助重塑行業對開放創新的看法。

正是這樣一個來自中國的高度受限的團隊，讓我們所有人重新想起了這些計算機歷史的基本教訓。

參考資料：

https://x.com/AndrewYNg/status/1885033810552905814

https://www.linkedin.com/posts/patgelsinger_wisdom-learning-the-lessons-i-thought-i-activity-7289659541477113856-o1Qr/