一夜之間,微軟、英偉達、亞馬遜全部接入DeepSeek!吳恩達:中國AI正在崛起

新智元報導
編輯:KingHZ 好睏
【新智元導讀】微軟、英偉達、亞馬遜等美國雲計算平台擁抱DeepSeek R1。吳恩達、英特爾前CEO誇讚DeepSeek創新能力。
1月最後一天,來自DeepSeek的熱度絲毫不減。
遠在大洋彼岸的美國,不僅從業者感受到了前所未有的壓力,那些平時對AI毫不關心的人,也感受到了來自中國AI的震撼——
Anthropic CEO呼籲美國加強芯片管製力度;OpenAI尋求矽谷史上最大400億美元單筆融資。
網民們則借助寬鬆的開源許可,製作出了用DeepSeek-R1替代OpenAI Operator的教程——不用200美元訂閱,完全免費!

「俗話」說得好:「打不過就加入」。
一開始便對DeepSeek讚賞有加的英偉達,剛剛宣佈:「DeepSeek-R1正式登陸NVIDIA NIM」。據介紹,在單個NVIDIA HGX H200系統上,完整版DeepSeek-R1 671B的處理速度可達3,872 Token/秒。
同在今天,亞馬遜也在Amazon Bedrock和SageMaker AI中,上線了DeepSeek-R1模型。

曾經衝出來和OpenAI一起高調質疑DeepSeek「偷竊」數據的微軟,甚至在前一天就把DeepSeek-R1搶先部署在了自家的雲服務Azure上。

除了科技大廠,AI初創們也沒有放過如此上好的機會。
Windsurf編輯器同時集成了DeepSeek-R1和V3模型,並且第一次在編程智能體中,實現了R1的工具調用。
Cerebras不僅實現了比GPU快57倍的推理速度,而且還報告稱,自己部署的70B模型在準確率上要比GPT-4o和o1-mini更高。

中國AI正在崛起
在吳恩達看來,本週圍繞DeepSeek的熱議,讓許多人清晰地看到了幾個一直存在的重要趨勢:
-
美國在GenAI領域的領先地位正在被中國迎頭趕上,AI供應鏈格局將被重塑
-
開放權重模型正在推動基礎模型層商品化,為應用開發者帶來新機遇
-
擴大規模並非通往AI進步的唯一途徑。儘管算力備受追捧,但算法創新正在快速降低訓練成本

中國在GenAI領域正在趕上美國
當ChatGPT於2022年11月推出時,美國在GenAI領域明顯領先於中國。
由於觀念的轉變十分緩慢,所以吳恩達直到最近,都還能聽到不少關於中國仍然落後的論調。
但實際上,雙方的差距已經在過去兩年中迅速縮小。
隨著Qwen(吳恩達團隊已經用了幾個月)、Kimi、InternVL和DeepSeek等模型的推出,中國在文本模型上的差距正在縮小,而在影片生成等領域,中國甚至已經展現出了一些領先優勢。
如今,DeepSeek-R1不僅開源了模型權重,而且還分享了一份包含諸多細節的技術報告。
相比之下,一些美國公司卻通過渲染人類滅絕等假想的AI危險,推動製定法規來阻止開源的發展。
不可否認的是,開源/開放權重模型都是AI供應鏈的關鍵部分——很多公司都在用。
對此,吳恩達表示:如果美國繼續妨礙開源,AI供應鏈的這一環節就將由中國主導。
開放權重模型正在使基礎模型層普及化
一直以來,LLM的Token價格都在迅速下降,開放權重模型不僅加速了這一趨勢,並且還為開發者提供了更多選擇。
OpenAI的輸出價格為60美元/百萬Token;而DeepSeek R1只要2.19美元。這種近30倍的差異讓許多人注意到了價格下降的趨勢。
訓練基礎模型並提供API服務充滿困難,很多AI公司至今仍在尋找收回模型訓練成本的途徑。
紅杉資本的文章「AI’s $600B Question」很好地闡述了這一挑戰。
相比之下,在基礎模型之上進行應用開發,則有著絕佳的商機。
現在,已經有公司投入了數十億美元訓練出了一些模型,而你只需支付少量費用就能訪問。然後,拿去開發客服聊天機器人、郵件摘要工具、AI醫生、法律文檔助手等諸多應用。

擴大規模並非AI進步的唯一途徑
圍繞通過擴大模型規模來推動進步的熱議有很多,就連吳恩達也是早期的支持者之一。
許多公司為了數十億美元的融資, 製造「噱頭」:
只要有更多資金,他們就能(1)擴大規模並(2)可預測地推動改進。
因此,人們開始過分關注規模的scaling,而忽視了其他方式取得的進步。
受到美國AI芯片禁令的影響,DeepSeek團隊不得不在性能相對較低的H800 GPU上跑模型,而這也推動了他們在優化方面的大量創新。最終,模型訓練成本(不包括研究成本)不到600萬美元。
這是否真能減少計算需求仍有待觀察。有時,商品的單價變得更低,反而會導致該商品的總支出增加。
吳恩達認為:「從長遠來看,對智能和算力的需求是幾乎沒有上限的,所以即使智能變得更便宜,人類依然會使用更多智能。」

在X上,我們可以看到很多對DeepSeek進展的不同解讀。就像「羅夏墨跡測試」一樣,可以讓許多人將自己的理解投射其中。
雖然DeepSeek-R1的地緣政治影響仍有待明確,但它對AI應用的開發者來說確實是個好消息。
吳恩達的團隊已經在頭腦風暴一些新的想法,而這些想法之所以成為可能,僅僅是因為我們可以輕鬆訪問一個開放的高級推理模型。
現在仍然是一個創造的好時機!
DeepSeek帶來的三個啟示
DeepSeek的成功,甚至「炸出」了芯片、計算行業的老兵——英特爾前CEO Pat Gelsinger。

作為業內非常資深的工程師,Gelsinger認為,現在這些針對DeepSeek的反應,忽視了我們在過去五十年計算機發展歷程中學到的三個重要教訓。
第一:計算遵循「氣體定律」
計算會像氣體一樣, 填滿由可用資源(資本、電力、散熱限制等)定義的可用空間。
正如在CMOS、個人電腦、多核處理器、虛擬化、移動設備等眾多領域看到的那樣,以極低的價格廣泛提供計算資源,將推動市場的爆炸性擴張,而不是收縮。
未來AI將無處不在,而今天,要實現這一潛力的成本仍然高得離譜。
第二:工程的本質就是應對約束
很明顯,DeepSeek團隊面臨諸多約束,但他們找到了極具創造性的方法,並以低10-50倍的成本,交付了世界一流的解決方案。
美國的禁令限制了可用資源,因此中國的工程師不得不發揮創造力,而他們也確實做到了——價值數百億美元的硬件、最新的芯片和數十億美元的訓練預算,都不再是必需品。
多年前,Gelsinger曾採訪過最為著名的計算機科學家之一Donald Knuth。他詳細描述了當資源極度受限、進度要求最緊迫時,該如何做出最好的工作。
Gelsinger表示,這個見解是他工程管理生涯中最重要的啟示之一。
第三:開放終將勝利
過去幾年,看到正變得越來越封閉的基礎模型研究,實在令人失望。
在這一點上,Gelsinger更認同馬斯克而不是奧特曼的觀點——我們真的希望,不,是需要AI研究的開放性得到提升。
我們需要知道訓練數據集是什麼,研究算法並對其正確性、倫理和影響進行深入思考。Linux、GCC、USB、WiFi等眾多例子,已經讓這一點無比清晰。
在法律、頻譜、工程和採用方面的戰鬥中,開放並不容易,並且始終在受到市場力量的挑戰。但只要給一個適當的機會,「開放」每次都會勝出。
AI對人類未來的重要性不言而喻,因此,絕對不能讓一個封閉的生態系統在這個領域成為唯一的主宰。
DeepSeek是一個令人難以置信的工程壯舉——它將推動AI實現更廣泛發採用,並將幫助重塑行業對開放創新的看法。
正是這樣一個來自中國的高度受限的團隊,讓我們所有人重新想起了這些計算機歷史的基本教訓。
參考資料:
https://x.com/AndrewYNg/status/1885033810552905814
https://www.linkedin.com/posts/patgelsinger_wisdom-learning-the-lessons-i-thought-i-activity-7289659541477113856-o1Qr/
