吳恩達力撐DeepSeek:成本下降將讓AI應用迎來爆發,微軟亞馬遜已競相佈局
圍繞著 DeepSeek 的風暴還在持續。在最初的震動過後,美國科技界開始對 DeepSeek 發起了前所未有的猛烈抨擊。特朗普的 AI 事務主管 David Sacks 聲稱掌握「確鑿證據」,指控 DeepSeek 利用 OpenAI 的模型輸出數據開發技術。緊隨其後,微軟研究人員指出 DeepSeek 相關人員曾在去年秋天大規模提取 OpenAI 的 API 數據。Anthropic CEO Dario Amodei 更是發出萬字檄文,呼籲美國加強對華芯片出口管製。
在這片口誅筆伐的聲浪中,AI 領域泰鬥、Google大腦聯合創始人吳恩達(Andrew Ng)發文力撐這家中國 AI 初創企業,認為其釋放的開源模型 DeepSeek-R1 不僅標誌著中國在生成式 AI 領域迅速追趕上美國,更預示著 AI 行業格局正在發生深刻變革。

「DeepSeek 讓許多人認識到幾個一直存在但被忽視的重要趨勢,」吳恩達在社交媒體上表示。他指出,首先是中國在生成式 AI 領域正在快速追趕美國。自 2022 年 11 月 ChatGPT 發佈以來,中國與美國在該領域的差距已經顯著縮小。通過 Qwen、Kimi、InternVL 和 DeepSeek 等模型的持續突破,中國企業展現出強大的創新能力,在影片生成等特定領域甚至已經實現了局部領先。
更重要的是,DeepSeek-R1 採用了開放權重模型,並採用 MIT License。吳恩達認為,這一開源策略對比部分美國公司以「人類滅絕」等假設性 AI 風險為由試圖限制開源的做法,具有重要意義。「如果美國繼續阻礙開源發展,中國將主導 AI 供應鏈的這一重要環節,許多企業最終將不得不使用更多體現中國價值觀的模型,」他警告道。
而開放權重模型正在使基礎模型層商品化。相比 OpenAI 的 o1 模型每百萬輸出 token 收費 60 美元,DeepSeek R1 僅需 2.19 美元,降幅接近 30 倍。這一價格優勢正在改變 AI 基礎模型的商業化前景。如吳恩達所說:「基礎模型訓練和 API 接口銷售是一個充滿挑戰的業務,許多公司仍在尋找收回巨額訓練成本的途徑。相比之下,在基礎模型之上構建應用則蘊含著巨大的商業機會。既然其他公司已經投入數十億美元訓練這些模型,開發者現在只需幾美元就能構建客服聊天機器人、郵件摘要、AI 醫生、法律文檔助手等各種應用。」
另一方面,DeepSeek 的成功也挑戰了「規模至上」的傳統思維。作為早期支持擴大模型規模的倡導者,吳恩達坦言目前行業過度關注規模擴張,忽視了其他創新路徑。DeepSeek 團隊在美國 AI 芯片禁運的壓力下,不得不在較低性能的 H800 GPU 上訓練模型,這反而推動了算法優化的突破。據報導,其模型訓練的純計算成本不到 600 萬美元。
這一突破已經開始影響全球科技巨頭的戰略。蘋果 CEO 提姆·曲克在最新財報電話會議上評價說:「總的來說,我認為推動效率提升的創新是好事,這正是你在該模型中看到的。」雖然曲克表示蘋果採取「謹慎和深思熟慮」的 AI 支出策略,但他認可 DeepSeek 展現的創新價值。
事實上,DeepSeek 的出現可能為蘋果帶來新的機遇。
儘管 Apple Intelligence 功能的推出尚未帶來預期中的 iPhone 銷量提升——上季度銷量較去年同期略有下降,但曲克表示,在已推出 AI 功能的地區,銷售表現明顯強於未推出地區。與此同時,蘋果也在 AI 功能的應用上遇到挑戰,本月早些時候不得不暫停新聞文章 AI 摘要功能,原因是該功能產生了誤導性標題。
彭博社認為,更低成本的 AI 模型有望推動應用創新和 iPhone 換機潮。Parnassus 投資公司投資組合經理 Andrew Choi 指出:「AI 成本的下降意味著我們可能即將迎來應用創新和 AI 採用的 S 型曲線,如果這種情況發生,看多蘋果的理由就不言自明了。」
實際上,一批 AI 應用商和雲服務商已經或即將引入 DeepSeek 模型。微軟率先在其 Azure AI Foundry 平台和 GitHub 上集成了 DeepSeek-R1 模型,並表示經過了「嚴格的紅隊測試和安全評估」。亞馬遜 AWS 迅速跟進,通過 Bedrock 和 SageMaker AI 兩大平台提供全方位的 DeepSeek 部署方案,支持從簡單的 API 調用到深度定製的各類需求。英偉達也已將 DeepSeek-R1 上線至其 NIM 平台。英偉達官方甚至評價稱,DeepSeek-R1 是「具有最先進推理能力的開源模型」。

而 AI 應用領域,除了代碼助手 Cursor,AI 搜索引擎 Perplexity 也宣佈接入了 DeepSeek 模型,將其與 OpenAI 的 GPT-o1 和 Anthropic 的 Claude-3.5 並列作為高性能選項。AI SaaS 公司 Service Now 在最新的財報會議上表示,DeepSeek 這一模型的出現於他們而言說一個「巨大利好」,並透露團隊已開始部署。對於這類處於應用層的服務商而言,DeepSeek 帶來的成本優勢無疑為其提供了新的增長想像空間。

這種趨勢印證了吳恩達的判斷:雖然尚不確定模型的效率提升是否會真正減少對計算資源的總體需求,但從長遠來看,人類對智能和計算的需求實際上是沒有上限的。「即使智能變得更便宜,我仍然看好人類會使用更多智能,」他表示,「DeepSeek-R1 的影響已超越技術層面,具有深遠的地緣政治意義。對 AI 應用開發者來說,這是前所未有的機遇。我的團隊已經在構思一些新想法,這些想法之所以成為可能,正是因為我們可以輕鬆訪問開放的高級推理模型。這仍然是構建 AI 應用的最佳時機!」
隨著 AI 技術持續演進,DeepSeek 帶來的效率革命或將重塑整個行業格局。開源降本是否會像吳恩達預期的那樣帶來創新浪潮,值得持續關注。
參考資料:
1.https://x.com/AndrewYNg/status/1885033810552905814
2.https://techcrunch.com/2025/01/30/apple-ceo-says-deepseek-shows-innovation-that-drives-efficiency/
3.https://www.bloomberg.com/news/articles/2025-01-30/apple-s-flagging-ai-hopes-get-revival-from-deepseek-s-emergence?srnd=phx-technology
運營/排版:何晨龍