DeepSeek三個月,改變全球四大雲廠走了三年的路
這三個月,中國大模型創業公司DeepSeek、中國AI應用創業公司Manus引爆了市場情緒。
DeepSeek論文稱,「用2048張英偉達H800芯片和558萬美元訓練成本」訓練出了DeepSeek-V3。這款模型和美國明星AI創業公司OpenAI旗下主力模型GPT-4o性能接近。
Manus利用Muti-Agent (多代理) 策略,製造出了一款AI原生應用。演示資料中,Manus可以獨立思考、計劃並執行複雜任務。Muti-Agent被認為是2025年AI應用發展方向。
DeepSeek、Manus這兩家公司不乏爭議。市場對DeepSeek披露的算力規模、訓練成本有所質疑。Manus則被認為是「套殼」產品,缺乏真正的核心競爭壁壘。
無論如何,DeepSeek、Manus都是大模型浪潮三年的里程碑。它們這三個月帶來的狂潮意味著,擁有雲業務大型的科技公司(如亞馬遜、微軟、Google、阿里等)未來三年的既定路徑將被改變。
其一,過去三年大模型競爭重點是訓練,這三個月正在轉向推理。
過去三年,大模型競爭焦點是用萬卡、十萬卡訓練高性能模型。但近一年,「Scaling law」 (規模定律,模型性能由算力、模型、數據規模決定) 放緩。成倍的算力只能讓模型性能提升10%-20%。但得益於芯片、模型、算法優化,推理算力成本正以每年十倍的速度下降。
其二,過去三年AI應用處於萌芽期,但這三個月AI應用快速成長。
AI應用消耗的是推理算力,受益者仍然是雲廠商。過去三年,AI應用落地主要障礙是推理算力成本偏高。隨著推理算力下降,釘釘、飛書、WPS、美圖秀秀這些老應用近三個月在加快疊加新的AI能力,Manus這類AI Agnet (代理) 為代表的原生AI應用也迅速爆發。
AI應用爆發,算力消耗增長,變局正在來臨。那麼,全球四大雲廠商——亞馬遜、微軟、Google、阿里,是如何面對這場狂潮的?
先吃下紅利
雲是大模型的基礎設施,也是大模型最終受益者。隨浪而躍,幾大雲廠過去三個月正在爭相吃下DeepSeek帶來的早期市場紅利。
亞馬遜雲科技、阿里雲、微軟Azure、Google雲等雲廠商先後迅速接入DeepSeek。雲廠商上架DeepSeek不難。DeepSeek-V3/R1是開源的,任何人都能下載、部署、使用。客戶使用時會消耗算力、數據,帶動其他基礎雲產品 (計算、存儲、網絡、數據庫等) 銷售。

今年2月,多家國際、中國雲廠商的一線銷售透露,DeepSeek走紅後,大量客戶在詢問,DeepSeek何時能上架。DeepSeek近一個月快速帶來了算力消耗和收入增長。
DeepSeek帶來了市場紅利,但一些雲廠商面對DeepSeek情緒複雜——猶豫、被動、搖擺的心態始終存在。根源是,它們始終面臨一個問題——要如何面對第三方模型?
接入第三方大模型,會和自研模型直接競爭。一位中國雲廠商銷售坦言,大部分雲廠商,原本最希望銷售自家旗艦模型。過去,DeepSeek等第三方產品無法得到官方推薦。銷售人員通常會對客戶說,自家模型表現最好。然而,自家模型公開測評得分與DeepSeek-R1差距很大。如今面對客戶質疑,一線銷售很難回答這個問題。
「失了面子,得了裡子」,另一位中國雲廠商銷售的判斷是,接入DeepSeek,既是被動防守,也是為了爭取更多訂單。他認為,「先吃下DeepSeek帶來的市場紅利,總比自家模型丟掉市場份額要好」。
亞馬遜沒有太多糾結,它的動作迅速且堅決。它是全球率先接入DeepSeek的雲廠商。亞馬遜還在後續兩個月不斷為客戶提供使用DeepSeek的完整工具鏈。
1月30日,亞馬遜雲科技Marketplace模型市場和SageMaker開發平台接入DeepSeek。
2月24日,亞馬遜雲科技Marketplace中國區上線矽基流動 (一家部署了DeepSeek V3/R1的平台服務商) ,中國用戶可借此使用DeepSeek。
3月11日,亞馬遜在Amazon Bedrock平台上架DeepSeek-R1。這是中國市場首款上架Bedrock的大模型。 目前,亞馬遜雲科技是首個提供全託管版本並正式商用的海外雲廠商。
入選Bedrock門檻並不低。亞馬遜會評估全球範圍內的大模型,嚴格篩選並最終上架。目前Bedrock只有十家模型廠商的產品,其中包括明星AI創業公司Anthropic旗下的Claude 3.7系列、Meta旗下的Llama 3系列。
我們瞭解到,亞馬遜雲科技2024年曾試圖尋找適合上架Bedrock的中國大模型,但無疾而終。DeepSeek-R1技術領先,性能出眾。亞馬遜的客戶,如豐田、思科等對它很感興趣,這是它最終上架Bedrock的重要原因。
亞馬遜CEO安迪·賈西 (Andy Jassy) 在2024年報電話會介紹,DeepSeek訓練技術令人印象深刻。它使用了強化學習技術,這比監督微調更有意思。
「上架」Bedrock,比「接入」更近一步。客戶可以通過全託管、無服務器方式使用。這種體驗如同一方產品,可以得到官方推薦和更多客戶資源傾斜。1月30日至今,亞馬遜雲科技已有數千名客戶使用Amazon Bedrock的自定義模型導入功能部署了DeepSeek-R1。
為什麼要向第三方模型開放自己的資源?因為,在真實業務場景中,企業往往會用多模型。
每款模型都有擅長的領域,如文字、代碼、圖像。一位出海智能營銷公司技術人士直言,他們公司業務中部署了十餘款模型,包括阿里千問系列、Anthropic的Claude系列、GoogleGemini系列、DeepSeek系列等。Claude承擔英語和小語種營銷文案任務,千問負責中文營銷文案任務,Gemini被用於營銷圖片、影片生成。DeepSeek目前還在測試階段。
選定了模型的專業領域,還要面對「不可能三角」——在成本、速度、性能三者之間權衡,最終找到適合自身業務的模型。
面對這些真實需求,亞馬遜雲科技的做法是,「Choice Matters」 (選擇大於一切) 。 安迪·賈西曾對此解釋,要給開發者自主選擇的權利。使用模型時,擁有多種選擇至關重要,因為「永遠不會出現一種工具在某個領域一統天下的情況」。
創新往往來自邊緣。一位亞馬遜雲科技人士的觀點是,DeepSeek脫穎而出,說明頂尖AI模型不一定來自大家都期待的大公司,它可能來自任何人。亞馬遜不會押注單一贏家,而是提供開放平台。只要模型足夠好,就立刻上架Bedrock,為客戶提供多種選擇。
為此,Bedrock集成了包括亞馬遜、Anthropic、Meta、DeepSeek等十家大模型廠商的幾十款精選模型。Bedrock上的Bedrock Marketplace像是一個「超市」,上架了180多款專業模型或行業模型。
雲廠商簡單接入DeepSeek是不夠的。不同雲平台的DeepSeek,體驗差距很大。因為,模型要經過適配、開發,最終才能使用。工具鏈是否完善,決定了DeepSeek是否好用。
以DeepSeek-R1為例,它並非完美。上述出海智能營銷公司技術人士提到,DeepSeek-R1參數規模到了史無前例的6710億。這導致在測試中表現不穩定,還帶來了高併發等問題,這些都需要反復調試。
DeepSeek-R1創造力、想像力出眾。隨之而來的是,模型幻覺 (大模型生成不符合事實的內容) 率偏高。AI創業公司Vectara用幻覺評估模型計算稱,DeepSeek-R1幻覺率為14.3%。這是大部分頭部模型廠商兩年前的水平。
也就是說,大多數企業生產環境內,DeepSeek-R1無法開箱即用。
如何讓DeepSeek更好用?Bedrock提供了完整的工具集,如Agent、知識庫、提示詞管理、Guardrails (安全防護) 等功能。這可以讓模型性能更強、更簡單易用。
怎樣控制DeepSeek-R1的幻覺?Bedrock的Guardrails功能可以提供防護欄,阻止85%的有害內容,並借助自動推理檢查防止模型幻覺帶來的事實錯誤。
拿出更好的模型
DeepSeek給科技公司帶來了一輪紅利,同時也帶來了壓力。反思的聲音在一些企業內部誕生——為何DeepSeek沒有最先出現在算力、資金、人才看似都更豐富的大廠?
一種解釋是,大廠很難像DeepSeek集中精力做純粹的技術研究。大廠需要商業化,面對未經驗證的技術路線,不敢輕易投入資源。技術負責人也不敢拿公司資源、團隊前途去賭更激進的技術路線。
過去三年,一些科技雲廠商人士原本認為,大模型只是幾個大廠的遊戲,創業公司很難出頭。DeepSeek橫空出世後,大廠技術團隊面對它的心態很矛盾——一方面認為要學習借鑒它的技術特性;另一方面也不服輸,認為它還不夠好,自己家能夠拿出更好的模型。
面對DeepSeek的技術創新,不同大廠應對策略不同。
落後者迅速追趕,阿里在春節期間發佈了對標DeepSeek-V3的Qwen2.5-Max。領先者觀望後立刻反製,微軟和OpenAI拿出了性能更強的o3-mini和GPT-4.5。亞馬遜則考慮,如何用好現有的模型,讓它們在客戶業務場景中發揮最大潛力。
DeepSeek-R1誕生後,直接逼迫大廠要迅速拿出更好的模型。大廠並非沒有技術儲備。隨後不到一個月,阿里、Google等廠商均跟進推出了對標DeepSeek的產品。

「幾個大廠不緊不慢地賽跑。現在,賽道上突然橫插進一匹黑馬」,一位中國科技公司大模型領頭人形容,這三個月DeepSeek-R1正在倒逼他們重拾緊迫感。他的團隊對DeepSeek-R1迅速參考借鑒後,在2月末上線了自研的推理模型。他承認,這款模型是「趕鴨子上架」,整個訓練週期不到兩週,甚至沒有經過反復測試就上線了。

微軟和AI創業公司OpenAI相對從容。微軟和它投資的OpenAI依舊手握優勢。OpenAI的GPT系列仍保持3個至6個月性能領先。因此,面對DeepSeek,OpenAI動作並不多。
今年1月發佈的DeepSeek-R1,性能接近OpenAI去年9月發佈的GPT-o1。今年2月,OpenAI發佈了迭代後的GPT-o3-mini,這款模型的性能領先優勢很大。
不過,OpenAI被詬病的並不是模型性能,而是態度和價格——它的模型閉源,不提供推理思維鏈,定價也過高。奧爾特曼今年1月末曾稱,DeepSeek能以低價算力提供這樣的服務令人驚訝。他表示推遲了部分產品的發佈。然而,今年3月GPT-4.5發佈後,外界再次質疑它價格太貴且缺乏誠意。

一些技術人士認為,DeepSeek為行業帶來了貢獻,但要客觀看待——V3/R1性能並非斷崖式領先,它們仍然存在短板,它距離落地還有一段距離。
一位中國大模型創業公司人士評價,字節豆包、阿裡通義的大語言模型和DeepSeek-R1相差只有1個-3個月。DeepSeek擁有一定的成本/性能優勢,但隨時可能會被複製、追趕或超越。對客戶來說,DeepSeek是偏科生,目前只有語言模型 (只能輸入/輸出文字) ,沒有圖像、音頻、影片等多模態模型。比如,工業製造中圖像、視覺模型是剛需。
「DeepSeek-R1想進入客戶業務場景,必須擠掉已經部署的模型,但這非常難」,上述出海智能營銷公司技術人士直言,他們現在無法做這個決定。因為DeepSeek-R1吞吐效率偏低、幻覺率偏高。這會影響客戶口碑。
和很多模型廠商追求更強的模型性能、更高的評測跑分不同,亞馬遜更關注模型實際業務表現:如響應速度、吞吐效率、安全可靠。
一位科技公司算法負責人的觀點是,基準測試、評測跑分、語言表達華麗不能完全代表模型實際能力。「高分低能」是常見現象,因為模型廠商可以通過刷基準測試題庫的方式取得高分。一些模型紙面性能很強,但企業實際使用時,受製於響應速度、吞吐效率等問題,難以扛住業務洪流。越是深入業務,「好模型」的標準就變得越多維。
這是亞馬遜和它投資的AI創業公司Anthropic所擅長的。
一位亞馬遜雲科技中國區管理層2024年12月曾表示,安迪·賈西一直堅持「Practical AI」 (實用/可用的人工智能) 這個觀念。這也是亞馬遜做大模型的邏輯。亞馬遜沒有一個研究院性質的組織,而是把AI能力分散在各個業務線。目的是讓自家模型經過業務檢驗,實現「eat your own dog food」 (使用自家生產的產品) 。
Anthropic 2月末推出Claude 3.7 Sonnet系列推理模型。Claude系列不能只看評測跑分,它的工程、代碼能力一直遠超其他模型。一位測試過多款模型的一線工程師認為,DeepSeek擅長風格化表達,對大眾用戶來說,這很驚豔。但對工程師來說,代碼準確率更重要,Claude表現更穩定、可靠。
亞馬遜雲科技去年12月推出旗下自研家族模型Amazon Nova。Nova包括四個基礎版本 (Micro、Lite、Pro、Premier) ,以及圖像模型Nova Canvas、影片模型Nova Reel。Nova是亞馬遜自研模型,卻仍要和Anthropic、DeepSeek等模型同台競爭,接受客戶考驗。
目前,Nova系列主打賣點是,便宜、好用、安全,以及多模態。上述亞馬遜雲科技中國區一線銷售人員表示,Nova已有大量客戶。它和Claude系列錯位佈局,Claude定位高端,Nova價格更低。

亞馬遜發佈過一份《Amazon Nova系列模型:技術報告與模型卡片》的論文。這份論文和OpenAI、DeepSeek的技術論文強調技術優勢不同,它更強調實際業務場景的測試。
上述論文內容顯示,Nova的啟動速度、吞吐效率、響應時間表現均位居前列。Nova在軟件工程、財務分析等職業專業測試中,同樣表現出眾。為保障信息安全,亞馬遜聘請了包括德勤等多家外部機構,組成專家團隊定期進行「紅隊演習」。他們會針對300多類違禁、攻擊內容進行對抗測試,以此提升Nova的安全能力。
投入更多算力
隨著模型加速落地,AI應用爆發,加大算力投入已是大勢所趨。
這三個月,算力需求的未來走勢一度引發爭論。根據DeepSeek披露的信息,似乎不需要萬枚、十萬枚高端AI芯片,也能做出效果不錯、成本低廉的模型。
這在三個月前引發了市場擔憂。投資者一度以為,這會戳破泡沫,減少算力需求。受此影響,1月27日英偉達股價下跌約17%,市值蒸發近6000億美元,創下美國股市歷史上最大單日市值跌幅紀錄。
樂觀預期很快又佔據主流。主流判斷是,單位算力成本下降反而會激發更多需求。AI應用將因此爆發,進而加大算力消耗量。
2月後,中美四家大型科技公司 (亞馬遜、微軟、Google、阿里) 均公佈了2025年資本支出計劃——它們並未減少算力投資,反而在加碼算力投入。
科技公司算力投資,會在資本支出中體現。科技公司每年至少60%以上的資本支出被用於投資算力,如採購芯片、服務器、存儲和網絡設備、租賃土地、建設數據中心。
2024年,四家科技公司資本支出均達到歷史頂點 (詳見 《DeepSeek將拉低算力總需求?美國科技四巨頭今年算力投資不減》 ) 。2025年,四家科技公司資本支出仍將高速增長。

目前,資本支出計劃規模最大的是亞馬遜。安迪·賈西甚至在2024年報電話會中向投資者保證這筆支出值得,稱這是「千載難逢的商業機會。」
最新財報電話會顯示,亞馬遜計劃2025年投入1000億美元資本支出,增速接近30%,主要用於雲業務。微軟計劃2025財年 (2024年7月初-2025年6月末) 資本支出800億美元,2025年資本支出將環比增加。Google計劃在2025年投入750億美元資本支出,增速將超過40%。阿里宣佈,未來三年將投入超過3800億元 (約合535億美元,以美元和人民幣彙率1:7.1計算) ,用於雲和AI硬件基礎設施,總額超過去十年總和。

對不同公司來說,巨額資本支出帶來的壓力不盡相同。資本支出率可以側面反映問題。
科技公司巨額資本支出採購芯片、服務器等算力設備後,會轉化為固定資產。這些固定資產折舊攤銷時長一般為五年,計入每年的折舊攤銷成本,影響未來五年的淨利潤。
資本支出率越低,理論上帶來的財務壓力越小。亞馬遜、微軟、Google、阿里2024年資本支出率分別是12.2%、28.9%、15.0%、7.4%。目前,亞馬遜資本支出率偏低,它的資本支出對未來幾年的利潤影響有限,算力投資是可持續的。微軟明顯偏高,這對利潤影響相對更大,它不可能長期維持高強度的算力投資。
為什麼即使面臨種種不確定因素,亞馬遜、微軟、Google、阿里仍要加大算力投入?
其一,它們「錢袋子」仍是富餘的,淨利潤、現金流能支撐短期高強度算力投資。
其二,短期砸錢買算力對利潤影響不大,還能通過延長部分服務器、網絡設備使用時長調節利潤。
其三,過去兩年的巨額投資產生了實際回報,「雲+AI」收入、利潤在增長。這進一步刺激了算力投資。
事實上,「寧可多投不可錯過」是大型科技公司高強度投資算力的重要心態。
多位中國科技公司戰略規劃人士今年2月告訴我們,加大投資才能在競爭中擁有更高勝率。科技公司不能讓淨利潤、現金流躺在賬面,必須投資未來。多買算力,有浪費的可能。但如果不投,一定會錯失未來。
上述中國科技公司算法負責人透露,他所在公司綜合考慮算力資源儲備、市場未來用量、模型成本下降等因素判斷,2027年每天推理算力的消耗量將增長100倍以上。因此,拉到十年長週期看,算力需求不會減少,只會螺旋上升。
既然未來1年-2年必須加大算力投資。那麼,要如何更經濟、高效地投資算力?亞馬遜的做法是,自研芯片,且自研芯片採購比例比其他公司更高。
目前亞馬遜全球新增算力的一半以上都是基於Arm架構Graviton系列芯片,數量已超過x86系列芯片 (主要生產企業包括英特爾、AMD) 。未來AI訓練/推理自研芯片的採購比例也將提升。
一位芯片技術人士的觀點是,自研芯片採購量足夠大,成本足夠低時,可以攤薄研發成本,進而得到更有性價比的算力。這也是亞馬遜的優勢所在。
本文來自微信公眾號「財經雜誌」,作者:吳俊宇,36氪經授權發佈。