只招1%的天才,這家中國公司讓矽谷難安

鳳凰網科技 出品
作者|Danny 董雨晴
OpenAI的最強對手出現了,這一次來自中國。
2025年一開年就火遍全球的DeepSeek(深度求索),1月20日晚上演了一場「偷襲珍珠港」——發佈推理模型 DeepSeek-R1 正式版,同步開源模型權重,並允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。這款大模型在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。
R1版本的推出,在海外被驚呼「這才是真正的開放的人工智能」。英偉達高級研究科學家Jim Fan在評價R1模型時就這樣說道:「我們生活在這樣一個時代:一個不是美國公司的AI企業卻實現了 OpenAI成立時的使命——做真正開放的前沿研究、為所有人賦能。」
鳳凰網科技在此前的文章《英偉達的最大空頭出現了》中曾詳細介紹過深度求索(DeepSeek)和其系列大模型的核心競爭力來源,如今看來,DeepSeek的創新重要性還在上升。
隨著DeepSeek的創新實力成為全球熱議議題,外界也愈發關注,這家中國本土科技公司及其背後的掌舵人,究竟有何特別之處?

一個浙大學霸,勇闖無人區
1985年,梁文鋒出生於廣東湛江的一個五線城市。其具體的童年成長軌跡已不可考,從公開信息唯一可知的是,梁文鋒有在採訪中提到過自己的父親是一名小學老師。
2002年,17歲的梁文鋒憑藉優異成績考入浙江大學電子信息工程專業。2007年,22歲的梁文鋒又考上了浙江大學信息與通信工程專業碩士。師從項誌宇,主要做機器視覺研究。

2008年,23歲的梁文鋒在浙江大學攻讀碩士學位期間,與同學組建團隊,開始收集市場行情、金融市場相關數據以及宏觀經濟數據。這一年,他帶領團隊運用機器學習技術探索全自動量化交易,而當時正值全球金融危機的爆發。
有消息稱,大疆創始人汪滔曾邀請梁文鋒共同創業,彼時大疆正處於起步階段。如果梁文鋒加入,或許也能在大疆的發展中實現財富自由。但梁文鋒堅信人工智能將改變世界,最終決定獨立創業。
2010年6月,25歲的梁文鋒從浙江大學信息與通信工程專業碩士畢業,其畢業論文題目為《基於低成本PTZ攝像機的目標跟蹤算法研究》。
碩士畢業後的第三年,28歲的梁文鋒將人工智能與量化交易結合,和浙江大學的徐進校友創立了雅克比投資(杭州雅克比投資管理有限公司)。2015年,他們共同創立杭州幻方科技有限公司,也就是今天的浙江九章資產管理有限公司,次年又成立了寧波幻方量化投資管理合夥企業(有限合夥)。
所謂量化投資,通俗地說就是用計算機取代人,通過數量化方式,程序化發出買賣指令,投資收益較為穩定。
經過幾年時間,幻方量化就在國內迅速崛起。2016年10月,幻方量化推出第一個AI模型,第一份由深度學習生成的交易倉位上線執行。到2017年底,幾乎所有的量化策略都採用AI模型計算。2019年,幻方量化管理規模突破百億,成為國內量化私募「四巨頭」之一。
此後的幻方量化甚至一度成為中國首家突破千億的私募量化大廠,準確地說也是迄今為止業內唯一規模曾邁過千億大關的量化私募。這期間梁文鋒在量化投資領域積累了強大的技術實力和算力資源,幻方量化以強大的算力支持聞名。
2023年,全球人工智能熱潮爆發,梁文鋒也來到了他創業之路的第十個年頭。

當年5月,38歲的梁文鋒宣佈要做通用人工智能(AGI)。7月,杭州深度求索人工智能基礎技術研究有限公司(DeepSeek)成立,專注於AI大模型的研究與開發。梁文鋒也成為量化投資者投身AI創業的「第一人」。
之後便是爽文劇本式的「AI界拚多多」崛起之路,就連大廠也只能是跟隨,「在豆包和阿里雲之前,DeepSeek最先在全網降低了模型成本」,一位AI算法工程師對鳳凰網科技表示,這讓他印象非常深刻。
2024年5月,DeepSeek發佈的DeepSeek V2的開源模型率先拉起了行業內的價格戰。DeepSeek V2提供了一種史無前例的性價比:推理成本被降到每百萬token僅1塊錢,約等於Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。

同年12月26日,僅僅時隔7個月,DeepSeek就又發佈了DeepSeek V3,再次顛覆了行業對於價格的認知。DeepSeek V3的API定價為輸入每百萬tokens 0.5元(緩存命中)/2元(緩存未命中),輸出每百萬tokens 8元,與字節Doubao-pro-256k定價輸入每百萬tokens 5元,輸出每百萬tokens 9元的水平相當,在國產模型中性價比繼續提升。

如今,當行業還沉浸在DeepSeek V3的震撼中時,DeepSeek-R1正式版又來了。這一次,DeepSeek真正引發了矽谷的恐慌。
微軟CEO薩蒂亞・納迪拉維杜華在瑞士達沃斯世界經濟論壇上表示:「看到DeepSeek的新模型,真的令人印象非常深刻。他們切實有效地開發出了一款開源模型,在推理計算方面表現出色,且超級計算效率極高。」
「我們必須非常、非常認真地對待中國的這些進展,」納迪拉維杜華說。

DeepSeek的寶貴之處,仍是創新
「DeepSeek的確有過人之處,業內都覺得他們可能是用了一些o1的數據做蒸餾,但在算法層面做了更好的創新」,一位行業從業人士認為。
在剛剛成立的一年多時間里,DeepSeek一直不聲不響,據鳳凰網科技瞭解,這家公司甚至沒有設立公關團隊。以至於,當多數大模型公司都在爭聲量,搶時間的時候,DeepSeek在悶聲嘗試創新。

DeepSeek的創新也是自下而上,幾乎存在於整個公司內部。比如,時至今日,梁文鋒的日常依舊是看論文、寫代碼、參與小組討論。是少有的能堪比一線研究員能力的公司掌舵者。
由於一開始的目標就是AGI,所以DeepSeek從來不做跟隨策略,即像其他商業類公司一樣,選擇追隨全球最先進的模型,用短平快的方式做好應用,而是在模型結構層面做從0-1的創新。
在接受《暗湧》採訪時,梁文鋒也曾明確地表達,「因為我們覺得現在最重要的是參與到全球創新的浪潮里去。過去很多年,中國公司習慣了別人做技術創新,我們拿過來做應用變現,但這並非是一種理所當然。這一波浪潮里,我們的出發點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態發展」。

過去,礙於人才構成和資本實力,中國企業做的往往是有限的創新,但現如今,強如字節等企業,已經有數百億美元規模的年度利潤。據鳳凰網科技此前獲悉,字節豆包大模型團隊已在內部組建AGI長期研究團隊,代號「Seed Edge」。
這意味著,創新已不再是難題,難的是如何保持人才密度,以及擁有自信。
據多位與DeepSeek有過接觸的行業人士表述,DeepSeek的優勢之處就在於人才密度極高,且多來自於中國本土市場。
「DeepSeek從一開始團隊就是百人左右規模,但個個都很抗打」,一位AI行業獵頭對鳳凰網科技表示,「其實早期Kimi也曾想走這個路線,只是沒有特別成功。」
另一位與DeepSeek有過接觸的行業人士稱,「DeepSeek給出的薪酬待遇非常具有競爭力,這讓其一直對人才有很強的吸引力」。
此前據多家媒體報導,雷軍曾親自出手「挖deepseek的人」,支付的薪酬則在千萬元級別。這個人正是DeepSeek-V2的關鍵開發者之一羅福莉,一個95後。
據量子位整理資料發現,DeepSeek團隊最大的特點就是年輕。應屆生、在讀生,特別是來自清北的應屆生在其中非常活躍。
「只招1%的天才,去做99%中國公司做不到的事情。」面試過DeepSeek的應屆生這樣評價其招聘風格。
這也使得DeepSeek全員上下,都保持著極致的創新動力。
梁文峰在接受《暗湧》採訪時同樣表達過一個觀點:DeepSeek在招人時主要看能力,而不是看經驗。「我們的核心技術崗位,基本以應屆和畢業一兩年的人為主」。並且梁文鋒還表達,「V2模型沒有海外回來的人,都是本土的。前50名頂尖人才可能不在中國,但也許我們能自己打造這樣的人。」
和上一代功成名就的故事不同,DeepSeek代表的是一個硬核創新時代的到來。上一代的成功人士是屬於互聯網的,他們在技術層面的突破並不多,更多是拚速度、拚資本、拚規模。
一個可喜的信號是,DeepSeek不是孤例,同樣來自杭州本土市場,宇樹科技最新推出的機器人B2-W同樣驚豔全球,宇樹科技的創始人兼CEO王興興,本科就讀於浙江理工大學機械與自動控制學院機電專業,本科畢業後進入上海大學攻讀機械工程專業研究生。
我們也有理由相信,中國科技創新的故事已經翻入了新一頁。
參考資料
1. 揭秘DeepSeek:一個更極致的中國技術理想主義故事,暗湧Waves,作者:於麗麗
2. 全網都在扒的DeepSeek團隊,是清北應屆生撐起一片天,量子位
3. DeepSeek創始人梁文鋒,廣東人,僅靠百名中國程序員,趕超OpenAI,CEO來信