DeepSeek爆火,國內同行度過了一個痛苦的春節

DeepSeek讓國內一眾大模型同行度過了一個「痛苦」的春節。年前,DeepSeek掀起AI海嘯,有某大廠大模型業者就捶胸頓足:「產品超出了我的想像,比咱家的各方面都好,真想跳槽到DeepSeek。」還有很多人反思,為什麼咱自家就沒做出DeepSeek。也有業者不服氣,認為「它的火只是一種情緒的泡沫。」

#01 焦急:DeepSeek比咱家的好太多

李輝(化名)是北京一家大模型公司的資深從業者。DeepSeek爆火時,李輝的公司還沒放假,他跟工位上的同事們展開熱烈討論。

「我開玩笑說,真想跳槽到DeepSeek。個人認為,產品能力與ChatGPT不存在差別,滿意程度80-90分,國內其它大模型分數我只給一半。」李輝說。

李輝的公司一直被認為是國內大模型行業的先行者,相關技術積累很深,過去一年與各行業開展大模型商業化應用,也取得了一些早收成果。但在李輝看來,DeepSeek有兩點讓他覺得「很厲害、有希望」

一是產品能力。就李輝的使用體驗,其它國內大模型用起來,十分挑用戶輸入的prompt(提示詞)。但DeepSeek用起來,向自然語言交互又邁進了一步。

「不管說什麼它都能理解,不用費勁解釋或重新調整提示詞,它回答起來上下文也很順暢。」

李輝就讓DeepSeek幫自己整理了一套某類型漫畫,結果從中文到日文名,全部條分縷析、進行了羅列。「我也有讓它推薦下載地址,結果問了好幾次都被DeepSeek拒絕,因為它也有版權保護意識。」

二是給行業帶來了希望。李輝雖然身繫「局中人」,但他一直覺得:各行各業高估了大模型的作用。雖然DeepSeek的產品能力令他眼前一亮,但他仍然沒有改變目前的觀點。

「讓我稍微覺得欣慰的是,deepseek用較為低廉的成本,取得了跟OpenAI差不多的效果,這意味著它的商業化發展有了更大的眉目。

這句話切中的是2024年國內大模型的發展痛點。2023年國內大模型燒的是錢、比的是技術,但到了2024年,國內各家都在抓緊探索大模型的商業化變現之路。

原因無它,只因為大模型是個燒錢機器,即便是賬戶上躺著數百億現金的大公司,也經不起GPU、電力能源、訓練成本三座吞金獸的重壓。而DeepSeek推出後,全球乃至國內各家公司爭相宣佈接入,可以說DeepSeek正在給無資本、無技術、無知識儲備的公司帶來普惠。

如此誇競對的產品,一個尷尬的問題也免不了被同事追問,「為何咱自家公司沒能做出這樣的產品?」

李輝說:「做不出倒是符合預期。不僅咱們,國際上那麼多巨頭不也被幹趴下了嗎。很認真地說,如果有機會,我還真願意跳槽去DeepSeek。」

不過可能他已經晚了。小紅書上,後悔沒有接DeepSeek offer的帖子已經多如牛毛。

#02 應激:這隻是情緒的泡沫

李輝對DeepSeek這條鯰魚是比較正向的評價,他痛苦自己「身在曹營心在漢」,業內還有另一波「痛苦聲音」—不認同、不服氣。

另一家總部位於北京的某大模型公司從業者王銳(化名),對DeepSeek的爆火持相對理性的態度。他和自家人都用DeepSeek做了測試,結果遇到兩個bug,讓他對DeepSeek沒有建立起先入為主的好印象。

他的父親先是問DeepSeek立春是幾時?別的大模型都能準確答出:是22時10分。但DeepSeek回答是:下午4點。

然後他自己又問DeepSeek春節檔電影票房排名,結果DeepSeek把還沒有上映的《流浪地球3》也算了進來。

對小錯誤「斤斤計較」的背後,是王銳不認為市場主流的其他大模型產品能力就遜色於DeepSeek,「大模型幻覺」這個廣泛存在的難題依舊存在。

他認為若一定要在此時此刻論DeepSeek的功績,在於它在開創了全新的模型訓練模式,在加速AI行業迭代的同時,對AI產品做了進一步的用戶破圈,而這是2024年各家大模型都在努力去做但收效還在路上的一件事——即從重視B端客戶(企業客戶),轉向面向B端和C端並重,尤其是C端,即普通人用戶。

這個背景是,多家頭部公司都在2024年不約而同地意識到:只靠B端客戶,難以支撐起大模型的用戶規模,因而需要C端也多多用起來,而面向C端用戶推出相關AI應用級產品、探索相關的商業模式,成為各家去年重點發力目標。

2024年,夸克(阿里系)和豆包(字節系)成為國內166款主要App中唯二邁入「億級球會」的玩家,成功為行業AI to C市場拓展打了個樣。

而就在2月6日,阿里又宣佈,引進全球頂尖人工智能科學家許主洪教授(Steven Hoi)出任集團副總裁,負責AI To C業務的多模態基礎模型及Agents(智能體)相關基礎研究與應用解決方案,這些都是頭部玩家在AI to C端市場佈局的表現。更有媒體稱,「AI to C已經走到了super APP的前夜」

不過DeepSeek雖然吸引了1600萬次下載,但王銳有一個疑問是:很多人可能更多是出於一種跟風的情緒來下載使用它,而情緒從來就是一種泡沫。

《黑悟空》製作人馮驥就把DeepSeek-R1,稱為「國運級別的科技成果」。在極客圈聚集的知乎和即刻平台內,也有人因而把DeepSeek視為「AI界的華為」,但王銳認為,大家忽視了真正產品力上的對比。「而這些靠情緒而來的用戶,是否真的是產品的核心高頻用戶,也是個疑問」。

圖 | 截圖來自 馮驥微博圖 | 截圖來自 馮驥微博

另一家AI公司從業者梁倫(化名)也和王銳持有部分相同的觀點。他引用網上自來水的評價稱,「感覺DeepSeek並沒有xx產品(梁倫家的產品)回覆的準確性高,這背後是資本的力量嗎?」

但梁倫表示,DeepSeek爆火後,身邊同事也明顯有了更樂觀的情緒:「這說明中國科技公司完全有機會挑戰美國市場,也瞬間把國產AI的鬥志給提了起來,之前那麼多的冷嘲熱諷,接下來的技術競賽有得看。

#03 冷靜:DeepSeek能保持紅利多久?

普通從業者對DeepSeek議論紛紛,很多是從個人角度考慮,比如是否應該跳槽,獲得更大的職業發展性。老闆們的眼界就不一樣了。

去年12月末,「雷軍出手千萬年薪挖來95後AI天才少女羅福莉」的消息不脛而走,她被稱為是DeepSeek的首席架構師。不過該消息並沒有後續——即羅福莉官宣是否有加入。隨著DeepSeek爆火全球,羅福莉是否產生了動搖不得而知。

圖 | 羅福莉公開圖片圖 | 羅福莉公開圖片

輿論場上有一種聲音,可能受到衝擊更大的,是來自國內大模型的六大獨角獸公司,也被稱為「AI六小虎」

李輝就表示,此前AI六小虎對內講故事,但在海外知名度多並不高,除了其中一家因被列入美國商務部的出口管製實體清單而在海外有了些許認知度外。因為國外大模型進不來,所以國內AI六小虎的故事,此前還多少還有點聽眾。

「但現在就不同了,DeepSeek直接就把戰線拉到了跟OpenAI、Gemini齊平的水平。就在2月6日(昨日,編者注),Google發佈Gemini 2.0(多模態大模型),媒體都報導劍指的就是DeepSeek,這在之前是不可想像的。DeepSeek對海外巨頭形成了降維打擊,接下來AI六小虎的故事、企業融資、企業估值是否有變化,值得關注。甚至是否會終結國內的百模大戰,也不是不可能。」

此外,李輝還補充到,DeepSeek可能反而會讓業界對大模型的期待降低,DeepSeek一定程度上戳破了大模型的泡沫,讓行業回歸理性。

「之前是畫大餅,現在是開始講誰性價比更高了,因為大模型誰都能搓,但能搓出來既好用又便宜的才行。最近幾個大模型發佈的時候都在強調價格低。」

這說的確實也是事實。從2024年至今,各家大模型捲起了價格戰。各大廠主力大模型紛紛降價,比如去年5月,通義千問GPT-4級主力模型Qwen-Long,API輸入價格就直降97%。這意味著,1塊錢可以買200萬tokens,相當於5本《新華字典》的文字量。

其它諸如智譜AI等也都紛紛降價。有媒體冠上標題,「大模型定價進入了厘時代」,意思是每一千tokens價格不足1厘。

不過,一如普通從業者的意見分化,國內也有不少來自機構的聲音認為,目前市場對DeepSeek的「追捧有點過了」

有大廠不願意具名的業者就表示,「DeepSeek目前可能還威脅不到大廠,因為大廠也能做。」也有聲音點出,可能DeepSeek目前更適合中小企業,因為中小企業一般都是「哪個便宜夠用就用哪個」

李輝雖然覺得DeepSeek產品力很棒,但他仍然有兩點疑問。DeepSeek-R1的成本宣稱僅為國外大模型的三十分之一‌,事實果真如此?

第二個疑問是,既然有DeepSeek,就有可能哪天冒出來一個DeepFind,DeepSeek未必就是國內性價比大模型的終點。

就在昨日,有媒體報導,有「AI教母」之稱的李飛飛等史丹福大學和華盛頓大學的研究人員以不到50美元的雲計算費用,成功訓練出了一個名為s1的人工智能推理模型,據稱該模型在數學和編碼能力測試中的表現,與Open AI的O1和DeepSeek的R1等尖端模型不相上下。媒體採訪相關業內人士後發現,s1是基於阿里雲通義千問模型進行了監督微調,意思是後者才是「真牛」。

不管怎麼說,國內有競爭,對各方都是好事一件。對於普通企業和個體用戶來說,能夠不斷以較低的成本使用能力更強的AI,就是利好。只是對從業者而言,在中國AI軍團開始真正登上國際舞台肉搏的這個時代,痛苦和快感將是2025年的一體兩面。

本文來自微信公眾號「真故研究室」,作者:龔正,編輯:臉叔,36氪經授權發佈。