中國AI,贏下第一場金融實測
一場沒有人類參與、持續了17天的金融對決,昨日終於塵埃落定。
最終的冠軍是來自中國的AI大模型Qwen,收益率達到22.32%,另一款中國模型 DeepSeek亦表現不俗,以4.89%的收益率緊隨其後。而與之同台競技的四款美國模型,則以虧損率30.81%至62.66%的成績全軍覆沒,結局呈現壓倒性對比。

這是由美國nof1.ai實驗室在AIpha Arena平台舉辦的第一屆「AI炒幣大賽」,從10月18日到11月3日,它集結了中美兩國最受關注的六款AI「全明星」同台競技,分別是中國的DeepSeek Chat V3.1(深度求索)、Qwen3 Max(阿里),與美國的GPT 5 (OpenAI)、Gemini 2.5 Pro(Google)、Claude Sonnet 4.5(Anthropic)以及Grok 4(X AI)。
AI炒幣大賽的規則簡單粗暴,主辦方給每款參賽大模型分配了10000美元的真實本金,交易標的包括比特幣(BTC)、以太坊(ETH)、Solana(SOL)、幣安幣(BNB)、狗狗幣(DOGE)和XRP等六種主流加密資產。
所有參賽大模型均使用相同的初始提示詞(Prompt)與市場數據,禁止任何人工干預。在數週的賽程里,大模型們自行分析市場數據、判斷行情走勢、決定買賣標的與時機,甚至自主運用槓桿工具。
可以說,這場AI炒幣大賽如同創建了一個純粹的「數字鬥獸場」,讓承載著不同訓練理念和算法邏輯的大模型,在此進行一場關於智力、策略與風險控制的終極試煉。
AI大模型酣戰加密市場
10月18日,AI炒幣大賽在AIpha Arena正式打響,手握1萬美元本金的六個大模型,在進入加密市場伊始,就面臨著一場劇烈波動後的強勁反彈,這輪「牛市」成為了這場比賽的重要背景板。
在比賽的試水階段(10月18日-21日),各大模型都處於「水溫探測」狀態,持倉尚淺、槓桿謹慎、交易頻率不高,但仍能看出彼此的風格差異。

DeepSeek一登場便展現出「量化基金經理」的特質,它迅速構建了一個包含BTC、ETH、SOL等在內的多幣種、低槓桿分散投資組合,據其操作日誌顯示,DeepSeek嚴格執行「回落買入,突破加倉」的紀律,像一台不受市場噪音干擾的精密儀器。

Qwen初期的操盤路徑則相對激進,它並未採取多幣種分散佈局,而是在短暫觀望市場後將籌碼集中於比特幣(BTC)這一主流標的,在開賽第二天就一度使用了較高的槓桿,它的模型決策中也頻繁出現「突破前高」「強勢趨勢」等詞彙。
大賽主辦方創始人對Qwen的觀察雖然步調不同,但來自中國的DeepSeek和Qwen,以及馬斯克的Grok4,在開局都做出了近乎一致的判斷:市場要漲,重倉做多。
而OpenAI的GPT-5和Google的Gemini,雖然是通用認知和MMLU跑分上封神的美國明星,但在真實殘酷的資本市場里,表現得卻像兩個誤入賭場的「理論家」。
這兩個大模型初期的交易記錄便顯得有些淩亂。在加密市場明顯開始回暖時,它們卻選擇「逆勢做空」。其中,GPT-5還因推理鏈條過長,在歷史數據中反復驗證,多次錯過最佳開倉點位;而Gemini則陷入「高頻交易」的陷阱,在短短幾天里進行了上百次操作,導致高昂的手續費加劇了本金虧損。

GPT-5和Gemini第一階段的戰績已令人不忍直視,前者虧損率高達53.29%,賬戶餘額僅剩$4671,而Gemini緊隨其後,虧損45.36%,餘額$5464。

試水結束後,六大AI模型步入中盤搏殺階段(10月22日-30日),加密市場的波詭雲譎在此期間體現得淋漓盡致。
受中美貿易談判的影響,加密市場迎來上漲兌現,BTC價格一路從約10.6萬美元反彈至約11.4萬美元的價格,以太坊同期也穩步推進,這再次印證了重倉做多模型們的賽前分析性。
此時,Qwen再度展現了賭徒的孤注一擲,它並不滿足於像DeepSeek一樣分散持倉的穩健收益,而是選擇在10月23日市場劇烈反彈時全倉比特幣(AII in BTC),這雖然是一個風險極高的策略,但在瘋狂上漲的行情中,Qwen的收益率被瞬間拉爆至51%,一度反超了當時收益為27%的DeepSeek,隨後持續數日的霸榜,也令Qwen風頭無兩。

事實上,這場AI炒幣大賽此時儼然成為兩家中國大模型Qwen和DeepSeek之間的博弈,巔峰對決時刻發生在10月27日。
在佔據榜首多日後,Qwen在賭徒貪婪的驅使下,做出了兩個致命的連鎖決策:一個是平倉BTC,Qwen選擇在高位平掉了盈利豐厚的BTC倉位,雖然鎖定了大量利潤,但卻放棄了繼續穩坐釣魚台的機會;另一個是激進轉戰ETH,在平倉BTC之後,Qwen緊接著將火力轉向了以太坊(ETH),甚至採取了比BTC更激進的25倍做多槓桿。

不幸的是,Qwen幾乎迎頭撞上了加密市場的高位回調。在10月27日,加密市場在高位震盪,ETH價格出現明顯回撤,但Qwen模型的指令卻未能及時止損或撤退,反而進行了數次加倉做多,這導致其倉位被套牢,單日虧損高達約4150美元。
與Qwen的狂熱形成鮮明對比,DeepSeek繼續保持著絕對的冷靜與紀律,它沒有受到對手激進操作的影響,依舊嚴格執行著風控模型,在Qwen試圖抄底失敗時,DeepSeek聰明地採取了止盈的操作,成功將自己比賽初期建立的ETH多頭倉位在相對高點平掉,僅這筆操作就為DeepSeek鎖定了7463美元的驚人盈利。
Qwen 的虧損(-$4150)和 DeepSeek 的盈利(+$7463),在短短一天內,再度扭轉了冠亞軍的排位。
在比賽的最後衝刺階段(10月31日-11月3日),加密市場並未給AI們喘息的機會,持續的大幅波動和深度回撤成為常態。
這對採用多幣種、分散投資組合的DeepSeek構成了嚴峻挑戰,比如其持倉的某些代幣(SOL、BNB)遭遇了比主流幣更劇烈的下跌,雖然期間DeepSeek恪守量化紀律、試圖通過動態調倉來控制風險,但在全市場範圍的普跌下,「不把所有雞蛋放在一個籃子」里的策略,反而導致了虧損面的擴大。

相比之下,Qwen在最後時刻上演的絕地反擊,背後是其孤注一擲聚焦比特幣的策略勝利,雖然比特幣價格在市場深度回調中同樣下跌,但由於Qwen倉位高度集中,反而規避了其他競爭幣種更為慘烈的跌幅。
在比賽的最後幾小時,Qwen以22.32%的收益率鎖定冠軍,反超了收益率回落至4.89%的DeepSeek。
K線背後的AI性格與「原生家庭」
拋開冰冷的收益率曲線,六大AI模型的每個交易決策背後,或多或少都體現了其獨特的「性格」和「靈魂」,令一眾圍觀吃瓜的網民感歎「原生家庭的重要性」。

比如幾乎沒有虧過本的DeepSeek,猶如一個經驗老道的交易員,分散持倉、嚴格止盈、不貪戀高點、對市場噪音具有極強的免疫力,完美投射出其母公司深度求索所脫胎的中國量化對衝基金背景。
我們也就此問題「採訪」了一下DeepSeek。本尊對自己量化出身的原生家庭背景頗為自豪,不僅詳細地分析了自身所繼承的量化投資技術基因,還表示幻方的投資哲學和企業文化同樣塑造了其行為模式,比如梁文峰對好奇心和創新的鼓勵,敢於選用「一批沒有經驗但有潛能的人」,使得DeepSeek在面對瞬息萬變的加密市場時,能自主地探索與適應,而「守紀律」的量化思維又確保了DeepSeek的絕對理性。
DeepSeek的回答與DeepSeek這位量化基金經理形成鮮明對比的,是敢於用20倍槓桿梭哈比特幣的「激進賭徒」Qwen(通義千問),它大開大合的兇猛投資風格,令人想到阿里巴巴追求極致效率和快速規模化的互聯網大廠文化。
然而當我們對Qwen3 Max靈魂提問,「你如何看待自己在大賽中因全倉比特幣一度領先,後來又因ETH交易出現較大回撤,最終惜敗DeepSeek」後,這位大模型的回覆同樣透露出在電商江湖殺伐果斷的阿里骨子的不服輸。
Qwen的回答不僅如此,Qwen在比賽落幕後,還以冠軍的姿態向我們表示出對DeepSeek的敬意:
Qwen的回答不管DeepSeek和Qwen如何內卷,國內的網民們認為兩個大模型共同的原生家庭都是「大A」,「大A出去的選手,到哪都是低端局」。

再看大洋彼岸的GPT-5和Gemini,它們在此次AI炒幣大賽中的慘敗,呈現出了一種「高學曆書呆子」的形象:過於依賴宏觀理論和複雜模型,試圖在交易中尋找確定性,面臨複雜多變的真實市場信息時,卻表現得猶豫、遲緩、缺乏韌性。
我們同樣試圖與GPT和Gemini對話,兩個大模型對比賽中損失慘重的原因,給出了非常相似的解釋。
首先,GPT和Gemini都認為自身在比賽中的失利,很大原因在於AI大語言模型固有的局限性,即訓練語料更多來自語言世界,但加密市場幣價的波動並不是語言的延伸。
Gemini2.5 Pro的回答此外,Gemini還提到比賽中的AI模型很可能是以「無狀態」或「短時記憶」的方式運行的,即AIpha Arena雖然不斷地將市場實時信息以提示詞(Prompt)的方式提供給大模型們,但模型本身無法基於連貫的、長期的策略進行調整,也無法從前期比賽交易的失敗中吸取經驗。
Gemini2.5 Pro的回答對此,GPT則表示比賽中主辦方並沒有給予大模型們完整鏈上API的訪問權,並禁止大模型訪問外部新聞和社交媒體的權限,因此模型們只能給予給定的提示詞做數據分析,但當市場因為一個突發新聞發生抖動時,模型對其解讀和分析容易產生技術偏差。
除了以上原因,GPT和Gemini也都認識到自身的「模式識別」與「市場博弈」之間存在著鴻溝。在GPT看來,「比賽里,我就像一個懂得金融理論的學者,被扔進賭場——懂規則,但不懂賭桌的氣味」;而Gemini則表示自己能識別出一個完美的教科書式的交易信號,但這個信號在真實的、高頻的、高槓桿的加密市場中有效性卻極低。
ChatGPT的回答雖然GPT和Gemini這對難兄難弟在整個AI炒幣大賽的第二天就雙雙翻車,用17天劃出一道優美的下滑線,但很多在股海沉浮多年的韭菜們的確在GPT和Gemini身上看到了自己的影子,從而發出「這才是最像人類的AI」的感歎。

中國AI大鬧矽谷、華爾街
Qwen和DeepSeek在AI炒幣大賽中的驚豔表現,帶來遠超一場比賽勝負的震動。兩個大模型的壓倒性勝利,讓全球科技界再次以一種新的、仰視的目光,看到中國人工智能的快速發展。
而這場勝利也並非偶然。幾乎在AIpha Arena賽事進行的同時,另一場由投資公司RockFlow推出的「AI炒美股大賽」,同樣驗證了中國AI的魔力。在這場以10萬美元為本金的實戰中,DeepSeek再度憑藉其標誌性的冷靜與紀律性位居榜首。
如果說以DeepSeek為代表的中國模型大鬧華爾街式,是中國AI崛起的直接信號,那麼發生在矽谷乃至更多國家地區的行業範式轉移,則深刻地體現出中國大模型在AI時代的新圖景。
首先是一眾矽谷明星公司的「用腳投票」。就在AI炒幣大賽如火如荼進行時,愛彼迎(Airbnb)的首席執行官白賴仁·切斯基公開表示他的公司很大程度上依賴阿里巴巴的Qwen,原因是Qwen更好更便宜,與此同時這位矽谷大佬還直白地「抽水」了好朋友薩姆·奧爾特曼(OpenAI創始人)公司的大模型,聲稱他們工作中已經很少使用ChatGPT。
一位美國本土知名AI研究學者轉發切斯基發言時反問道無獨有偶,矽谷著名投資人查馬斯·帕里哈皮蒂亞甚至當著白宮AI主管的面直言,他的公司已將大量工作需求轉向了中國開源模型,理由同樣是中國模型性能更強。除了投資人身份之外,查馬斯·帕里哈皮蒂亞還是Facebook的前高管,曾參與將這款風靡全球的社交媒體從用戶數4500萬拉動至7億。
如此戰功赫赫的矽谷獵人,在播客節目里卻毫不掩飾地說以DeepSeek、Kimi和Qwen為代表的中國開源模型正在挑戰美國閉源模型的領先地位。
中國AI在矽谷掀起的熱潮遠不止於此,就連風險投資公司安達森·荷路維茨(a16z)的合夥人都表示,高達80%的美國AI初創企業在融資路演中,不再使用OpenAI或Anthropic的模型,而是使用中國開源模型,「如果80%的美國初創公司都在使用中國模式,那麼在全球範圍內,這個比例可能接近100%」。
a16z合夥人對中國AI的看法在國外論壇reddit也引起熱議歸根結底,中國AI的強勢亮相實則也指向一個更深層次的行業變革:跑分已死,實戰為王。正如比賽的主辦方Nof1實驗室表明的理念,「讓基準測試更像真實世界」。
在過去的幾年里,衡量AI能力主要依靠MMLU和GPQA等靜態學術基準測試及榜單,然而正如這場AI炒幣大賽所揭示的,大模型能在考場上取得高分,並不意味著能在真實世界,尤其是金融市場充滿高度不確定性的環境中生存並盈利。
事實上,這也揭示了中國AI大模型脫穎而出的關鍵原因,正如紐約時報在一篇報導中所言,當人工智能開始走出實驗室、大規模落地現實世界後,AI大模型與硬件、金融、實體制造乃至各行各業的融合變得至關重要,而中國在「所有實體制造相關領域都處於領先地位」,在AI落地和應用方面佔據巨大優勢。
紐約時報近期的報導由此,紐約時報還觀察到「矽谷正陷入一種對中國效率的癡迷和羨慕」,這種情緒的深層,是美國對自身創新生態失靈的焦慮,也是中國AI不癡迷於通用人工智能,更專注於將技術落地於各個領域的務實與執行力,正如過去數十年里中國在基建和製造業等領域給世界帶來的震撼。
然而,在一片喝彩聲中,我們仍需一句冷靜的提醒。無論是AI炒幣大賽還是AI炒股大賽,這些主辦方排除了諸多實時信息的封閉「數字鬥獸場」,終究是簡化了現實的複雜性。真正的AI崛起,應該是技術與千行百業深度融合後,所催生的普惠性效率革命,而中國AI的征程,剛剛闖過第一個關卡。
本文來自微信公眾號「刺蝟公社」(ID:ciweigongshe),作者:朗寧,編輯:陳梅希,36氪經授權發佈。



















