DeepSeek和李飛飛之後,英偉達也看上阿里千問?

要說全球開源大模型生態圈里,誰最讓人“魂牽夢繞”?

阿里,當仁不讓。

就在上週,繼DeepSeek和“AI教母”李飛飛之後,英偉達也相中阿里了。除了在最新的“混合推理模型”千問3宣佈開源當日,火速官宣接入適配後,5月9日,英偉達還

開源了全新的代碼推理模型Open Code Reasoning (後續簡稱:OCR),包括7B、14B、32B三種尺寸,基礎模型用的都是通義千問。

在LiveCodeBench 評測中,成功超越Open AI 公司o3-mini和o1模型的英偉達OCR-Qwen-32B-Instruct模型,正是基於Qwen2.5-32B微調形成的。

在通義千問已經迭代至3.0版本,模型性能再度突破的當下,英偉達居然還基於上一代千問模型做出了比肩全球一流水平的模型,讓人不禁想問,千問到底還有多少隱藏潛力待各方解鎖?

DeepSeek、李飛飛後,英偉達也相中了“通義千問”

目前,英偉達開源的OCR系列模型的代碼及數據集,已公開分享至全球最大AI開源社區Hugging Face平台上,供開發者們免費瀏覽學習。

其中,英偉達OCR-Qwen-32B-Instruct在LiveCodeBench的pass@1測試中獲得了61.8%的成績,超過了OpenAI的O3-Mini-2025-01-31(Low)和 O1-2024-12-17(Low )。要知道,後面這兩位可是閉源模型的代表之一。很長時間里,大家一提到開源模型和閉源模型,總覺得論能力,閉源肯定是遙遙領先於開源的。

可英偉達此次開源的OCR模型,恰巧反駁了這點。只要你的底座模型足夠好,哪怕不是最新版本的開源模型,在經過高質量訓練和優化後,也能超越閉源模型。

這就讓人不由得想起,此前被業界稱為“AI教母”的斯坦福大學人工智能研究院院長李飛飛團隊,也曾基於阿裡通義千問Qwen2.5-32B-Instruct,訓練出與OpenAI o1、DeepSeek R1等尖端推理模型數學及編碼能力相當的s1-32B模型。

今年4月,李飛飛團隊最新研究報告《2025 AI 指數報告》還顯示:中美兩國模型性能差距已經由2023年的17.5%大幅縮至0.3%,近乎持平。阿里6大模型入選報告,論模型貢獻度,僅次於OpenAI和Google,排名全球第三、中國第一。

更早之前,DeepSeek官方也曾透露,曾將DeepSeek-R1的推理能力蒸餾6個模型開源給社區,其中4個來自千問,且在多項能力上實現了對標OpenAI o1-mini的效果。

不少學者指出,千問是所有開源模型中“隱藏驚喜”最大的。滑鐵盧大學陳文虎教授直言,用同樣的方法訓練和微調別的模型都不管用,只有千問才有效果,“千問系列模型一定有一些魔力!”

衍生模型超10萬,通義千問被青睞的“三大原因”

事實上在開源大模型領域,被千問“迷之魅力”吸引來的,遠不止英偉達、DeepSeek、李飛飛團隊這些頂級公司和大佬。更多的,還是日常在頻繁使用大模型的普通開發者們。

據公開數據顯示,截至當前,千問全球下載量超3億;在HuggingFace社區2024年全球模型下載量中,占比超30%,穩居全球第一。千問衍生模型數量已突破10萬,超越美國Llama模型,是全球第一AI開源模型。在2025年2月的Huggingface全球開源大模型榜單(Open LLM Leaderboard)中,排名前十的開源模型全部都是基於千問Qwen二次開發的衍生模型。

一個來自中國的大模型,為何在全球AI社區引發狂潮?在新浪科技看來,以下三方面起到了關鍵作用。

一是性能強勁,成本更低。

每次千問的新發佈,幾乎都刷新了開源模型的上限,款款SOTA(最佳性能)。

比如最近的千問3,實現了對DeepSeek R1、OpenAI-o1等全球頂尖模型的超越。在奧數水平的AIME25測評里,千問3斬獲81.5分,刷新開源紀錄;在考察代碼能力的LiveCodeBench評測中,千問3突破70分大關,表現甚至超過Grok3;在評估模型人類偏好對齊的ArenaHard測評中,千問3以95.6分超越OpenAI-o1及DeepSeek-R1。

這樣頂尖的千問3模型,部署成本只有性能相近模型的1/3,而推理成本按照吳恩達的Artifical Analysis 最新報告看,不到DeepSeek-R1的三成,是Claude3.7的二十分之一。

性能最強,成本更低,免費商用,這樣的千問模型誰不喜歡呢?

其次,千問提供了豐沛的開源選項。

通常,決定一家模型廠商邊界有多寬的,除了模型的”高度“,還有它的“廣度”。對於全球數以萬計的開發者而言,”好用“永遠是擺在第一位的。

此前,媒體報導稱,蘋果牽手阿里千問,業界一致的共識,除了阿里大廠背書、服務有保障以外,和千問本身囊括了所有模型種類和尺寸不無關係。

阿裡通義團隊截至目前共開源200多款模型,從文本生成模型、視覺理解/生成模型、語音理解/生成模型、文生圖及視頻模型等“全模態”模型,到0.5B、1.5B、3B、7B、14B、32B、72B、110B、235B等“全尺寸”模型,幾乎是世界上開源層次最豐富、佈局最飽滿的模型家族。

合作方想要的,掏掏通義千問的口袋,它幾乎都有。

這就很好了。

Manus的聯合創始人張濤也在最近的一次直播中提到:千問3提供的119種語言支持,將給予全球開發者重要幫助。特別是在一些小語種地區,比如中東的沙特、阿聯酋,當地用戶雖然對AI能力非常渴求,但鮮有產品能照顧到他們的需求。千問3此舉,於這些地區的開發者而言,是一次極大的利好。

事實證明,自千問3開源後,海外關於國產AI模型的討論聲浪愈發壯大。甚至還有諸如匈牙利、泰國、印度、越南等諸多小語種國家的開發者,自發為千問3當起了“推廣大使”,讚賞千問模型讓他們第一次擁有了最頂級的本國語言模型。

第三,千問擁有最廣泛的“朋友圈”,圍繞千問打造了極強的開源生態。

“從來沒有一個模型的發佈能像千問3這樣,得到這麼多生態的支持。”

在千問3開源當天,技術大拿Simon Willis在圍觀了模型發佈全程後發出如此感慨。

在博客標題中,他甚至將千問3視為是模型發佈的一大“範本”。

國際開源社區對Qwen3的支持是所有模型中最豐富的,覆蓋了主流的開源機構和平台,比如主流推理架構平台SGLang、vLLM、蘋果的MXL,以及Ollama、Unsloth AI、Kaggle、openRouter等主流的模型部署工具平台、量化服務、模型服務與推理平台等等。

這意味著,千問3一開源,所有開發者和機構就可直接上手體驗,不需要等各種配套,有時這種配套需要數週甚至數月來實現。

在產業界,同樣一大批產業鏈上下遊企業宣佈適配及接入,除了英偉達,還有英特爾、高通、聯發科等多家頭部芯片廠商, 北上津杭等十餘地算力平台,以及華為昇騰、百度千帆、中科曙光等多家AI公司和大模型服務平台,都在連夜接入和適配千問3。

某種程度上說,千問就是目前大模型開源領域的事實上的“標準”,圍繞千問自然發展成型的開源生態,最終成為了千問擊敗所有對手的最重要的“護城河”。

以模型為支點,阿里未來還有什麼大招?

千問是全球開源社區的扛把子,也是阿里最重要的AI戰略支點。

今年2月,阿里巴巴集團CEO吳泳銘曾公開宣佈,未來三年將投入超過3800億元,用於建設雲和人工智能硬件基礎設施,總額超過去十年總和。有統計顯示,這是中國民營企業在雲和AI硬件基礎設施建設領域有史以來最大規模投資。

在近日舉辦的阿里日親友見面會上,阿里巴巴董事長蔡崇信也再次強調:“阿里要把AI融入每一塊業務、每一個環節,未來三到五年,所有業務都應以AI為驅動。”

如此大額度的投資計劃,放在當下,無疑是對阿里堅定AI戰略的強力證明,並且對於AI的未來,阿里準備好了。

比如,全新開源的千問3, 在Agent能力樹方麵點到了頂級:在評估模型Agent能力的BFCL評測中,千問3創下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等頂尖模型,將大幅降低Agent調用工具的門檻。同時,千問3原生支持MCP協議,並具備強大的工具調用(function calling)能力,結合封裝了工具調用模板和工具調用解析器的Qwen-Agent 框架,將大大降低編碼複雜性,實現高效的手機及電腦Agent操作等任務。

阿里雲百煉上線業界首個全生命週期MCP服務,可滿足不同場景的Agent應用開發需求。 阿里雲牽頭的中國第一AI開源社區魔搭(ModelScope),也推出了全新的MCP廣場,旨在通過開源開放的方式加速Agent及AI應用的創新和落地。同時,阿里雲還預告了AI Agent Store的願景,通過Agent Store 這種創新模式,把阿里巴巴集團和生態夥伴的Agent向外開放,讓各行各業的人都可以擁有自己專屬的助理。

肉眼可見,一個以通義系列模型為核心的佈局逐漸清晰。更不必說,阿里旗下淘寶、天貓、閑魚、夸克、高德、釘釘等業務,也正為通義系列模型的發展提供了更為直接的鍛鍊場所。

以通義系列大模型為支點,阿里正撬動起一個更為廣泛的AI落地新未來。