不敢對比阿里Qwen2.5，Mistral「最強小模型」陷爭議，歐洲的OpenAI也不Open了

10月17日 12:07 新浪網 news-china-auto-hilite

夢晨發自凹非寺

量子位 | 公眾號 QbitAI

歐洲的OpenAI，也不Open了。

Mistral AI發佈自稱「世界上最好的邊緣模型」，卻陷入質疑和爭議。

不僅因為這一次沒有磁力鏈接開放模型權重，也因為聲稱「始終優於同行」，但競品對比並不全面。

官方帳號和CEO的評論區中，有網民不留情面的指出問題：怎麼不和Qwen2.5對比呢？

Mistral AI這次最新發佈兩款模型，Ministral 3B/8B，用於端側和邊緣計算。

公告中聲稱，兩款模型在10B以下規模的知識、常識、推理、函數調用和效率方面推進了新的前沿。

展示的基準測試則使用內部框架重新評估所有模型，並聲稱在多項任務中「始終優於同行」。

但在具體評測結果中，只對比了自家初代Mistral模型、Google的Gemma和Meta的Llama系列。

缺失的Qwen2.5系列在9月19日發佈，官方評測結果中對比對象同樣包含Mistral 7B、Llama 3和Gemma 2。

儘管不是嚴格同樣條件下的對比，在很多開發者看來相對數據也有參考價值。

StabilityAI前CEO Emad Mostaque初步體驗後也表示，認為Qwen2.5感覺上更好，開源許可也更寬鬆，推薦更多人嘗試Qwen2.5。

端側小模型競爭激烈

Ministral 3B/8B兩款模型都支持128k上下文長度，Ministral 8B具有特殊的交錯滑動窗口注意力，可實現更快且節省內存的推理。

除此之外，目前沒有透露更多技術細節。

兩款模型從今天開始在官方平台提供API調用，需要聯繫官方獲得商業許可。

另外8B模型權重僅供研究使用，3B模型權重目前並未開放。

對此，Django框架創始人Simon Willison發文表示，在擁有更寬鬆開源許可且質量很高的Llama系列情況下，很難對Mistral新模型感到興奮。

值得注意的是，Qwen2.5-7B雖然是寬鬆的Apache 2.0開源許可，但3B模型與Mistral一樣選擇了研究用許可。

從中也可以看出，能在手機等設備跑的端側小模型中，目前真正實用的3B規模商業化落地正在加速，AI公司之間的競爭也越來越激烈。

歐洲的OpenAI變味了

Mistral AI發佈端側小模型的這一天，也是他們首款模型Mistral 7B的一週年附近。

官方還製作了忍者神龜梗圖，展示其品線已經在一年之內迅速完善起來。

一年前，Mistral AI以先丟出神秘磁力鏈接、開放模型權重，幾天后再發技術報告的獨特作風，成為開源社區新寵。

但如今，這家「歐洲的OpenAI」也漸漸不Open了。

在2024年初，Mistral AI宣佈與微軟合作，同期推出的Mistral Large大模型不再開放權重，並悄悄撤回了官方網站上有關開源社區義務的內容。

這一舉動被視為公司戰略的重大轉變，引起一波議論。

一些開源社區成員對此表示失望，認為這種先通過免費或低成本的產品吸引用戶，然後通過高級功能收費的方式，是一種「背叛」。

最近一次Mistral AI甩磁力鏈接開放權重的模型，是他們首款多模態大模型Pixtral。

有觀點認為這是由於他們剛進入多模態這一賽道，之後商業模式成熟了也會漸漸轉向非開源。

有網民表示，隨著大模型商業競爭加劇，未來Mistral AI走向開源的對立面是不可避免的，令人難過。

儘管如此，他們仍然贏得了許多善意，所以我還在為他們加油。

參考鏈接：

[1]https://mistral.ai/news/ministraux/

[2]https://x.com/arthurmensch/status/1846565876046201289

[3]https://simonwillison.net/2024/Oct/16/un-ministral-des-ministraux/