Mistral 發佈針對筆記本電腦和手機優化的最新 AI 模型 性能優於Llama 和 Gemma 模型

法國AI初創公司 Mistral 推出了名為 「Les Ministraux」 的新一代生成式AI模型,專為筆記本電腦和智能手機等邊緣設備設計。

模型大小分為 Ministral 3BMinistral 8B,專門針對本地、隱私優先的AI任務優化,比如設備內翻譯、智能助手、局部分析和自主機器人等應用。

Mistral 的模型聲稱在多個AI基準測試中表現優於同類型的 LlamaGemma 模型,特別是在指令執行和問題解決能力方面。

  • Ministral 3B:相對較小的模型,適合基礎的文本生成任務。
  • Ministral 8B:更強大的模型,可用於複雜的任務和應用。

兩個模型將在未來幾週通過 Mistral 的雲平台 La Platforme 提供使用。

主要亮點包括:

  • 上下文窗口:這兩個模型均具備 128,000 個 token 的上下文窗口,能夠處理長達50頁書籍的文本,顯著提高了處理複雜任務的能力。
  • 本地推理:這些模型旨在實現本地推理,增強隱私保護,適用於如設備內翻譯、離線智能助手等關鍵應用。
  • 多功能適用性可用於多種應用,如任務路由、API調用和智能工作流,支持多種輸入解析和任務處理。
  • 增強的推理能力在知識、常識推理和功能調用方面,Les Ministraux 在同類模型中表現出色,能夠有效處理複雜任務。

Les Ministraux 為關鍵應用提供了高效、低延遲的解決方案。這些應用包括:

  • 設備內翻譯
  • 無互聯網的智能助手
  • 本地數據分析
  • 自主機器人

此外,Les Ministraux 還可以與更大的語言模型(如 Mistral Large)結合使用,作為多步智能工作流中的高效中介。

性能基準

  1. 綜合評估

    • Les Ministraux 在多個任務中表現優異,經過內部框架的重新評估,確保了各模型之間的公平比較。
  2. 基準測試

    • 與其他模型(如 Gemma 2、Llama 3.1、Llama 3.2 和 Mistral 7B)相比,Les Ministraux 在知識推理、常識理解和功能調用等方面的表現均優於同類產品。

      Ministral3B和8B模型與Gemma22B、Llama3.23B、Llama3.18B和Mistral7B在多個類別上的比較

      Ministral3B和8B基本模型與Gemma22B、Llama3.23B、Llama3.18B和Mistral7B的比較

      Ministral 3B 和 8B Instruct 模型與 Gemma 2 2B、Llama 3.2 3B、Llama 3.1 8B、Gemma 2 9B 和 Mistral 7B 在不同評估類別上的比較。

      3B 系列 Instruct 模型的比較 – Gemma 2 2B、Llama 3.2 3B 和 Ministral 3B。該圖展示了 Ministral 3B 相對於更大的 Mistral 7B 的改進。

      8B系列Instruct型號的比較–Gemma29B、Llama3.18B、Mistral7B和Ministral8B。

  3. 任務處理能力

    • 模型能夠高效處理多種任務,包括輸入解析、任務路由和 API 調用,展現出強大的多任務處理能力。

定價方面:

  • Ministral 8B:每百萬 tokens 收費 $0.10(約 75 萬字)。
  • Ministral 3B:每百萬 tokens 收費 $0.04。

官方博客:https://mistral.ai/news/ministraux/