Google推出Gemma 2 2B模型能夠在手機、筆記本電腦、台式機等邊緣設備上運行

08月01日 13:26 新浪網 news-china-auto-hilite

Gemma 2 2B是Google推出的Gemma 2系列中一款重量級的輕量級AI模型，具有2億參數。Gemma 2 2B 利用了知識蒸餾技術，通過從更大、更複雜的模型中學習，將其知識傳遞到較小的模型中，取得了超出預期的性能表現。

GEMMA 2 2B 模型適用於多種文本生成任務，包括問答、摘要和推理。其相對較小的體積使其能夠在筆記本電腦、台式機或私人云基礎設施等資源有限的環境中部署。

主要特點

1. 卓越性能

性能表現：Gemma 2 2B在LMSYS Chatbot Arena排行榜上超過了所有GPT-3.5模型，可以處理多種文本生成任務，如問答、摘要和推理，展示了其出色的對話AI能力。它在同類模型中表現最佳，能夠在實際應用中提供高質量的對話體驗。
優化：該模型經過優化，能夠在各種硬件上高效運行。這包括各種邊緣設備、筆記本電腦和強大的雲部署，如Google的Vertex AI和Kubernetes Engine。

2.靈活且具有成本效益的部署

硬件兼容性：Gemma 2 2B可在從邊緣設備到大型數據中心的廣泛硬件上高效運行。它使用NVIDIA TensorRT-LLM庫進行優化，支持NVIDIA RTX、GeForce RTX GPU和Jetson模塊，適合各種AI應用場景。
經濟高效：其設計允許在成本效益較高的硬件上運行，甚至可以在Google Colab的T4 GPU免費層上運行，使開發和實驗更具經濟效益。

3.模型集成與兼容性

Gemma 2 2B 設計為與多種主流 AI 開發平台無縫集成，方便開發人員在不同環境中使用：

Keras 和 JAX：支持流行的深度學習框架，便於模型訓練和推理。
Hugging Face：兼容 Hugging Face 的模型和工具，簡化模型管理和部署。
NVIDIA NeMo 和 Ollama：利用這些平台的優化功能，進一步提升模型性能。
MediaPipe（即將推出）：支持實時處理任務，如影片和音頻流處理。

評估結果

GEMMA 2 2B 在多個基準測試中表現出色，尤其是在文本生成和問答任務中。以下是一些關鍵性能指標：

MMLU (5-shot, top-1): 51.3
HellaSwag (10-shot): 73.0
PIQA (0-shot): 77.8
BoolQ (0-shot): 72.5
ARC-e (0-shot): 80.1
TriviaQA (5-shot): 59.4
GSM8K (5-shot, maj@1): 23.9

模型下載：https://huggingface.co/google/gemma-2-2b