媲美GPT4的開源模型Llama 3怎麼用?亞馬遜雲科技官方教程已上線

【TechWeb】4月19日消息,Meta發佈了其最新的開源大模型Llama 3 ,引發全網關注。Meta表示,Llama 3模型利用數據和規模將性能提升到新的高度。

此次,Meta發佈了Llama 3 80億和700億參數兩款模型,分別有預訓練和指令微調兩個版本。

Meta介紹,Llama 3在兩個定製24K GPU集群上接受了訓練,使用的數據量超過15萬億個token,這個訓練數據集是Llama 2使用的數據量的7倍,其中包括了4倍數量的代碼。這使得Llama 3成為迄今為止最強大的Llama模型,支援8000個上下文長度,是Llama 2容量的兩倍。

比肩GPT4的開源模型

在Meta公佈的AI基準測試中,Llama 3 8B、70B模型在語言(MMLU)、知識(GPQA)、編程(HumanEval)、數學(GSM-8K、MATH)等能力上,幾乎全面領先於同等規模的其他模型。

Llama 3 8B模型在MMLU、GPQA、HumanEval等多項基準上均勝過Gemma 7B和Mistral 7B Instruct。在Meta公佈的AI基準測試中,Llama 3 70B的表現甚至超越了Google的Gemini Pro1.5以及Anthropic的Claude 3 Sonnet。

Meta還披露了Llama 3 4000億參數版本模型的性能,在多語言推理任務、代碼能力,可與GPT-4、Claude 3相匹敵。

Llama 3的優良表現被譽為“媲美GPT4的開源模型”!它將改變許多研究工作和草根創業公司的計算方式。

本月剛剛加入亞馬遜董會的傳奇研究員,AI開源倡導者吳恩達在X上發文表示:Llama 3的發佈是自己收到過的最好的生日禮物!

Llama 3上手教程已搶先出爐

亞馬遜雲科技也在Llama 3發佈的第一時間火速官宣,稱其客戶已可以通過Amazon SageMaker JumpStart使用這兩款Llama 3模型,並發佈了如何通過SageMaker JumpStart發現和部署Llama 3模型的官方教程博文。

Amazon SageMaker JumpStart是亞馬遜雲科技專門構建的一個機器學習中心,提供預訓練的模型、內置算法和預構建的解決方案,幫助客戶快速開始機器學習項目。

Amazon SageMaker JumpStart能夠幫助客戶從廣泛的公開可用基礎模型中進行選擇,並將基礎模型部署到專用的SageMaker實例中,這些實例置於網絡隔離的環境,並可以使用SageMaker進行模型訓練和部署。

現在亞馬遜雲科技的用戶可以在Amazon SageMaker Studio中通過幾次點擊或通過SageMaker Python SDK編程方式發現並部署Llama 3模型,還可以利用SageMaker Pipelines、SageMaker Debugger或容器日誌等功能,提升模型性能並實施MLOps控制。

教程博文節選:

通過SageMaker Studio UI和SageMaker Python SDK中的SageMaker JumpStart訪問基礎模型。

從SageMaker JumpStart登錄頁,用戶可以通過瀏覽以模型提供商命名的不同集線器來輕鬆發現各種模型,可以在Meta hub中找到Llama 3型號。

用戶可以通過在左上角的搜索框中搜索“Meta-Llama-3”來找到Llama 3型號。

點擊Meta hub,用戶可以在SageMaker JumpStart中發現所有可用的Meta模型。

目前,SageMaker JumpStart 中可用的所有 Llama 3 模型,以及每個模型支援的預設實例類型和最大總token數如下:

單擊模型卡打開相應的模型詳細信息頁面,用戶就可以從中輕鬆部署模型。

接著,當用戶選擇部署並確認EULA條款時,部署將開始。您可以在單擊“部署”按鈕後顯示的頁面上監視部署進度。用戶也可以選擇“打開筆記本”通過示例筆記本進行部署。

隨著Meta Llama 3的加入,亞馬遜雲科技目前提供的“大模型豪華套餐”已包括:通過Amazon Bedrock提供的來自AI21 Labs, Amazon, Anthropic, Cohere, Meta, Mistral AI和Stability AI的領先大模型,以及通過Amazon SageMaker JumpStart提供的包括Meta Llama 3在內的各種模型。