全球最強編碼模型Claude 4已上線亞馬遜雲科技Amazon Bedrock,如何使用?

【TechWeb】5月23日消息,Anthropic正式發佈了新一代Claude模型:Claude Opus 4和Claude Sonnet 4。憑藉“世界上最好的編碼模型”的表現,在全球掀起新一波大模型關注熱潮。

作為Anthropic的戰略合作夥伴和重要投資方,亞馬遜雲科技已第一時間在Amazon Bedrock中推出Anthropic的最新一代模型Claude Opus 4和Claude Sonnet 4。

根據亞馬遜雲科技透露的數據,Claude系列模型廣受客戶歡迎,以Anthropic的上一款模型Claude Sonnet 3.7為例,該模型在發佈後的五週內,Amazon Bedrock客戶使用率比同期的上一代Claude模型高出300%。

Anthropic強調,Claude Opus 4和Sonnet 4的推出更是將讓AI系統成為能力不斷增長的協作夥伴,包括創意與知識工作。

全球最好編碼模型Claude 4

Claude Opus 4和Claude Sonnet 4這兩款全新混合推理模型能夠根據需求在快速響應和深度思考模式間靈活切換,為編碼、高級推理和多步驟工作流領域帶來全新標準。它們不僅能在複雜的長時間推理任務中保持穩定的性能,更能驅動AI agents將耗時數小時的任務濃縮至數分鐘內完成。

Anthropic將Claude Opus 4稱之為“世界上最好的編程模型”,能在複雜、長時間運行的任務和智能體工作流中表現出穩定的性能。可獨立完成從規劃到執行的複雜編碼項目和agent工作流。該模型還能以自然語言生成長篇創意內容。金融行業客戶可利用Claude Opus 4進行agent搜索與研究,例如連接海量市場報告以獲取行業洞察;營銷類客戶則可利用該模型自主管理多渠道的營銷活動。

Claude Sonnet 4是Claude Sonnet 3.7的重大升級,以編程和推理能力為核心,同時能更精確地響應用戶提示詞。Claude Sonnet 4平衡性能與成本,特別適合高吞吐量的業務場景,是大多數生產級應用的理想之選。Claude Sonnet 4可為各類業務賦能,從實時客服agents到日常開發工作(如代碼審查與漏洞修復),並作為任務專用的子agents同時處理搜索、數據分析或內容合成等多類任務。旅遊與酒店行業客戶可使用Claude Sonnet 4近乎實時處理客戶請求並提供個性化響應。

在權威編程基準測試SWE-bench Verified上,開啟擴展思考的Claude Opus 4與Claude Sonnet 4的得分分別為79.4%和80.2%,大幅度超越了OpenAI Codex-1、OpenAI o3、OpenAI GPT-4.1、Gemini 2.5 Pro等模型。

在編程、工具使用、視覺推理、數學等領域的基準測試中,這兩款模型超越了OpenAI o3,而在多語言問答、研究生級別推理任務上,Claude Opus 4與OpenAI o3得分持平。

同時,Claude 4系列模型的自主性進一步提升,Claude 3.7最多可自主運行45分鐘,而Claude 4可以獨立運行數小時,最高達到7小時。連續7小時自助編程不是夢了。

Anthropic增長與營收負責人Kate Jensen表示:“Claude Opus 4和Claude Sonnet 4將AI從工具變為真正的協作夥伴。

Claude Opus 4和Sonnet 4不再僅僅生成內容,而是更像專業的虛擬協作夥伴——專注複雜任務、保留上下文,並在無需持續指導下提供完整的解決方案。這一能力改變了企業應對各種挑戰的方式,從開發軟件系統到製定全面的營銷策略。對於普通用戶而言,它意味著與更理解需求的AI協作,且AI能獨立承擔更大比例的項目工作。

Amazon Bedrock上如何使用Claude 4系列模型?

目前,亞馬遜雲科技Amazon Bedrock中已經上線Claude Opus 4和Claude Sonnet 4這兩款最新大模型。

亞馬遜雲科技也給出了使用這2款大模型的方法。

用戶可以使用Bedrock Converse API進行編碼,在Amazon Bedrock中選擇想要使用的模型,模型 ID 為 anthropic.claude-opus-4-20250514-v1:0(適用於 Opus 4)和 anthropic.claude-sonnet-4-20250514-v1:0(適用於 Sonnet 4)。

亞馬遜雲科技也建議使用Converse API,因為它提供了一致的 API,可與所有支援消息的 Amazon Bedrock 模型兼容。這意味著用戶只需編寫一次代碼,即可將其用於不同的模型。

例如,假設用戶編寫了一個agent,用於在代碼庫合併變更前審查代碼。用戶寫了如下代碼,利用 Bedrock Converse API 發送系統和用戶提示。然後,該agent會使用流式傳輸的結果。

Claude Opus 4 現已在北美以下 AWS 區域上線:美國東部(俄亥俄州、維珍尼亞州北部)和美國西部(俄勒岡州)。Claude Sonnet 4 不僅在北美 AWS 區域上線,還在亞太地區和歐洲地區上線:美國東部(俄亥俄州、維珍尼亞州北部)、美國西部(俄勒岡州)、亞太地區(海得拉巴、孟買、大阪、首爾、新加坡、雪梨、東京)和歐洲(西班牙)。

亞馬遜雲科技表示,Claude Opus 4和Claude Sonnet 4在Amazon Bedrock的推出,進一步豐富了客戶使用Anthropic最先進的模型進行AI創新的選擇,幫助客戶打造更出色、更具變革性的應用,同時具備企業級安全防護和負責任的AI管控體系。