亞馬遜推出Nova大模型，雲服務+大模型戰場「三足鼎立」

12月04日 17:41 新浪網 tech-auto-hilite

當地時間 12 月 3 日，亞馬遜雲科技（AWS，Amazon Web Services）年度 re：Invent 大會正式發佈了其 Nova 系列 AI 模型，標誌著這家科技巨頭進軍前沿基礎大模型領域。

亞馬遜 CEO 安迪·賈西（Andy Jassy）親自登台宣佈了這一重大消息，以此展示其在 AI 領域的雄心壯誌。

「我們一直在持續開發自己的前沿模型，這些模型在過去的四到五個月裡取得了巨大進展。

如果我們能從中獲得價值，那麼我堅信你們也能從中受益。」賈西的這番話展示了亞馬遜對 Nova 系列模型的信心。

至此，在雲服務 + 自研 AI 大模型的戰場，微軟、Google和亞馬遜形成了「三足鼎立」之勢。

我們將看到微軟 GPT+Azure、Google Gemini+Google Cloud 和亞馬遜Nova+AWS 三者之間的正面對抗。

（來源：亞馬遜）

作為一個全新的多模態生成式 AI 模型家族，Nova 系列包含了六個模型，涵蓋了文本、圖像和影片生成等多個領域。

其中四個模型專注於文本處理，分別是 Micro、Lite、Pro 和 Premier，另外兩個則是面向創意內容生成的 Canvas 和 Reel 模型。

與同為科技巨頭的Google和 Meta 相比，亞馬遜的自研大模型顯然姍姍來遲（更不用說跟 OpenAI 和 Anthropic 相比了），但此次一口氣公佈了六個模型，展示出後發優勢，意在通過一站式解決方案來滿足不同客戶的多樣化需求。

（來源：亞馬遜）

在文本處理領域，亞馬遜為 Nova 系列製定了清晰的梯度佈局。

作為基礎款的 Micro 模型專注於純文本處理，以超低延遲為特點，能夠快速完成文本總結、翻譯等基礎任務。

Lite 模型則進一步擴展了功能，不僅能處理文本，還可以理解圖像和影片輸入，適合進行文檔分析和客戶互動等場景。

Pro 模型則在多模態處理能力的基礎上，實現了「精確度、速度和成本的最佳平衡」，亞馬遜將其定義為「全能選手」。

而 Premier 模型是 Nova 系列的旗艦版本，計劃於 2025 年初推出，將專注於處理複雜推理任務，並能夠作為「教師模型」來訓練定製化模型。

圖 | Nova Pro 與其他競品的性能對比（來源：亞馬遜）

圖 | Nova Pro 與其他競品的性能對比（來源：亞馬遜）

根據亞馬遜給出的數據，Nova 系列模型的性能與直接競品幾乎是伯仲之間，互有勝負。

其中，Nova Pro 和 Claude 3.5 之間的差距最為明顯，與 GPT、Gemini 的整體表現更加接近。

在技術規格方面，Micro 模型擁有 12.8 萬個 token 的上下文窗口，可處理約 10 萬字的內容。

而 Lite 和 Pro 型號則支持 30 萬個 token，約等於 22.5 萬字、1.5 萬行代碼或 30 分鐘的影片內容。

亞馬遜還對媒體表示，到 2025 年初，部分 Nova 模型的上下文窗口將擴展到超過 200 萬個 token，為處理更加複雜的任務提供支持。

在創意內容生成方面，Nova Canvas 和 Nova Reel 的加入讓這個產品家族更加完整。

Canvas 模型能夠通過文本提示生成並編輯專業級別的圖像，用戶可以精確控制生成圖像的配色方案和佈局。

而 Reel 模型則提供了影片生成功能，可以創建長達 6 秒的影片內容，還支持鏡頭平移、360 度旋轉和變焦等高級攝影技巧。

據亞馬遜內部測試顯示，在影片質量和一致性方面，Reel 模型的表現都優於市面上的競品。

例如，在與競爭對手 Runway 的 Gen-3 Alpha 模型進行的 A/B 測試中，Reel 生成的影片獲勝率達到了 61.4%，在影片一致性方面更是高達 71.6%。

此外，Nova 系列模型支持超過 200 種語言，並針對英語、德語、法語、中文等 15 種語言進行了優化。

圖 | Nova 系列模型的部分信息（來源：亞馬遜）

圖 | Nova 系列模型的部分信息（來源：亞馬遜）

亞馬遜在官方博客中強調，Nova 系列模型十分重視安全性和負責任的 AI 應用。它在所有 Nova 模型中都植入了內容審核和水印等安全措施，以防止有害內容的傳播。

此外，AWS 還推出了 AI 服務卡（Service Cards），以提供關於使用案例、限制和負責任的 AI 實踐等信息。

不過，幾乎所有公司都會在模型發佈時強調這一點，但它們無一例外都「翻車」了。所以，Nova 模型的實際表現究竟如何，還需要廣大網民親測後才能得出結論。

亞馬遜高級副總裁羅希特·普拉薩德（Rohit Prasad）特別指出，「Nova 系列的設計充分考慮到了應用程序開發者面臨的常見挑戰，因此在延遲、成本效益和信息基礎等方面都有顯著改進。」

此外，亞馬遜已經規劃了 Nova 系列的發展藍圖。2025 年，他們計劃推出語音到語音的模型，該產品不僅能夠理解語氣和節奏等非語言線索，還能生成自然的、類似人類的聲音。

亞馬遜還計劃於 2025 年中旬推出「任意到任意」模型，旨在能夠實現文本、語音、圖像和影片之間的無縫轉換，這被該公司 CEO 賈西稱為「前沿模型的未來發展方向」。

（來源：亞馬遜）

對於企業用戶來說，Nova 系列最具吸引力的特點之一，是其與 AWS 基礎設施的無縫集成，這也是亞馬遜自研大模型的底氣。

通過 Amazon Bedrock 平台，企業可以直接對這些模型進行微調和知識蒸餾，使其更好地適應特定的業務需求。

特別是在檢索增強生成方面，Nova 系列表現出色，能夠基於組織的特定數據來提升輸出的可靠性。

亞馬遜公開表示，有企業在廣告領域使用 Nova 工具後，實現了廣告產品數量增加 5 倍、每個產品圖片數量翻倍的顯著成效，以此證明 Nova 系列在商業應用中的價值。

隨著 Nova 系列的推出，亞馬遜正式加入了生成式 AI 的角力賽場，而這場雲服務 + AI 大模型的「三足鼎立」才剛剛拉開帷幕。

除了他們，賽場上還有 Meta、OpenAI 和 Anthropic 等不可小覷的對手。鹿死誰手，猶未可知。

參考資料：

https://aws.amazon.com/ai/generative-ai/nova/

https://docs.aws.amazon.com/nova/latest/userguide/what-is-nova.html

https://www.aboutamazon.com/news/aws/amazon-nova-artificial-intelligence-bedrock-aws

Amazon announces Nova, a new family of multimodal AI models

運營/排版：何晨龍