亞馬遜推出Nova大模型,雲服務+大模型戰場「三足鼎立」

當地時間 12 月 3 日,亞馬遜雲科技(AWS,Amazon Web Services)年度 re:Invent 大會正式發佈了其 Nova 系列 AI 模型,標誌著這家科技巨頭進軍前沿基礎大模型領域。

亞馬遜 CEO 安迪·賈西(Andy Jassy)親自登台宣佈了這一重大消息,以此展示其在 AI 領域的雄心壯誌。

(來源:亞馬遜)

「我們一直在持續開發自己的前沿模型,這些模型在過去的四到五個月裡取得了巨大進展。

如果我們能從中獲得價值,那麼我堅信你們也能從中受益。」賈西的這番話展示了亞馬遜對 Nova 系列模型的信心。

至此,在雲服務 + 自研 AI 大模型的戰場,微軟、Google和亞馬遜形成了「三足鼎立」之勢。

我們將看到微軟 GPT+Azure、Google Gemini+Google Cloud 和亞馬遜Nova+AWS 三者之間的正面對抗。

(來源:亞馬遜)(來源:亞馬遜)

作為一個全新的多模態生成式 AI 模型家族,Nova 系列包含了六個模型,涵蓋了文本、圖像和影片生成等多個領域。

其中四個模型專注於文本處理,分別是 Micro、Lite、Pro 和 Premier,另外兩個則是面向創意內容生成的 Canvas 和 Reel 模型。

與同為科技巨頭的Google和 Meta 相比,亞馬遜的自研大模型顯然姍姍來遲(更不用說跟 OpenAI 和 Anthropic 相比了),但此次一口氣公佈了六個模型,展示出後發優勢,意在通過一站式解決方案來滿足不同客戶的多樣化需求。

(來源:亞馬遜)(來源:亞馬遜)

在文本處理領域,亞馬遜為 Nova 系列製定了清晰的梯度佈局。

作為基礎款的 Micro 模型專注於純文本處理,以超低延遲為特點,能夠快速完成文本總結、翻譯等基礎任務。

Lite 模型則進一步擴展了功能,不僅能處理文本,還可以理解圖像和影片輸入,適合進行文檔分析和客戶互動等場景。

Pro 模型則在多模態處理能力的基礎上,實現了「精確度、速度和成本的最佳平衡」,亞馬遜將其定義為「全能選手」。

而 Premier 模型是 Nova 系列的旗艦版本,計劃於 2025 年初推出,將專注於處理複雜推理任務,並能夠作為「教師模型」來訓練定製化模型。

圖 | Nova Pro 與其他競品的性能對比(來源:亞馬遜)圖 | Nova Pro 與其他競品的性能對比(來源:亞馬遜)

根據亞馬遜給出的數據,Nova 系列模型的性能與直接競品幾乎是伯仲之間,互有勝負。

其中,Nova Pro 和 Claude 3.5 之間的差距最為明顯,與 GPT、Gemini 的整體表現更加接近。

在技術規格方面,Micro 模型擁有 12.8 萬個 token 的上下文窗口,可處理約 10 萬字的內容。

而 Lite 和 Pro 型號則支持 30 萬個 token,約等於 22.5 萬字、1.5 萬行代碼或 30 分鐘的影片內容。

亞馬遜還對媒體表示,到 2025 年初,部分 Nova 模型的上下文窗口將擴展到超過 200 萬個 token,為處理更加複雜的任務提供支持。

在創意內容生成方面,Nova Canvas 和 Nova Reel 的加入讓這個產品家族更加完整。

Canvas 模型能夠通過文本提示生成並編輯專業級別的圖像,用戶可以精確控制生成圖像的配色方案和佈局。

而 Reel 模型則提供了影片生成功能,可以創建長達 6 秒的影片內容,還支持鏡頭平移、360 度旋轉和變焦等高級攝影技巧。

據亞馬遜內部測試顯示,在影片質量和一致性方面,Reel 模型的表現都優於市面上的競品。

例如,在與競爭對手 Runway 的 Gen-3 Alpha 模型進行的 A/B 測試中,Reel 生成的影片獲勝率達到了 61.4%,在影片一致性方面更是高達 71.6%。

此外,Nova 系列模型支持超過 200 種語言,並針對英語、德語、法語、中文等 15 種語言進行了優化。

圖 | Nova 系列模型的部分信息(來源:亞馬遜)圖 | Nova 系列模型的部分信息(來源:亞馬遜)

亞馬遜在官方博客中強調,Nova 系列模型十分重視安全性和負責任的 AI 應用。它在所有 Nova 模型中都植入了內容審核和水印等安全措施,以防止有害內容的傳播。

此外,AWS 還推出了 AI 服務卡(Service Cards),以提供關於使用案例、限制和負責任的 AI 實踐等信息。

不過,幾乎所有公司都會在模型發佈時強調這一點,但它們無一例外都「翻車」了。所以,Nova 模型的實際表現究竟如何,還需要廣大網民親測後才能得出結論。

亞馬遜高級副總裁羅希特·普拉薩德(Rohit Prasad)特別指出,「Nova 系列的設計充分考慮到了應用程序開發者面臨的常見挑戰,因此在延遲、成本效益和信息基礎等方面都有顯著改進。」

此外,亞馬遜已經規劃了 Nova 系列的發展藍圖。2025 年,他們計劃推出語音到語音的模型,該產品不僅能夠理解語氣和節奏等非語言線索,還能生成自然的、類似人類的聲音。

亞馬遜還計劃於 2025 年中旬推出「任意到任意」模型,旨在能夠實現文本、語音、圖像和影片之間的無縫轉換,這被該公司 CEO 賈西稱為「前沿模型的未來發展方向」。

(來源:亞馬遜)(來源:亞馬遜)

對於企業用戶來說,Nova 系列最具吸引力的特點之一,是其與 AWS 基礎設施的無縫集成,這也是亞馬遜自研大模型的底氣。

通過 Amazon Bedrock 平台,企業可以直接對這些模型進行微調和知識蒸餾,使其更好地適應特定的業務需求。

特別是在檢索增強生成方面,Nova 系列表現出色,能夠基於組織的特定數據來提升輸出的可靠性。

亞馬遜公開表示,有企業在廣告領域使用 Nova 工具後,實現了廣告產品數量增加 5 倍、每個產品圖片數量翻倍的顯著成效,以此證明 Nova 系列在商業應用中的價值。

隨著 Nova 系列的推出,亞馬遜正式加入了生成式 AI 的角力賽場,而這場雲服務 + AI 大模型的「三足鼎立」才剛剛拉開帷幕。

除了他們,賽場上還有 Meta、OpenAI 和 Anthropic 等不可小覷的對手。鹿死誰手,猶未可知。

參考資料:

https://aws.amazon.com/ai/generative-ai/nova/

https://docs.aws.amazon.com/nova/latest/userguide/what-is-nova.html

https://www.aboutamazon.com/news/aws/amazon-nova-artificial-intelligence-bedrock-aws

Amazon announces Nova, a new family of multimodal AI models

運營/排版:何晨龍