專訪亞馬遜雲全球產品副總裁：生成式AI像馬拉松，比賽才剛開始

·亞馬遜雲計劃如何解鎖生成式AI的價值？伍德總結了三點：用Amazon Bedrock調用模型、機器學習創新及定製化芯片。

亞馬遜雲科技全球產品副總裁馬特·伍德（Matt Wood）在峰會現場作主題演講。

“生成式AI有一種特殊的能力，用得越多，性能就越好。換句話說，當越來越多的企業、初創公司甚至個人更頻繁地使用這些模型，隨著使用量的增加，其反饋和回答都會變得越來越好。”在亞馬遜雲科技中國峰會期間，亞馬遜雲科技全球產品副總裁馬特·伍德（Matt Wood）在接受澎湃科技（www.thepaper.cn）採訪時表示，“所以我們現在所見到的生成式AI是基礎，是起跑線，而不是天花板。”

亞馬遜雲科技（以下簡稱“亞馬遜雲”）和微軟被稱為全球雲計算市場的兩大龍頭。據Synergy Research Group估計，2023年第一季度，亞馬遜雲在全球雲基礎設施市場的份額達到32%，微軟占23%。而在微軟憑藉對OpenAI的早期投資在生成式AI這一局比賽中下了先手棋後，亞馬遜雲便時常被議論為因動作慢而被第二名逐漸蠶食領先地位。

在採訪中，伍德毫不諱言地直面了這個問題，“生成式AI的發展就像一場馬拉松比賽，當比賽剛剛開始時，如果只以前三四步就判斷比賽結果，顯然並不科學。這是一場長跑，我們現在還處於非常早期的階段，要拭目以待。”

亞馬遜雲的“三板斧”

隨著數據爆炸、高度可擴展計算能力的可用，以及機器學習技術的不斷進步，生成式AI登上了舞台。“GPU以及芯片方面的巨大進展，使得我們在過去6個月的時間能夠看到機器學習方面的驚人發展。”伍德說。

那麼，亞馬遜雲計劃如何解鎖生成式AI的價值？伍德總結了三點：用Amazon Bedrock調用模型、機器學習創新及定製化芯片。

4月，亞馬遜雲推出Amazon Bedrock，也就是說通過API（應用程序編程接口）即可訪問來自AI21 Labs、Anthropic、Stability AI和亞馬遜的基礎模型，並由此構建生成式AI驅動的應用程序。

“我們並不認為目前會有一個單一的模型包辦一切，每一個模型都有自己的專長，一些特別適用於圖像生成，另外一些適於推理，還有一些在寫作方面特別有優勢。我們希望把所有模型整合，提供對所有最佳模型的訪問，無論它們來自亞馬遜還是第三方，抑或開源。”伍德說。

國內的互聯網大廠字節跳動也做了類似的戰略選擇。6月底，字節跳動旗下火山引擎發佈大模型服務平台“火山方舟”，集成了百川智能、出門問問、複旦大學MOSS、IDEA研究院、瀾舟科技、MiniMax、智譜AI等多家AI科技公司及科研團隊的大模型，類似於為各行各業提供了一個“大模型商場”。

不過，伍德在採訪中表示，亞馬遜雲不會把Amazon Bedrock做成類似應用市場的模型市場，而是選擇最有趣、最有用的模型，同時確保其是低時延且具有廣泛可用的運維性能。

“最終在Amazon Bedrock上可能會有幾十個拳頭模型產品，它們非常新穎有趣，或是與眾不同。不過在Amazon SageMaker（為機器學習提供工具和工作流）上會有幾百個模型存在，用戶可以選擇他們想要的基礎模型，然後進行重新訓練，使其與自己的需求高度匹配。”伍德說。

第二，通過技術創新保證用戶可以安全、隱私地在模型上做優化和微調，以及基於機器學習為開發人員提供代碼生成服務Amazon CodeWhisperer。伍德說，“當你使用這些大型語言模型時，你必須非常清楚數據在使用時的去向，因為它可能會意外地泄露，並可能落入競爭對手手中。我們不會使用流經我們系統的任何數據來改進底層基礎模型。”

第三，自研定製芯片，以實現低成本、低延遲地進行基礎模型的訓練和推理。

從2013年推出首顆Amazon Nitro芯片至今，亞馬遜雲是最先涉足自研芯片的雲廠商，已擁有網絡芯片、服務器芯片、人工智能機器學習自研芯片3條產品線。

目前亞馬遜雲已經發展出三代不同的機器學習芯片。亞馬遜雲科技大中華區產品部總經理陳曉建在亞馬遜雲科技中國峰會上介紹道，“機器學習分為兩個主要的場景，一個是訓練，一個是推理。在整個生命週期之中推理所占的成本往往更高，因為推理是7×24在線不中斷服務，而訓練往往只是階段性的服務。所以我們在2019年推出了第一代用於機器學習的推理芯片Amazon Inferentia，之後2022年推出了第二代推理芯片Amazon Inferentia2。通過優化，第二代Amazon Inferentia可以大規模部署複雜模型，如大型語言模型(LLM)，訓練方面則推出了加速芯片Amazon Trainium。”

在AI芯片競賽中，亞馬遜雲似乎佔據了先機，已擁有兩款AI專用芯片——訓練芯片Amazon Trainium和推理芯片Amazon Inferentia，Google則擁有第四代張量處理單元（TPU）。相比之下，微軟等還在很大程度上依賴於英偉達、AMD和英特爾等芯片製造商的現成或定製硬件。

數據是一切的起點

伍德認為，數據對於生成式AI而言是一切的起點。

牛津大學、劍橋大學和英國帝國理工學院等機構的研究人員發現，未來模型訓練使用的高質量數據將會愈來愈昂貴，內容創作者將會竭盡全力防止其內容被免費抓取，社交媒體公司也逐漸認識到其數據的價值，對API訪問收取昂貴費用。研究認為，如果未來的模型使用容易獲取的數據（很可能是其它模型生成）訓練，那麼這將會加速模型的崩潰，增加對模型進行中毒攻擊的可能性。

對於可供AI訓練的數據未來可能稀缺的問題，伍德對澎湃科技表示，目前沒有遇到過模型訓練所需數據不足的問題。

“有海量可用數據，不僅是公開可用數據，還有各種類型的自有數據，我們都可以獲得使用許可。實際上客戶手裡掌握的數據比現在亞馬遜雲上已有的數據還要多，可能令人驚訝的是，一些大型企業，甚至是成功的初創企業，他們在亞馬遜雲上擁有的數據已經達到XB（Xerobyte是目前已知最大的數據存儲計算單位，1XB = 2^130B）級別。”伍德認為，在可預見的未來，還不會出現模型訓練所需數據不足的問題。

對於企業利用數據開始構建生成式AI，伍德提出四點建議：

第一，基於企業現有的數據戰略構建生成式AI。此前投入很多時間和精力構建的數據戰略和數據湖，會在生成式AI時代成為巨大的先發優勢。

第二，思考如何在組織內更廣泛、更安全地進行生成式AI實驗。在組織內部設置相關安全護欄，同時在構建團隊方面給予更高自由度。

“目前生成式AI在早期發展階段，沒有人知道其邊界在哪裡，沒有現成的模型和架構可以採用，所有的機會和想法、創業的點子都是日新月異，所以組織要有自由度，能夠追逐機遇，同時推出新的產品和新的功能。有一些基礎性的規則，更廣的意義上可以讓構建者放心去實驗。”伍德說。

第三，為需求場景定製化模型。

第四，選擇場景，即刻啟程。