大模型企業集體擁抱雲廠商,金山雲如何做好大模型助力者?

新一輪的人工智能技術浪潮中,越來越多的大模型企業,正與雲計算廠商深度綁定到一起,從國外的OpenAI與微軟,到國內的文心一言與百度智能雲,無不如此。

一方面,大模型預訓練需要靈活調用且充沛的算力資源,這離不開雲計算廠商的算力支持。另一方面,雲計算企業持續開疆擴土獲客創收,也需要迎合市場需要,不斷研發並強化自身的技術能力。

那麼,作為國內公有雲互聯網雲服務前三的金山雲,在新的人工智能 2.0時代,會有哪些適應市場變化的舉措呢?

近日,金山雲宣佈升級全棧雲計算體系,同時發佈包括MaaS互信推理專區方案2.0在內的多款新品。在與新浪科技溝通中,金山雲方面表示,“金山雲已初步建成人工智能時代全棧的雲計算體系”。

當新一輪的人工智能技術浪潮到來時,決定做人工智能時代雲上“助力者”的金山雲,取得了哪些新突破?

人工智能 2.0時代,大模型廠商用雲時最關心什麼?

2023年以來,隨著雲原生、AIGC、大模型等新興技術的迅速發展,全新的人工智能 2.0時代正在開啟,而云計算作為數字經濟重要的支撐基礎,正發揮越來越重要的作用。據IDC 2023年發佈的報告顯示,“未來5年,以大模型、生成式人工智能驅動的下一代人工智能有望帶動整體雲產業穿過下行階段,重回高增長時代。”

然而,生成式人工智能技術在催生新的發展機遇的同時, 也對雲廠商提出了越來越多的挑戰。

一方面,大模型預訓練所需消耗的大量算力資源,對雲廠商的存儲運算、網絡調度等產品技術能力提出了更高要求。另一方面,在高性能算力稀缺的情況下,大模型訓練所需的大量算力資源和穩定獲得,並且價格能夠被大模型廠商接受,也成了困擾大模型企業們選擇雲廠商的一大關鍵要素。

以算力供給為例,2023年,隨著國外高端芯片引進受限,一些大模型廠商在引進算力的過程中,即使與一些算力提供方簽訂了採購協議,但隨後卻又被其他廠商以更高的價格搶走了訂單。

與此同時,一些雲廠商在面向新興大模型企業提供算力資源和相關服務的同時,也正在積極地推出自家的自研大模型,這些操作或多或少地也影響著新興初創企業們對於自家模型以及數據安全的擔憂。“對於大模型企業或模型應用廠商而言,他們雖然需要雲計算資源支撐,卻也擔心自己訓練出來的模型資產、用戶數據、隱私等,過多地受製於單一雲廠商。”

在這樣的情況下,越來越多的新興大模型企業在做雲計算廠商選擇和未來產品規劃的同時,也會更加關注選擇的雲廠商能否做數據跨雲遷移?能否提供安全可信可靠的技術?

圍繞這一系列問題,如何滿足大模型或模型應用企業的算力資源供給,同時將自己的算力和基礎能力以他們願意接受的價格,穩定安全地提供給他們?成為雲計算廠商們需要重點思考的問題。

全面支持生態夥伴用雲規劃,金山雲有何硬實力?

順應大模型人工智能 2.0發展與產業需要,金山雲深入探索前沿技術,圍繞AIGC升級核心計算、存儲、網絡等產品,從多個維度全面擁抱人工智能。據金山雲方面介紹,在剛結束的2023年,“通過技術自研和升級,金山雲已初步建成人工智能時代全棧的雲計算體系。”

在滿足大模型算力需求方面,金山雲第七代雲服務器X7搭載第四代英特爾® 至強® 可擴展處理器、支持英特爾® AMX原生加速能力,CPU性能較上代最高提升60%,內存升級至DDR5,頻率較上一代性能提升50%。融合金山雲自主創新的加速技術,雲服務器X7可有效提升模型推理性能。

生成式人工智能的快速爆發,對存儲的性能提出了更高的要求。據介紹,根據數據從極熱到極冷的不同熱度,金山雲對象存儲已覆蓋標準存儲、低頻存儲、深度低頻存儲、歸檔存儲、深度冷歸檔存儲和全閃存儲等不同訪問熱度的存儲產品。其中,金山雲對象存儲KS3極速型最高可提供1Tbps/PB的兌付帶寬,相較基於機械硬盤(HDD)的對象存儲性能提升了上百倍,能為AIGC、存算分離和高性能計算等場景提供強有力的存儲解決方案。

此外,為解決雲廠商與大模型企業間的可信交互問題,金山雲還推出了互信虛擬私有網絡,對進出VPC的通信行為有著更為嚴格的控製,幫助客戶解決合規和互信問題。與此同時,金山雲還發佈了MaaS互信推理專區方案2.0(MaaS 2.0),可實現雲上LangChain的一鍵部署,預設對接多個生態合作商業大模型和開源大模型。

據介紹,MaaS 2.0同時還支持包括BGE、Bert等在內的Embedding模型,能無縫對接金山雲全託管向量數據庫Milvus,提供面向企業開發者的簡單易用、安全可信的一站式推理應用部署平台;同時也支持通過標準化的API接口和Web前端界面,實現包括模型推理和知識庫搭建的RAG大模型場景應用……

目前,金山雲已全面支持金山辦公等生態夥伴的人工智能用雲規劃,同時也正與MiniMax等獨立人工智能企業加強生態合作,為大模型企業提供雲服務。據介紹,“金山雲全棧技術體系,已形成以雲產品基礎設施為底座能力,雲產品平台服務為核心技術能力,並通過MaaS互信推理專區方案和金山雲輕舟智問為人工智能客戶提供助力。”

嚴守中立定位,做大模型的助力者

公開數據顯示,從年初到年末,國內大模型數量超過200個。與人工智能的結合,給了雲更多的想像空間,也給各行業都帶來了新的生產力。隨著技術的進一步完善和落地,雲計算將迎來更強更久的生命力。

根據Gartner統計,2022年全球雲計算市場規模為4910億美元,增速19%,預計在大模型、算力等需求刺激下,市場仍將保持穩定增長,到2026年全球雲計算市場將突破萬億美元。另據中國信通院統計,2022年我國雲計算市場規模達4550億元,較2021年增長40.91%。相比於全球19%的增速,我國雲計算市場仍處於快速發展期,預計2025年我國雲計算整體市場規模將超萬億元。

空前的市場機遇下,人工智能大模型在加速重構企業數字化的過程中,為節約經濟成本和效益最大化,未來大模型市場參與者的分工會更加明確,更多企業將在雲廠商的算力、模型和數據資源基礎上開發人工智能原生應用,推動雲上人工智能原生應用市場的繁榮。而這,也為金山雲等已在國內市場站穩腳跟的雲計算企業,創造了新的增長可能性。

基於MaaS互信推理專區方案,金山雲將持續針對模型供需方關注的互信和安全升級產品和技術。該方案的繼續升級和完善,有望為更多大模型領域的客戶提供服務。實際上,憑藉中立性的定位,金山雲已簽約及洽談商機的人工智能客戶已達數十家。

回顧2023年金山雲的發展,金山雲方面總結道:“過去的一年,我們所做的兩件事可以用‘夯實基礎’和‘勇立潮頭’兩個詞來總結。一方面,雲計算在核心產品上還在持續演進,另一方面,大模型起來後,所有人都在圍繞這個做工作。金山雲也要勇做時代弄潮兒,去給行業和客戶提供適合自己的產品和技術。”

據介紹,通過持續不斷的產品能力升級,以及雲平台上不斷完善的大模型生態能力,目前金山雲已服務超500優質客戶。相信即將到來的人工智能2.0時代,“嚴守中立定位,做大模型的助力者”差異化定位的金山雲,也將迎來屬於自己的全新時代機遇。